实施网站备案管理是行业主管部门加强互联网管理的重要举措。在加强行政管理的同时,使用适当的技术手段不仅可以节省人力资源,而且能大幅提升管理效率。本文通过对网站的接入机制的分析,提出了用技术手段发现未备案网站的方法。
未备案网站的接入形态
按照“先备案后接入”的原则,互联网网站在接入前必须履行备案手续。绝大多数网站都依法依规履行了备案手续,但仍然存在少数未备案接入的网站,并且不易发现,主要有以下几种情况:
1)虚拟主机网站。通过服务器空间分配及域名与空间对应的技术,实现一个ip对应多个域名的访问,即通常的所说的虚拟主机。
2)专线私自接入网站。通过专线私自接入,网站主办者如果没有主动报备,运营商很难发现。
3)ip网站。网站没有域名,通过一个ip+端口号的形式提供访问,多为企业自建内部使用的系统。
4)跳转网站。通过跳转服务器实现网站异地接入,当用户访问一个域名时,第一次获取的ip地市为跳转服务器地址,第二次获取的ip地址才是真正的服务器地址,该类网站是问题高发户。
解决方案分析
针对上述网站接入的几种形态,可采用如下技术方案:
dns分析
通过镜像方式,实现对dns响应流量的采集,实时分析dns响应流量,效率高,准确度高,发现网站范围可覆盖全省,包括虚拟主机、专线私自接入网站。
如图1为dns分析网站发现方案,在dns上联交换机镜像dns的响应流量到一个千兆网口,并连接dns分析服务器。
dns分析服务器配置2块千兆网卡,1个连接镜像口,一个用于访问internet。dns分析服务器实时接收并分析dns的响应流量,发现监控ip范围内的网站信息。
图1 dns分析网络连接示意图
http分析
通过http分析技术,可有效发现idc内虚拟主机网站,该技术对流入80端口的流量进行分析,处理数据量很小,效率高。与dns技术相比,其优势在于不受访问用户所使用的dns限制,只要idc内网站被访问即可发现。
如图2,通过在idc核心交换机上,镜像流入idc内的http请求(80端口)并实时分析该流量,发现idc内网站。
图2 http分析网络连接示意图
爬虫遍历
相对于dns分析及http分析等被动发现网站的技术,爬虫发现网站技术属于主动发现网站的技术,该技术是通过爬虫主动遍历网站间的链接并分析这些链接达到发现网站的目的。
从效率上讲该技术不如dns分析及http分析效率高,但是该技术也是一种重要的未备案网站发现技术。作为dns分析和http分析技术手段的补充,爬虫技术可发现上述两种技术不能发现的未备案网站。
如图3,爬虫通过种子站点,作为抓取的入口,遍历网站页面的链接,通过url分析网站的域名信息。
图3 爬虫遍历网络连接示意图
ip网站扫描等技术
上述3种技术方案能有效地发现未备案的网站。对于ip+端口号作为访问入口的网站,以及以跳转服务器作为网站访问入口的跳转网站,在上述3种解决方案做适当地变化也有较好地处理效果。
结语 用技术方式实现未备案网站的发展功能,能有效地增强相关管理部门对互联网的管理能力。网络技术的发展日新月异,技术手段作为一种辅助管理手段,也要与时俱进,不断改进和完善。
!销售/回收VA2230A音频分析仪VA2230A 小兵/李
俄罗斯区块链代币平台Waves成立ICO风投基金
为什么说智能硬件正在走向悬崖?
盛群半导体推出专为双向无线电应用SOC HT98R068
中国电信做强云网融合,持续加快新型基础设施建设
未备案网站如何去发现
Fluke ii900超声波局放成像仪在高压电气设备局部放电中的应用
RS232转PROFINET(PROFINET转RS232) 微硬创新PNRS232-K20系列协议转换网关在扫码行业的应用
薄膜瑕疵在线检测设备介绍
中国移动启动A股上市 华为领衔的中国5G设备厂商全球市场份额超过50%
你知道吗?黑鲨游戏手机惊艳亮相 成为新一届的性价比之王
深度解析北京现代悦纳底盘
华帝洗碗机从用户特色入手,推动洗碗机行业的快速、持续、健康发展
荣耀Note9什么时候上市?荣耀Note9马上就来,5000mAh电池+6.6英寸巨屏 KO小米Max2
诺基亚发布三款全新安卓机型 最低售价约合人民币660元
学生党用什么蓝牙耳机,2020性价比高的无线耳机推荐!
幻方量化发布了国内首个开源MoE大模型—DeepSeekMoE
替代Windows有望 国产UOS系统30秒内开机办公体验流畅
工程师的奇思妙想!在又一波合宙新品到来之前,先评个奖
耕升G魂RTX2080极客版评测 市售最强非公RTX2080