综合

合理规制、加强规范 不让网络爬虫变“害虫”

近年来,随着移动互联、人工智能、大数据、云计算等新技术的迅速发展与普及应用,人们的工作、交往和生活方式都发生了深刻变化,数据成为驱动社会发展的新型生产要素、各行各业增强竞争力的重要源泉。但在大数据收集过程中,也存在着各种违法犯罪问题。网络爬虫(Web Crawler)作为一种能快速精准地获取数据信息的基础性网络技术,近年来得到了越来越多的青睐和应用。如何对其进行规制,驱动其向好向善,成为当前重要的法治议题。

“小爬虫”的“大角色”

网络爬虫,又称为“网页蜘蛛”“网络机器人”,是一种按照一定的规则,自动抓取网络信息的程序或者脚本。它能在特定程序的驱动下,模仿人工点击从网站、手机应用、小程序或搜索引擎中检索、提取、存储数据。我们可以形象地将它们理解为一种爬行在网络上的蜘蛛,它们根据程序的指令,通常沿着URL(网址)这根蛛丝,在互联网这张大网上爬来爬去,寻找和带回所需要的数据资源。我们熟知的百度、搜狗、谷歌等搜索引擎,其技术核心元素之一就是“网络爬虫”。例如百度蜘蛛,它通过互联网入口爬取网页,实时存储并更新索引,然后为用户提供检索服务。

自从1993年第一个网络爬虫程序——“互联网漫游者”被开发出来,网络爬虫这种便捷高效的搜索技术便得到了业界关注。特别是随着数据资源的爆炸式增长,网络爬虫的应用场景也变得越发广泛与多元,长期活跃于市场调查、产品研发、金融分析、舆情监控、风险预测等领域。近年来,一些运用爬虫技术为客户提供数据服务的互联网企业,也获得了快速发展。对个人而言,我们可以利用爬虫软件等计算机编程语言,让网络爬虫为自己服务。例如想买到理想的房子,就可爬取房产中介的公开信息,分析房源数据与趋势以辅助决策。

网络的本质与价值在于连接,核心是实现数据的流动与分享。网络爬虫作为数据抓取的技术工具,通过爬行增强了网络节点间的联络,提升了网络的整体价值,是构建互联网开放与共享理念的重要技术基石。但网络爬虫所行之处,并非总是鲜花和掌声,特别是涉及隐私领地和网络安全之时。因此,为了规范爬虫,维护网络秩序,1994年诞生了“robots.txt协议”,该协议虽然只是一个“君子协议”,但它逐渐被视为网络空间爬虫技术应用公认的行业准则,也成为判定爬取行为是否获得网站许可的主要依据。在2014年百度公司诉奇虎360违反robots协议案中,法院在判决时就认为,被告没有遵守原告网站的robots协议,其行为明显不当,应当承担相应的不利后果。

科技异化:“好爬虫”和“坏爬虫”

科技本身是一种中立性工具,向善向恶、合法与非法,关键在于使用者的选择。原本通过robots协议,一方获得了数据与信息,一方增加了流量与关注,皆大欢喜。但robots协议能防“君子”却难防“小人”,有些爬虫程序不遵守规则,随心所欲地爬取别人不愿意分享的数据信息,并大量挤占服务器资源,变成了“网络害虫”。例如近年来一些大数据风控公司利用爬虫技术,在网络上非法收集用户个人信息并转卖给第三方,借以谋取经济利益。

网络爬虫设计的初衷是通过计算机技术,自动为网站编纂索引,更新信息,为用户提供高效的检索服务。具有访问、下载和解析(对数据进行分析与筛选)三种基本功能。目前,爬虫作恶主要是对前两种功能的异化,体现为三类作恶方式。

一是恶意抓取非授权数据。访问数据是“网络爬虫”的行为起点,也是其价值本源,一些企业或个人为了经济利益或其他特殊目的,想方设法让网络爬虫突破道德规则与技术障碍(网站“反爬虫”措施),爬取未经授权或超过授权范围的数据。例如2018年2月至4月间,马某通过编写“爬虫”程序,窃取手机应用及网站的用户信息约20万条,然后通过微信出售给他人,非法获利共计2.4万元,这种行为就构成了侵犯公民个人信息罪。

二是恶意侵犯知识产权。一些网络爬虫在数据爬取过程中,未经版权方的许可,就下载、复制或传播文字、图片和视频等内容,并以此获利。通常形式是,爬虫对具有版权归属的文学或影视作品等设置加框链接,吸引用户点击,然后通过售卖广告等形式牟利。例如段某建立的“窝窝电影”网站,利用爬虫技术对多家视频网站的500余部影视作品设置了加框链接,吸引用户点击播放,并赚取广告费100余万元,这种行为就触犯了著作权法。

三是恶意扰乱系统运行。网络爬虫访问系统时,跟人工点击原理一样,因此当巨量爬虫同时访问某一网站时,就会占用大量的带宽资源,造成服务器不堪重负甚至崩溃。业内专家表示,2019年有近40%的网络流量来自爬虫,其中20%来自恶意爬虫,而且比例还将不断上升。出行行业即是重灾区。以中国铁路“12306网站”为例,自2011年上线运营以来,春运期间多次出现因爬虫(主要是抢票软件)攻击而无法访问的情况。据统计,2018年春运期间,网站最高峰时1天内页面浏览量达813.4亿次,其中近90%是“爬虫”所为。

合理规制,让“爬虫”向善向上

据统计,截至2020年12月,我国网民规模达9.89亿。增强网络空间治理,保障个人信息和数据安全,已成为重大的时代命题。

目前我国对网络爬虫的规制还没有专门的法律法规,主要依靠民法典、反不正当竞争法、著作权法、网络安全法以及刑法中的相关法律条款。但从法律规制效果来看,情况不容乐观。一方面是由于互联网技术的快速发展,以及网络所具有的开放性、虚拟性和流动性等特征,让对违法犯罪行为的监管和证据提取较为困难,特别是随着数据抓取从网页拓展至手机应用程序、小程序等移动端平台,抓取手段就更加复杂与隐蔽;另一方面是网络世界和数字服务发展迅猛,法律法规还具有较大的滞后性,司法实践对网络爬虫技术滥用引发的法律问题缺乏足够的司法经验,而相关的司法解释亦未能予以足够关注,难以形成有效规制。例如2017年今日头条与新浪微博之间因“微头条”业务同步“微博”发言内容的纠纷案例,其实质是数据权属难以确定的问题。但由于缺乏明确的司法解释指引,引发了实践中的普遍争议。

2019年5月,国家互联网信息办公室公布了《数据安全管理办法(征求意见稿)》,该办法专门针对利用网络开展数据收集、存储、传输、处理、使用等活动进行了规制,有望对网络爬虫等技术行为进行有效治理。该办法强调,国家坚持保障数据安全与发展并重,鼓励研发数据安全保护技术,积极推进数据资源开发利用,保障数据依法有序自由流动。这也提醒我们,网络爬虫等本质上是顺应数字经济发展需求而生,既要从法律层面高度重视,也要把握好法律规制的边界,力求达到数据利用与合理规制之间的良性平衡,以便让网络技术更好地服务经济社会与人民生活,助推数字中国建设。

(作者:韩轶 聂晶,分别系中央民族大学法学院院长、教授,中央民族大学法学院犯罪防控研究中心研究员)

【责任编辑:欧阳雪】

绥芬河公路口岸货运量创新高 智能化通关助跑“加速度”

11月14日早晨7点多钟,黑龙江省绥芬河公路口岸,跨境货运车辆就排起了长队。在海关关员严格监管下,满载新鲜果菜、二手汽车、日用百货的车辆依次驶出国门,勾勒出向北开放通道上繁忙有序的生动图景。据绥芬河海关数据统计,今年1至10月,绥芬河公路口岸进出口货运量达123.5万吨,同比增长25%,超去年全年总量;监管进出境车辆10.3万辆次

连城塘前:香菇撑开“致富伞” 整乡推进绘就共富图景

11月10日,在福建省龙岩市连城县塘前乡罗地村尚福鑫农业合作社的香菇大棚内暖意融融,浓郁的菌香扑面而来。一排排整齐的菌棒架上,朵朵香菇饱满肥嫩、破棒而出,村民们正忙着采摘、分拣,脸上洋溢着丰收的喜悦。这小小的香菇,如今已成为塘前乡整乡推进共富的“金钥匙”。

强电工程轨行设备顺利进场 西十高铁湖北段施工再提速

11月11日,记者从中国铁路武汉局集团有限公司获悉,由武九客专公司建设管理、中国铁建电气化局承建的西安至十堰高速铁路湖北段(以下简称西十高铁湖北段)接触网工程轨道车组在天河大桥施工现场顺利进场并完成吊装,这标志着西十高铁全线站后强电工程,即将进入到接触网导线架设的关键阶段,为工程整体建设按下“快进键”。

岂容“数据美容”,“纸面发展”要不得!

有的地方不顾当地实际规划建设产业园,夸大数据,虚报产值;有的地方在项目集中开工、集中签约上盲目进行数字攀比;有的地方为了项目上马,在第三方环境检测机构数据造假……记者近期在采访中发现,通过“堆数字出业绩”搞“纸面发展”的现象,在一些地方尚未根除。统计数据本应客观反映一地发展真实情况,一旦被“美颜”“整容”,就会失真甚至贻误发展。日前召开的中央层面整治形式主义为基层减负专项工作

民革长沙市委成立70周年纪念大会举行 蒋涤非刘汇出席并讲话

11月5日上午,民革长沙市委会成立70周年纪念大会在湖南宾馆举行。湖南省人民政府副省长、民革湖南省委会主委蒋涤非,中共长沙市委常委、统战部部长刘汇出席并讲话。长沙市人民政府副市长、民革长沙市委会主委康镇麟致辞。长沙市政协副主席、民建长沙市委会主委李舜代表各民主党派长沙市委会、长沙市工商联致贺词。民革长沙市委会专职副主委杨舜尧主持纪念大会。民革湖南省委会专职副主委范泽容

中俄数字经济研究中心取得里程碑进展 金砖国家科技创新合作迈上新台阶

11月3日,中俄数字经济研究中心迎来两项重大突破,由该中心发起并主导的“中俄数字经济智能计算联合实验室”正式揭牌,同时,两个由莫斯科大学推荐的尖端技术产业化项目启动在厦门实体化筹建。这一系列进展标志着金砖国家新工业革命伙伴关系框架下的务实合作正在结出硕果。本次揭牌的“中俄数字经济智能计算联合实验室”是科技部国家重点研发计划“政府间国际科技创新合作”重点专项的重要成果。该

教育部重拳规范特殊类型招生!资格审核再升级,严打“曲线高考”

教育部近日印发《关于做好2026年普通高等学校部分特殊类型招生工作的通知》,要求高校严格特殊类型招生报名资格审核,明确“不得降低报考条件、不得放宽审核标准”底线,覆盖艺术类、高水平运动队、保送生、综合评价招生四类招生类型,剑指“曲线高考”乱象,筑牢公平公正防线。资格审核“全链条”严控通知明确,高校须与各地招生考试机构协同审核考生身份、学籍、省级统考、校考、高考报名等关键信

厦门海渔执法携手科技馆:守护水生精灵 共筑海洋家园

近期,厦门市海洋与渔业综合执法支队综合一大队(以下简称“一大队”)联合厦门科技馆等单位,在科技馆开展了一场别开生面的水生野生动物保护宣传及科普宣传活动。知识科普“零距离”一大队走进科技馆,设立宣传摊位,通过面对面知识科普、互动交流等形式,向参观人员生动普及水生野生动物保护知识

南安山美水库“数字引擎”发力:“山美生活”小程序激活九都库区发展“一池春水”

在福建泉州南安市九都镇群山环抱间,山美水库既是保障下游300多万群众供水、600多万人防汛安全的“生命库”,也是承载乡愁与生态价值的地标。2025年4月,九都镇人民政府打造的低成本、优服务、可持续的“山美生活”小程序正式上线,短短六月便成为激活库区生态、赋能文旅、联结移民的核心载体,书写出乡村数字化转型的“九都答卷”。

完美!湖北境内两座桥梁昨日接连实现跨线空中转体

昨日,两座万吨级的单体大型桥梁桥体,在湖北省内接连实现空中转体,上跨多条铁路线路的高难度“空中芭蕾”。上午,在位于武汉市新港高速公路双柳长江大桥及连接线工程的万家咀大桥,重达约1.4万吨的桥体沿逆时针方向平稳旋转54°,精准横跨下方繁忙的武黄铁路线,实现桥梁结构的精准对接。

云南省召开“十四五”农业农村专场发布会 详解六大发展成效

10月20日,云南省“高质量完成‘十四五’规划”系列新闻发布会·农业农村专场在海埂会堂举行。会上,相关部门全面介绍了“十四五”以来云南农业农村发展的工作情况,重点阐述了“农业增效益、农民增收入、农村增活力”的实践成果,并现场回应记者提问,展现出符合云南实际的乡村振兴发展路径。 “十四五”期间,云南筑牢粮食安全底线,累计建成高标准农田4128万亩,占耕地面积的5

湖南党政智慧办公平台全域覆盖 “湘办通”引领政务服务数字化革新

一场从纸间传递到指尖直达的办公效率革命,正在湖南各级党政机关悄然发生。“以前在微信群里发布会议通知,总会担心有人漏看消息,回执收集零散又费时,有时还要一个个打电话确认。现在用‘湘办通’发通知,几分钟内就能收到全员回执,效率太高了。”自贸区郴州片区、高新区办公室工作人员深有感触。这份便捷,正成为湖南全省党政机关的工作日常。平台覆盖全省湖南党政智慧办

“耿庄大蒜”获国家地理标志认证 百年贡蒜打造乡村金色名片

近日,国家知识产权局发布最新公告,对870个产品予以地理标志产品认定,承载着辽宁海城耿庄镇百年农耕记忆的耿庄大蒜赫然在列。这张浸润着历史底蕴的“蒜名片”,在斩获2010年农业部农产品地理标志登记保护后,再获国家级权威认可。

中西部高铁大动脉实现“全面互联”,武汉西安时空距离将大幅缩短

由武九客专湖北公司建设管理,中国铁路通信信号上海工程局集团有限公司承建的西十高铁湖北段接入原汉十铁路十堰东站通信信号系统改造施工正式开始,这标志着西十高铁与汉十高铁连接工程正式启动。据了解,西十与汉十高铁连接工程涵盖通信信号连接、轨道和电力供电连接等多个施工内容。

政务AI大模型有了部署指南,两部门联手防止“模型孤岛”

一项旨在规范政务AI大模型应用的国家指引正式落地,为火热政府AI应用划出边界、设定红线。中央网信办、国家发展改革委近日联合印发《政务领域人工智能大模型部署应用指引》,为各级政务部门提供人工智能大模型部署应用的工作导向和基本参照。这份指引从应用场景、规范部署、运行管理等方面对政务大模型部署作出规范,强调要统筹推进政务大模型部署应用,防止形成“模型孤岛”,并

浏阳市委书记肖正波专题调研职业教育 强调深化产教融合 服务高质量发展

长沙市委常委、浏阳市委书记肖正波专题调研职业教育产教融合工作。他强调,要坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻习近平总书记关于职业教育的重要论述及市委十三届八次全会精神,坚持正确办学方向,突出办学特色,深化产教融合,培养更多高素质专业化技术技能人才,更好服务浏阳高质量发展和现代化建设。肖正波在长沙轨道交通职业学院调研肖正波先后前往长沙轨道交通职

浙江全省推行中小学春秋假,全国首例引热议

浙江11个设区市全部出台中小学春秋假制度,成为全国首个在全省范围推行此项政策的省份。10月9日,随着绍兴市教育局发布《关于实施中小学春秋假制度的意见》,浙江省11个设区市已全部出台中小学春秋假制度相关文件。这标志着浙江在全国率先实现中小学春秋假制度全覆盖。这项广受关注的政策落地,意味着浙江中小学生和家长望眼欲穿的全省域春秋假正式到来。全省覆盖:政策脉络浙江

创新推进“三化协同” 黑龙江甘南县持续提高秸秆综合利用率

甘南县是全国产粮大县,农作物秸秆产量大、分布广、种类多,全县年秸秆可收集量在100万吨左右。多年来,甘南县委、县政府始终将秸秆综合利用与大气污染防治、农业绿色发展、乡村生态振兴紧密结合,坚持农用优先、多元利用原则,不断在全量还田和离田利用上发力

八天“文化狂欢”!安溪金谷溪岸文艺嘉年华赋美乡村、礼赞祖国

“第一次来大陆,我就把第一站选择在金谷溪岸文艺村,因为之前看到好多媒体的报道,一直很期待,这次来到现场,发现真的是不虚此行,超赞!”来自香港的陈女士一边跟家人视频分享快乐一边赞不绝口。▲金谷溪岸文艺嘉年华系列活动现场国庆黄金周的福建泉州安溪金谷溪岸文艺村,处处洋溢着喜庆氛围。为庆祝新中国成立76周年,安溪县金谷镇党委、政府精心策划的“溪岸艺术汇·国庆乐翻天”金谷溪岸文艺

提升治理效能 两部门为社会组织理事会“定职责、明规则”

社会组织理事会决策机制迎来重大变革,民主集中制与一人一票表决成为硬性要求。民政部、中央社会工作部近日联合印发《关于加强社会组织理事会建设的意见》(以下简称《意见》),对社会组织理事会的职责权限、决策机制、人员组成和运转保障等提出明确要求。《意见》强调,理事会会议必须严格落实民主集中制,确保每名理事会成员平等且充分发表意见,实行一人一票进行表决。涉及重大事项决策、重要
返回
顶部