科技

爬虫技术应用合法性引争议 亟待规制非法爬取数据行为

爬虫技术应用合法性引争议

保障数据安全亟待规制非法爬取数据行为

在大数据时代的背景下,愈来愈多的市场主体投入巨资收集、整理和挖掘信息。如果任由网络爬虫任意使用他人通过巨大投入获取的数据资源,将不利于鼓励商业投入、产业创新和诚实经营,甚至可能直接违背了数据来源用户的意愿和知情权,最终势必损害健康的竞争机制。

□ 本报记者 张 维

□ 法制网见习记者 邢国涵

随着社会经济的快速发展,数据的价值日益凸显,已然成为企业科技创新的必备要素。但企业通过技术手段获取数据时,数据抓取技术的应用行为是否合理合法,是一个值得深思的问题。

近年来,网络爬虫“爬取数据”成为热词,相关司法案例不断出现。据不完全统计,近些年涉及网络爬虫的司法案件达十余起,其中既包括民事案件,还包括刑事案件。这类案例甚至还有愈演愈烈之势。

在近日于上海举行的长三角数据合规论坛(第三期)暨数据爬虫的法律规制研讨会上,上海市人民检察院研究室副主任陈超然透露,检察机关正在积极推动企业合规改革试点工作,数据合规正是其中重点。“目前爬虫爬取数据案件非常普遍,当网络平台或者个人通过技术手段抓取别的平台数据时,这种行为是否合法,平台数据主体是谁,归谁使用,值得深入研讨。”

杭州长三角大数据研究院副院长郭兵认为,数据爬虫作为中立性的技术,已在互联网产业领域得到广泛应用。需要注意的是,如果爬虫技术不当应用,会对其他竞争者的合法权益造成损害,甚至涉嫌违法或者犯罪,也将对产业的健康发展产生非常大的负面影响。

爬取数据涉嫌侵权

从技术角度看,爬虫是通过程序去模拟人类上网或者浏览网页、App行为,让其高效地在网上抓取爬虫制造者所需要的信息。

欧莱雅中国数字化负责人刘煜晨说,大多数网站拒绝爬虫访问,其中的原因既包括商业利益考量,也包括自身网站运营安全的考量。除了爬虫可能爬到网站不愿被爬取的数据以外,网站经营者往往还会担心爬虫干扰网站正常运营。

而非正规爬虫自动持续且高频地对被爬取方进行访问,服务器负载飙升,也会给服务器带来“难以承受”之重:应对经验不足的网站,尤其是中小网站可能会面临网站打不开、网页加载极其缓慢、有时甚至直接瘫痪的情况。

新浪集团诉讼总监张喆说,无论是爬虫还是实现其他目的的技术,就其本身而言,都是中立的,但爬虫技术的应用不是中立的,技术应用都带有应用者的目的。这时候不应该评价技术原理,而是需要评价技术用来干什么,这一行为手段是否具有正当性。

提及网络爬虫,robots协议是绕不开的话题。robots协议(也称爬虫协议)的全称是“网络爬虫排除标准”,网站通过robots协议明确警示搜索引擎哪些页面可以爬取,哪些页面不能爬取。该协议也被行业称为搜索领域的“君子协定”。

刘煜晨说,当网络爬虫访问一个网站,robots协议像立在自己房间门口的一个牌子,告诉外来者谁可以过来,谁不可以过来。但是,这只是一个君子协议,只能起到告示作用,起不到技术防范作用。

实践中,恶意爬虫爬取时不遵守网站的robots协议,并可能爬取到不该爬的数据,这种情形并非孤例。小红书法务负责人曾翔说,恶意爬虫案例经常发生在内容平台和电商平台。在内容上被爬取的更多是视频、图片、文字、网红互动数据、用户行为等,在电商领域则多为商家信息和商品信息。

“内容平台一般约定了相关内容知识产权归发布者或者发布者和平台共同所有,这些爬虫没有签订协议就获得用户授权,涉嫌对知识产权人权利的侵犯。”曾翔说。

或应明确网站权利

这就涉及到数据的权属及是否能开放的问题。

上海市浦东区人民法院知识产权庭法官徐弘韬认为,数据是内容产业的核心竞争资源,内容平台经过汇总分析处理后的数据往往具有极高的经济价值。

“如果要求内容平台经营者将其核心竞争资源向竞争对手无限开放,不仅有违‘互联互通’精神的实质,也不利于优质内容的不断更迭和互联网产业的持续发展。”徐弘韬说。

恶意爬虫爬取数据案件频发的背后,是数据的价值增加,以数据为核心的市场竞争愈发激烈。

华东政法大学教授高富平说,进入大数据时代,数据价值再次凸显,现在的爬虫技术已经从原来的网页爬虫进入到底层数据的爬取。数据爬虫问题会变得越来越严重。

在大数据时代的背景下,愈来愈多的市场主体投入巨资收集、整理和挖掘信息,业内人士对此表示担忧:如果任由网络爬虫任意使用或利用他人通过巨大投入所获取的数据资源,将不利于鼓励商业投入、产业创新和诚实经营,甚至可能直接违背了数据来源用户的意愿和知情权,最终势必损害健康的竞争机制。

高富平认为,如果网站合法积累数据资源,那么这些数据资源就应该属于网站的资产。“允许数据生产者、控制者基于商业目的开放数据是有好处的,通过许可使用、交换交易等方式,可以让更多人享用数据服务。期待在未来确认数据所有合法生产者对数据的控制权、使用权。”

有序流转同等重要

目前,网站虽然可以去指定相应策略或技术手段,防止爬虫抓取数据,但爬虫也有更多技术手段来反制这种反爬策略。

刘煜晨说,反爬和爬取的技术一直在迭代,在技术领域,没有爬不了的网站和App,只有愿不愿意爬和多难爬的问题。

据了解,现实中恶意网络爬虫制造者抗辩时,往往将robots协议限制爬取与数据流转联系起来。徐弘韬认为,在“互联互通”的语境下,“有序”和“流转”同等重要、缺一不可,需排除假借“互联互通”妨碍公平竞争、危害用户数据安全的行为。

“对于非搜索引擎爬虫的正当性判别,要考虑是否足以保障用户数据的安全性。包括身份数据、行为数据等在内的用户数据,从属性来讲不仅仅是经营者的竞争资源,同样具有用户的个人隐私属性,而此类数据的集合更涉及社会公共利益。”徐弘韬说。

据了解,近年来有关数据安全的法律规范正在不断完善中。数据安全法作为数据安全的基本法,承载着解决我国数据安全核心制度框架的重要任务。此外,还有2019年通过的密码法,工信部拟出台《工业和信息领域数据安全管理办法(试行)》等,一些地方如深圳、上海等也在探索制定数据管理相关规范。

【责任编辑:欧阳雪】

从“+AI”到“AI+”:政策与市场同频共振,我国“人工智能+”驶入“智能经济”新蓝海

“智能经济”这一全新概念首次写入政府工作报告,标志着我国“人工智能+”行动正从技术赋能产业的“起步区”驶入产业深度融合、生态全面重构的“深水区”。在政策红利持续释放与市场需求井喷的“双轮驱动”下,一幅 “10万亿级”智能经济新形态的蓝图正加速展开。战略升维:从“工具”到“经济形态”3月5日,国务院总理李强在政府工作报告中明确提出“打造智能经济新形态”,并连续第三年

中企 MWC 2026:从追光者变身光源

当西班牙国王费利佩六世饶有兴致地与一台人形机器人握手,并接过一部折叠屏手机时,2026年世界移动通信大会(MWC)迎来了它最高光的时刻之一 。为期四天的MWC 2026正式落下帷幕 。这个以“智能新纪元”(The IQ Era)为主题、恰逢落户巴塞罗那20周年纪念的展会,用前所未有的热度向世界宣告:移动通信的未来已不再仅仅是连接,而是

爆发前夜:2026中国AI医疗加速“闯关” 从“黑盒”诊断到万亿市场

人工智能(AI)与医疗健康的融合正在经历一场从“概念”到“价值”的深刻蜕变。从顶尖学术期刊的连番突破,到省级政府的专项推进;从资本市场的高歌猛进,到基层诊室的悄然应用——中国AI医疗正以前所未有的速度,跨越商业化与临床信任的“三重门”。每周有超过2.3亿人在AI平台上询问健康问题,全球AI医疗健康市场规模预计在2026年达到560亿美元。在这场关乎

冲刺万亿目标!北京“人工智能第一城”蓝图:产业规模剑指5500亿,大模型数量全国居首

随着“十五五”规划的开局,北京正以昂扬之姿,向“全球人工智能第一城”的目标全速迈进。2025年全市人工智能核心产业规模已突破4500亿元,核心企业超过2500家,备案大模型数量高达212款,持续领跑全国。今年,北京更是立下军令状,力争推动产业规模突破5500亿元,并剑指两年内达到万亿级产业集群的宏伟目标。创新策源:人才高地催生“首发成果”在北京,人工智能的创新活力

全球AI基建“军备竞赛”白热化,繁荣背后隐忧浮现

一场围绕人工智能(AI)基础设施的全球“军备竞赛”正进入白热化阶段。随着生成式AI技术加速向各行各业渗透,2026年,以美国科技巨头为首的多国政府和企业纷纷祭出天量投资计划,竞相抢占AI时代的核心算力高地。然而,在这轮史无前例的基建狂潮背后,关于投资回报、能源消耗及产能瓶颈的担忧也日益浮出水面。四巨头领投,

湖南省数据局“数智探行”天心区“企基蝶变”

湖南省数据局党组成员、副局长王进率调研组奔赴长沙市天心区,聚焦企业数字化转型与基层数据“只报一次”工作展开专题调研,探寻数据要素在赋能产业发展和优化基层治理中的实践密码与显著成效。数智转型创新实践调研组首站来到湖南一力股份有限公司与爱尔眼科医院集团股份有限公司。在一力钢铁数字供应链平台与眼健康可信数字化转型协同赋能平台前,调研组驻足观察、细致询问。从数据整合的精准高效,到场

海南“人工智能+”三年行动方案:划定四大集聚区,2028年AI产业规模“大幅提升”

全岛封关运作后的海南自贸港,正将人工智能作为撬动产业升级的“新杠杆”。海南省人民政府办公厅2月24日印发《海南省推动“人工智能+”行动方案(2026—2028年)》(下称《行动方案》),明确以“双核驱动”构建特色AI产业生态,到2028年建成若干高能级创新平台,人工智能核心产业规模实现大幅跃升 。这是海南落实国家“人工智能+”行动的省级施工图。方案紧扣自贸港“三度一色”

从追赶到定义:全球复合机器人产业格局与中国领跑之路

在全球机器人产业从“专用自动化”迈向“通用智能化”的历史拐点上,复合机器人正成为具身智能落地的前沿形态,一个共识正逐渐清晰:“通用,即未来。” 这不仅是技术演进的方向,更是一场深刻的价值回归——机器人的终极使命在于解决真实世界的复杂任务,而非追求单一的形态。复合机器人,作为具身智能在物理世界最务实的载体,正成为连接当下制造需求与未来智能愿景的关键桥梁。

智领未来彰显科技领军实力 中国电信荣膺“金紫荆”双奖

1月30日,由香港大公文汇传媒集团联合香港中国企业协会、香港中国金融协会、香港中资证券业协会、香港公司治理公会主办的第十五届香港国际金融论坛暨中国证券“金紫荆奖”颁奖典礼在香港JW万豪酒店举行。中国电信股份有限公司(以下简称“中国电信”)凭借卓越的经营表现,荣获2025中国证券“金紫荆奖”“最具投资价值上市公司”与“卓越投资者关系管理上市公司”两项大奖,这不仅是对公司投资价值与经营成效的肯定,更是

星地传输破纪录:120Gbps激光通信实现天地数据“秒传”

中国科学家刚刚在新疆塔县完成了一项突破性实验——星地激光通信速率达到120吉比特每秒(Gbps),相当于在短短108秒内传输了12.656TB数据,足以装满约2500部高清电影。这项实验由中国科学院空天信息创新研究院(空天

三大科创中心扩围升级 区域协同构筑创新“新高地”

刚刚结束的各地两会上,一个共同的关键词频繁出现 - 京津冀、长三角、粤港澳三大国际科技创新中心扩围升级正成为区域发展的核心引擎。2026年伊始,各地政府工作报告密集发布,“整合区域优势资源,建设世界级创新集群”成为高频词。中央经济工作会议已明确将北京拓展至京津冀、上海拓展至长三角,实现从单一城市向城市群的战略升级。数据显示,2025年全球百强创新集群中,深圳-香

数字经济总量突破1200亿元,银川加速打造“算力之都”

从“数字试点”到“算力之都”,银川以翻番的数字经济总量交出一份亮眼成绩单,一座西部算力产业新高地正在崛起。银川市第十六届人民代表大会第六次会议近日披露,银川市数字经济总量已达1200亿元,较“十三五”末实现翻番。这座西北城市正以打造“算力之都”为目标,按下数字经济发展加速键。银川已建成9个算力中心,千兆网络实现100%覆盖,3个国家万兆光网试点项目建成投用。2026年

十五五开局密集问天 中国商业航天“箭”指星海新格局

蓝箭航天嘉兴基地的智能化生产线里,火箭零部件的出库时间从3分钟缩短至30秒,自动化立体仓储系统正将火箭总装从“人找料”推向“料等人”的精准物流时代。2026年1月13日23时25分,长征八号甲遥七运载火箭在海南商业航天发射场点火升空,将18组卫星送入预定轨道。这是“亦庄箭”2026年的首发任务,距离该火箭上次发射仅18天。新年伊始,力箭二号、天龙三号、双曲线三号等多型

6G研发迈入新阶段:我国启动第二阶段技术试验,构建空天地海一体化网络

已完成第一阶段关键技术试验,形成超过300项关键技术储备,正式启动第二阶段技术方案试验。1月21日,国务院新闻办公室举行新闻发布会,介绍2025年工业和信息化发展成效。工业和信息化部新闻发言人、信息通信发展司司长谢存宣布,我国已完成第一阶段6G关键技术试验,形成了超300项关键技术储备,近期已启动第二阶段6G技术试验。与此同时,我国5G标准必要专利

上海开源大会锚定AI未来:百万开发者生态迈向“主导型”崛起

开源不再只是代码共享,而是开放协同的新生产方式,上海正构建一个从使用生态到主导生态的开源体系。第二届开源产业生态大会1月13日在上海落幕。会上披露的数据显示,上海开源开发者数量已超过100万人,位居全国第二,而这一数字计划在2027年达到300万人。上海市经信委总工程师裘薇在大会上表示,开源已成为实现技术突破、参与全球科技创新的重要途径。本次大会不仅启动了“开源产

智能伴侣与静默革命:AI无缝织入2026生活图景

从能感知情绪的AI助手到街头无人的自动驾驶出租车,人工智能正以润物细无声的方式,重塑我们日常生活的节奏。2026年将成为人工智能深度嵌入日常生活的转折点。美国《纽约时报》最新观察指出,生成式AI已不再是实验室的奇观,而成为推动人机关系根本变革的引擎。清晨,智能眼镜在视野边缘提示今日议程;通勤时,自动驾驶出租车平稳穿梭;工作中,AI代理主动处理邮件安排会议;回家后,

北京推出“亿元补助”新政,破解创新成果转化“最后一公里”难题

实验室里的科研成果如何跨越产业化鸿沟?北京新年首个产业政策瞄准中试关键环节,最高亿元补助助力科技成果从“书架”走向“货架”。1月4日,北京市发展和改革委员会等部门联合发布《关于进一步提升本市中试服务能力促进科技创新和产业创新融合发展的若干措施》,以最高1亿元的补助力度支持中试平台建设。中试作为创新成果产业化的“最后一公里”,是实验室成果迈向市场化应用的关键过渡阶段。该政策

北京推出“科技副总”与“产业教授”机制,破解产教融合难题

校企之间的制度性壁垒正在被打破,一支扎根一线的卓越工程师队伍将获得全链条支持。1月4日,北京市委教育科技人才工作领导小组办公室正式印发《关于加强卓越工程师队伍建设的若干措施》。这份包含18条具体举措的政策文件,从产教融合载体搭建、后备人才培养到人才集聚引育、成长发展激励等方面提供“全链条”支持。措施旨在培养建设一支爱党报国、敬业奉献、具有突出技术创新

AI赋能“智造”跃升 四川构建现代化产业体系

“十四五”以来,四川深入实施制造业智能化改造数字化转型行动,全省规模以上工业企业数字化转型覆盖率在两年间提升20个百分点以上,计划在2027年底实现全覆盖。

西安“隐形冠军”集群崛起,硬科技矩阵激活区域创新动能

从AI健康检测到激光美容模块,从智慧城市平台到射频微波芯片,西安专精特新企业正以“小而美”的技术创新,撬动大市场。在西安维塑智能科技有限公司的展示厅里,一台搭载AI技术的3D身体形态评估设备正在精准捕捉人体数据。这家扎根西安经开区的国家高新技术企业,其核心产品已成功打入全球60多个国家,在超过10000家机构落地应用。而在不远处的西安欧益光电科技有限公司无尘车间,技术人员
返回
顶部