科技

上海交大“看脸识罪犯”研究引热议 回应:断章取义

通过机器识别人脸来判断罪犯,这像是科幻电影出现的一幕。上海交通大学教授武筱林的一项“人脸识别罪犯”研究却引起了巨大的争议。

5月7日,谷歌人工智能研究员布莱斯、玛格丽特和普林斯顿大学神经科学教授亚历山大发布的《相面术的新外衣》一文,质疑武筱林研究的可信性,并称其研究结论可“具有误导性,洗白科学种族主义”。

近日,武筱林回应南都记者称,“他们对我们研究的上下文进行断章取义,有失学术探讨的公正精神,我感到非常失望。”

看脸识罪犯

研究者“原本打算证伪”

事情缘起于2016年11月,上海交大图像通信与网络工程研究所教授武筱林和其博士生张熙在国际电子预印本文献库arX iv上提前发布了一篇题为《基于面部图像的自动犯罪概率推断》的研究。

“这在科学界是很常规的做法。”武筱林回应南都记者称。

清华大学纳米生物领域博士后张旭告诉南都记者,arX iv是国际科研工作者在研究成果未正式发表前,出于和同行交流目的先行发布的一个电子预印本文献库,涉及物理、数学、计算机科学等领域,“相当于永不落幕的学术会议”。

在该研究中,武筱林和团队通过运用计算机视觉和机器学习技术,对1856名18到55岁中国男性的身份证照进行检测。这些研究对象被分为罪犯组与非罪犯组两组,罪犯组包含730名犯罪人员,涉及盗窃、贪污、谋杀、强奸、绑架和抢劫等罪行。其余1100名普通人所在的非罪犯组,职业覆盖司机、医生、律师、教授、服务员、建筑工人等领域。

“我们当时在公安部、各省公安厅协助下得到这些图像”,武筱林指出,这些研究对象来自全国不同的地方,“后来这些照片都被调整为80cm×80cm大小,照片的亮度和对比度等都进行了统一处理,随后通过卷积神经网络算法(一种高度通用的深度学习技术)进行检测。”

研究结果显示:四类分离器(逻辑回归,K N N,SV M,C N N )对罪犯与非罪犯的区分准确率至少在86%以上。与此同时,两组面部特征方面在内眼角间距、上唇曲率和鼻唇角角度这三个测度最为显著。通过计算机模拟出来的罪犯与非罪犯的“平均脸”较相似,但非罪犯之间的面部特征差异要比罪犯小。也就是说,样本中非犯罪人员的样貌更为相似,变化幅度更小,犯罪人员的面部表情差异比普通人更大。

对于该结论,武筱林称,他们当时也很惊讶,“研究结果与预期相反,我们原本想用数据分析推翻‘相由心生’这种说法,原本是打算证伪的。”

结论引热议

被指样本量太小,研究不科学

结论一出,有研究者质疑武筱林的研究不科学,“样本量太小了”。部分人士表示担忧,这会加重人们对样貌有缺陷人群的歧视。

武筱林告诉南都记者,这半年来他收到了非常多的反馈邮件,“有的来信索取数据,有的想要与我们合作,还有质疑实验结论的。”有同行还要求他从arX iv上撤稿。

这些声音中,就包括谷歌研究员布莱斯等人最新发表的文章——— 《相面术的新外衣》。该文开头指出,武筱林的研究将人类行为中存在的偏见带入机器学习模型的开发过程中,“通过计算机算法对人类偏见的‘洗白’可能会使这些偏见看来是客观的。”

“武筱林的研究最让人不安的是,它让人群高低贵贱之分的这种说法再次复苏并且予以证明,是科学种族主义。”布莱斯等人担忧人工智能和机器学习的快速发展可能使科学种族主义进入了一个新的时代,“让机器习得人类的偏见。”

对于武的研究的实用性,布莱斯等人认为,“可能让一名人类法官将图像从微笑到皱眉来排个序,也可以很好地将‘非罪犯’与‘犯罪分子’区别开来。”

针对上述观点,武筱林在回应南都记者时表示,“对于纯粹的科学问题,我们欢迎一起讨论。”

“但谷歌研究者将我们的上下文割裂了。我们的研究设定的边界是证明机器学习的相关性。我们已经讨论过的数据的风险和采取的措施并反复核查,这也被谷歌的研究者忽略了。”武筱林称。

针对布莱斯等人的“科学种族主义”批评,武筱林表示,“他们对科学种族主义的指责毫无根据。事实上,我们在进步的社会价值观上与这些作者没有什么不同。”

武筱林告诉南都记者,近期他将尽快用英文正式回复谷歌研究员质疑。

专家观点

“该研究在法律上不具有参考意义”

人像识别在人工智能时代越来越成为社会关注重点。针对武筱林的研究是否科学与应用前景,中国政法大学刑事司法学院教授曲新久对南都记者表示,该研究成果“在法律上不具有参考的意义”。

“在刑事侦查中,公安机关早已采用图像识别技术寻找犯罪嫌疑人,但这种‘面部识别术’仅仅用于鉴定某个人的身份,在法律上,根据嫌疑人的长相特征来判定犯罪的可能性大小是不被允许的。”曲新久说。

一位不愿具名的计算机科学领域的研究人员对南都记者表示,把人脸特征作为判断犯罪的依据不具有科学性。“从论文本身的研究方式来看,这是一种单纯的数据挖掘和探索,即从数据直接关联标签,但数据与标签之间不存在有力的理论支撑。这种做法其实在数据挖掘领域已经有过很多尝试,而且一般也都是作为数据间某种关联的一种启发,不是作为最终判定依据。所以,对于这篇论文的结论的定位问题,如果只是作为数据挖掘中的一种探索,可以接受,但如果就因此认定人脸是判断犯罪的依据,无法接受。”

他表示,目前人工智能领域还做不到“看脸识别罪犯”,但即使未来技术上能做到,也不能“全看脸”。

“这种研究内容是需要考虑很多其他因素的,如社会因素、心理因素等,而不是简单地从脸推断是否为罪犯的概率。严肃点说,这种做法其实是很浅显且不负责任的。”该研究人员称。

对话

研究者武筱林:

“结论不是百分之百正确,但本着科学的精神在做”

南都:看到谷歌研究员的这篇文章你的第一反应是?

武筱林:我把对方的文章完整地读下来了。我对他们‘断章取义’这种有失学术公正精神的做法感到非常失望。今天下午我与同事、学生在会议上也讨论了这个事情,不是说对方文章中所有的指责都是错的,但他们忽略我们研究的上下文、居高临下进行道德审判这让人很不舒服。

南都:你怎么看谷歌研究员文章中对你们的批评?

武筱林:对方故意隐瞒了我们文章很多说明性的文字以及关键性的实验,比方数据过滤的问题。其实这个问题我们是排查过的,做过随机标记测试。当然我们的东西不是百分之百正确,但团队本着科学的精神做了当时知道的、能够做的所有的验证。

南都:网友的观点是研究样本量有些小。

武筱林:更多犯罪者的数据公安部门才有。这1856个样本我们是做了相当大的努力,从公安部、各省公安厅的通缉犯等网页或公共渠道获取的。因为存在隐私的问题,目前研究存在一些阻力,更多的数据相关部门不便提供。我们想推进,苦于没有数据。

南都:当时发起研究的背景是什么?总共花了多少时间进行研究?

武筱林:我们的本质研究是图像分析。这几年人工智能、人像处理和在人脸识别上都有长足的进步。这个研究我们前后投入了两年时间。

南都:2015年实验结果就出来了,为什么当时没有发布而推迟了一年?

武筱林:对,一年间我们有进行反复的推敲和认证。是不是罪犯从脸上的特征是很难去区分的,我们本来是想“证伪”,相由心生这种事我们本来是不相信的。结果刚出来时我们也很惊讶。

南都:选择在arX iv上提前发布的原因是?

武筱林:这是很常规的做法,提前公布自己的研究成果。因为在国际上这方面的研究还是比较有竞争力的,所以就先发表了。但这并不是急功近利,因为很长时间我们都没有公布这个结果。

南都:你对“相面术”怎么看?

武筱林:我也是受过教育的人,也反对歧视。但纯粹的科学问题,就应该用科学的态度。

南都:谷歌研究员指出你们文末提到了对“研究结论感到兴奋”。

武筱林:“当时用了一个错误的词‘excited’。我们当时认为,研究也许会对社会心理学、管理学、犯罪学有启示,让相关领域的专家去探究真正的原因和解释。但有意义不是说用来对人进行歧视。只是说可能有这种相关性,比方说犯罪分子具有这种面貌特征,有可能是此前受到歧视被社会歧视边缘化,最后走向犯罪道路。我们的研究结论,其实恰恰可以用来作为反样貌歧视的根据。

采写:南都记者 嵇石 实习生 黄驰波 梁耀丹


【责任编辑:孙晓曼】

硬核“新质力”亮相莱芒湖:第51届日内瓦国际发明展启幕,中国军团237项发明刷新纪录

初春的莱芒湖畔再次成为全球创新目光的聚焦点。第51届日内瓦国际发明展于当地时间11日在日内瓦Palexpo展览馆正式拉开帷幕。在这个全球举办历史最长、规模最大的发明盛会上,中国代表团以237个发明项目的庞大阵容亮相,参展规模不仅位居前列,更创下了历年来新高,向世界展示了中国科技创新的蓬勃生态与前沿趋势 。“含新量”十足:中国展团实现“数量与能级

抢滩“一人公司”时代:多地竞速发布“龙虾”政策,最高补贴1000万

一条红色的“龙虾”,正在掀起全国范围内的产业政策竞速。因开源AI智能体工具OpenClaw图标酷似红色龙虾,近日“AI养龙虾”引爆全网热度。这把火从技术极客的GitHub仓库,一路烧进全国两会会场,更在短短一周内点燃了深圳、合肥、无锡、常熟等多地政府的政策工具箱。从“放水养鱼”到“放水养龙虾”,一场关于未来“一人公司”(OPC)新业态的卡位战已然打响。多地密集“下塘”:最

工信部启动“工业数据筑基行动”:“1+4+N”解锁工业AI“富矿”

从根本上破解工业领域数据“采”“集”“用”的堵点,工业和信息化部于3月10日正式对外发布《关于启动工业数据筑基行动 开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》(工信厅信发函〔2026〕64号)。这标志着我国在推动工业数字化转型向智能化迈进的关键时刻,正式打响了“数据赋能”的攻坚战。锚定2026:打造高

从“+AI”到“AI+”:政策与市场同频共振,我国“人工智能+”驶入“智能经济”新蓝海

“智能经济”这一全新概念首次写入政府工作报告,标志着我国“人工智能+”行动正从技术赋能产业的“起步区”驶入产业深度融合、生态全面重构的“深水区”。在政策红利持续释放与市场需求井喷的“双轮驱动”下,一幅 “10万亿级”智能经济新形态的蓝图正加速展开。战略升维:从“工具”到“经济形态”3月5日,国务院总理李强在政府工作报告中明确提出“打造智能经济新形态”,并连续第三年

中企 MWC 2026:从追光者变身光源

当西班牙国王费利佩六世饶有兴致地与一台人形机器人握手,并接过一部折叠屏手机时,2026年世界移动通信大会(MWC)迎来了它最高光的时刻之一 。为期四天的MWC 2026正式落下帷幕 。这个以“智能新纪元”(The IQ Era)为主题、恰逢落户巴塞罗那20周年纪念的展会,用前所未有的热度向世界宣告:移动通信的未来已不再仅仅是连接,而是

爆发前夜:2026中国AI医疗加速“闯关” 从“黑盒”诊断到万亿市场

人工智能(AI)与医疗健康的融合正在经历一场从“概念”到“价值”的深刻蜕变。从顶尖学术期刊的连番突破,到省级政府的专项推进;从资本市场的高歌猛进,到基层诊室的悄然应用——中国AI医疗正以前所未有的速度,跨越商业化与临床信任的“三重门”。每周有超过2.3亿人在AI平台上询问健康问题,全球AI医疗健康市场规模预计在2026年达到560亿美元。在这场关乎

冲刺万亿目标!北京“人工智能第一城”蓝图:产业规模剑指5500亿,大模型数量全国居首

随着“十五五”规划的开局,北京正以昂扬之姿,向“全球人工智能第一城”的目标全速迈进。2025年全市人工智能核心产业规模已突破4500亿元,核心企业超过2500家,备案大模型数量高达212款,持续领跑全国。今年,北京更是立下军令状,力争推动产业规模突破5500亿元,并剑指两年内达到万亿级产业集群的宏伟目标。创新策源:人才高地催生“首发成果”在北京,人工智能的创新活力

全球AI基建“军备竞赛”白热化,繁荣背后隐忧浮现

一场围绕人工智能(AI)基础设施的全球“军备竞赛”正进入白热化阶段。随着生成式AI技术加速向各行各业渗透,2026年,以美国科技巨头为首的多国政府和企业纷纷祭出天量投资计划,竞相抢占AI时代的核心算力高地。然而,在这轮史无前例的基建狂潮背后,关于投资回报、能源消耗及产能瓶颈的担忧也日益浮出水面。四巨头领投,

湖南省数据局“数智探行”天心区“企基蝶变”

湖南省数据局党组成员、副局长王进率调研组奔赴长沙市天心区,聚焦企业数字化转型与基层数据“只报一次”工作展开专题调研,探寻数据要素在赋能产业发展和优化基层治理中的实践密码与显著成效。数智转型创新实践调研组首站来到湖南一力股份有限公司与爱尔眼科医院集团股份有限公司。在一力钢铁数字供应链平台与眼健康可信数字化转型协同赋能平台前,调研组驻足观察、细致询问。从数据整合的精准高效,到场

海南“人工智能+”三年行动方案:划定四大集聚区,2028年AI产业规模“大幅提升”

全岛封关运作后的海南自贸港,正将人工智能作为撬动产业升级的“新杠杆”。海南省人民政府办公厅2月24日印发《海南省推动“人工智能+”行动方案(2026—2028年)》(下称《行动方案》),明确以“双核驱动”构建特色AI产业生态,到2028年建成若干高能级创新平台,人工智能核心产业规模实现大幅跃升 。这是海南落实国家“人工智能+”行动的省级施工图。方案紧扣自贸港“三度一色”

从追赶到定义:全球复合机器人产业格局与中国领跑之路

在全球机器人产业从“专用自动化”迈向“通用智能化”的历史拐点上,复合机器人正成为具身智能落地的前沿形态,一个共识正逐渐清晰:“通用,即未来。” 这不仅是技术演进的方向,更是一场深刻的价值回归——机器人的终极使命在于解决真实世界的复杂任务,而非追求单一的形态。复合机器人,作为具身智能在物理世界最务实的载体,正成为连接当下制造需求与未来智能愿景的关键桥梁。

智领未来彰显科技领军实力 中国电信荣膺“金紫荆”双奖

1月30日,由香港大公文汇传媒集团联合香港中国企业协会、香港中国金融协会、香港中资证券业协会、香港公司治理公会主办的第十五届香港国际金融论坛暨中国证券“金紫荆奖”颁奖典礼在香港JW万豪酒店举行。中国电信股份有限公司(以下简称“中国电信”)凭借卓越的经营表现,荣获2025中国证券“金紫荆奖”“最具投资价值上市公司”与“卓越投资者关系管理上市公司”两项大奖,这不仅是对公司投资价值与经营成效的肯定,更是

星地传输破纪录:120Gbps激光通信实现天地数据“秒传”

中国科学家刚刚在新疆塔县完成了一项突破性实验——星地激光通信速率达到120吉比特每秒(Gbps),相当于在短短108秒内传输了12.656TB数据,足以装满约2500部高清电影。这项实验由中国科学院空天信息创新研究院(空天

三大科创中心扩围升级 区域协同构筑创新“新高地”

刚刚结束的各地两会上,一个共同的关键词频繁出现 - 京津冀、长三角、粤港澳三大国际科技创新中心扩围升级正成为区域发展的核心引擎。2026年伊始,各地政府工作报告密集发布,“整合区域优势资源,建设世界级创新集群”成为高频词。中央经济工作会议已明确将北京拓展至京津冀、上海拓展至长三角,实现从单一城市向城市群的战略升级。数据显示,2025年全球百强创新集群中,深圳-香

数字经济总量突破1200亿元,银川加速打造“算力之都”

从“数字试点”到“算力之都”,银川以翻番的数字经济总量交出一份亮眼成绩单,一座西部算力产业新高地正在崛起。银川市第十六届人民代表大会第六次会议近日披露,银川市数字经济总量已达1200亿元,较“十三五”末实现翻番。这座西北城市正以打造“算力之都”为目标,按下数字经济发展加速键。银川已建成9个算力中心,千兆网络实现100%覆盖,3个国家万兆光网试点项目建成投用。2026年

十五五开局密集问天 中国商业航天“箭”指星海新格局

蓝箭航天嘉兴基地的智能化生产线里,火箭零部件的出库时间从3分钟缩短至30秒,自动化立体仓储系统正将火箭总装从“人找料”推向“料等人”的精准物流时代。2026年1月13日23时25分,长征八号甲遥七运载火箭在海南商业航天发射场点火升空,将18组卫星送入预定轨道。这是“亦庄箭”2026年的首发任务,距离该火箭上次发射仅18天。新年伊始,力箭二号、天龙三号、双曲线三号等多型

6G研发迈入新阶段:我国启动第二阶段技术试验,构建空天地海一体化网络

已完成第一阶段关键技术试验,形成超过300项关键技术储备,正式启动第二阶段技术方案试验。1月21日,国务院新闻办公室举行新闻发布会,介绍2025年工业和信息化发展成效。工业和信息化部新闻发言人、信息通信发展司司长谢存宣布,我国已完成第一阶段6G关键技术试验,形成了超300项关键技术储备,近期已启动第二阶段6G技术试验。与此同时,我国5G标准必要专利

上海开源大会锚定AI未来:百万开发者生态迈向“主导型”崛起

开源不再只是代码共享,而是开放协同的新生产方式,上海正构建一个从使用生态到主导生态的开源体系。第二届开源产业生态大会1月13日在上海落幕。会上披露的数据显示,上海开源开发者数量已超过100万人,位居全国第二,而这一数字计划在2027年达到300万人。上海市经信委总工程师裘薇在大会上表示,开源已成为实现技术突破、参与全球科技创新的重要途径。本次大会不仅启动了“开源产

智能伴侣与静默革命:AI无缝织入2026生活图景

从能感知情绪的AI助手到街头无人的自动驾驶出租车,人工智能正以润物细无声的方式,重塑我们日常生活的节奏。2026年将成为人工智能深度嵌入日常生活的转折点。美国《纽约时报》最新观察指出,生成式AI已不再是实验室的奇观,而成为推动人机关系根本变革的引擎。清晨,智能眼镜在视野边缘提示今日议程;通勤时,自动驾驶出租车平稳穿梭;工作中,AI代理主动处理邮件安排会议;回家后,
返回
顶部