科技

上海交大“看脸识罪犯”研究引热议 回应:断章取义

通过机器识别人脸来判断罪犯,这像是科幻电影出现的一幕。上海交通大学教授武筱林的一项“人脸识别罪犯”研究却引起了巨大的争议。

5月7日,谷歌人工智能研究员布莱斯、玛格丽特和普林斯顿大学神经科学教授亚历山大发布的《相面术的新外衣》一文,质疑武筱林研究的可信性,并称其研究结论可“具有误导性,洗白科学种族主义”。

近日,武筱林回应南都记者称,“他们对我们研究的上下文进行断章取义,有失学术探讨的公正精神,我感到非常失望。”

看脸识罪犯

研究者“原本打算证伪”

事情缘起于2016年11月,上海交大图像通信与网络工程研究所教授武筱林和其博士生张熙在国际电子预印本文献库arX iv上提前发布了一篇题为《基于面部图像的自动犯罪概率推断》的研究。

“这在科学界是很常规的做法。”武筱林回应南都记者称。

清华大学纳米生物领域博士后张旭告诉南都记者,arX iv是国际科研工作者在研究成果未正式发表前,出于和同行交流目的先行发布的一个电子预印本文献库,涉及物理、数学、计算机科学等领域,“相当于永不落幕的学术会议”。

在该研究中,武筱林和团队通过运用计算机视觉和机器学习技术,对1856名18到55岁中国男性的身份证照进行检测。这些研究对象被分为罪犯组与非罪犯组两组,罪犯组包含730名犯罪人员,涉及盗窃、贪污、谋杀、强奸、绑架和抢劫等罪行。其余1100名普通人所在的非罪犯组,职业覆盖司机、医生、律师、教授、服务员、建筑工人等领域。

“我们当时在公安部、各省公安厅协助下得到这些图像”,武筱林指出,这些研究对象来自全国不同的地方,“后来这些照片都被调整为80cm×80cm大小,照片的亮度和对比度等都进行了统一处理,随后通过卷积神经网络算法(一种高度通用的深度学习技术)进行检测。”

研究结果显示:四类分离器(逻辑回归,K N N,SV M,C N N )对罪犯与非罪犯的区分准确率至少在86%以上。与此同时,两组面部特征方面在内眼角间距、上唇曲率和鼻唇角角度这三个测度最为显著。通过计算机模拟出来的罪犯与非罪犯的“平均脸”较相似,但非罪犯之间的面部特征差异要比罪犯小。也就是说,样本中非犯罪人员的样貌更为相似,变化幅度更小,犯罪人员的面部表情差异比普通人更大。

对于该结论,武筱林称,他们当时也很惊讶,“研究结果与预期相反,我们原本想用数据分析推翻‘相由心生’这种说法,原本是打算证伪的。”

结论引热议

被指样本量太小,研究不科学

结论一出,有研究者质疑武筱林的研究不科学,“样本量太小了”。部分人士表示担忧,这会加重人们对样貌有缺陷人群的歧视。

武筱林告诉南都记者,这半年来他收到了非常多的反馈邮件,“有的来信索取数据,有的想要与我们合作,还有质疑实验结论的。”有同行还要求他从arX iv上撤稿。

这些声音中,就包括谷歌研究员布莱斯等人最新发表的文章——— 《相面术的新外衣》。该文开头指出,武筱林的研究将人类行为中存在的偏见带入机器学习模型的开发过程中,“通过计算机算法对人类偏见的‘洗白’可能会使这些偏见看来是客观的。”

“武筱林的研究最让人不安的是,它让人群高低贵贱之分的这种说法再次复苏并且予以证明,是科学种族主义。”布莱斯等人担忧人工智能和机器学习的快速发展可能使科学种族主义进入了一个新的时代,“让机器习得人类的偏见。”

对于武的研究的实用性,布莱斯等人认为,“可能让一名人类法官将图像从微笑到皱眉来排个序,也可以很好地将‘非罪犯’与‘犯罪分子’区别开来。”

针对上述观点,武筱林在回应南都记者时表示,“对于纯粹的科学问题,我们欢迎一起讨论。”

“但谷歌研究者将我们的上下文割裂了。我们的研究设定的边界是证明机器学习的相关性。我们已经讨论过的数据的风险和采取的措施并反复核查,这也被谷歌的研究者忽略了。”武筱林称。

针对布莱斯等人的“科学种族主义”批评,武筱林表示,“他们对科学种族主义的指责毫无根据。事实上,我们在进步的社会价值观上与这些作者没有什么不同。”

武筱林告诉南都记者,近期他将尽快用英文正式回复谷歌研究员质疑。

专家观点

“该研究在法律上不具有参考意义”

人像识别在人工智能时代越来越成为社会关注重点。针对武筱林的研究是否科学与应用前景,中国政法大学刑事司法学院教授曲新久对南都记者表示,该研究成果“在法律上不具有参考的意义”。

“在刑事侦查中,公安机关早已采用图像识别技术寻找犯罪嫌疑人,但这种‘面部识别术’仅仅用于鉴定某个人的身份,在法律上,根据嫌疑人的长相特征来判定犯罪的可能性大小是不被允许的。”曲新久说。

一位不愿具名的计算机科学领域的研究人员对南都记者表示,把人脸特征作为判断犯罪的依据不具有科学性。“从论文本身的研究方式来看,这是一种单纯的数据挖掘和探索,即从数据直接关联标签,但数据与标签之间不存在有力的理论支撑。这种做法其实在数据挖掘领域已经有过很多尝试,而且一般也都是作为数据间某种关联的一种启发,不是作为最终判定依据。所以,对于这篇论文的结论的定位问题,如果只是作为数据挖掘中的一种探索,可以接受,但如果就因此认定人脸是判断犯罪的依据,无法接受。”

他表示,目前人工智能领域还做不到“看脸识别罪犯”,但即使未来技术上能做到,也不能“全看脸”。

“这种研究内容是需要考虑很多其他因素的,如社会因素、心理因素等,而不是简单地从脸推断是否为罪犯的概率。严肃点说,这种做法其实是很浅显且不负责任的。”该研究人员称。

对话

研究者武筱林:

“结论不是百分之百正确,但本着科学的精神在做”

南都:看到谷歌研究员的这篇文章你的第一反应是?

武筱林:我把对方的文章完整地读下来了。我对他们‘断章取义’这种有失学术公正精神的做法感到非常失望。今天下午我与同事、学生在会议上也讨论了这个事情,不是说对方文章中所有的指责都是错的,但他们忽略我们研究的上下文、居高临下进行道德审判这让人很不舒服。

南都:你怎么看谷歌研究员文章中对你们的批评?

武筱林:对方故意隐瞒了我们文章很多说明性的文字以及关键性的实验,比方数据过滤的问题。其实这个问题我们是排查过的,做过随机标记测试。当然我们的东西不是百分之百正确,但团队本着科学的精神做了当时知道的、能够做的所有的验证。

南都:网友的观点是研究样本量有些小。

武筱林:更多犯罪者的数据公安部门才有。这1856个样本我们是做了相当大的努力,从公安部、各省公安厅的通缉犯等网页或公共渠道获取的。因为存在隐私的问题,目前研究存在一些阻力,更多的数据相关部门不便提供。我们想推进,苦于没有数据。

南都:当时发起研究的背景是什么?总共花了多少时间进行研究?

武筱林:我们的本质研究是图像分析。这几年人工智能、人像处理和在人脸识别上都有长足的进步。这个研究我们前后投入了两年时间。

南都:2015年实验结果就出来了,为什么当时没有发布而推迟了一年?

武筱林:对,一年间我们有进行反复的推敲和认证。是不是罪犯从脸上的特征是很难去区分的,我们本来是想“证伪”,相由心生这种事我们本来是不相信的。结果刚出来时我们也很惊讶。

南都:选择在arX iv上提前发布的原因是?

武筱林:这是很常规的做法,提前公布自己的研究成果。因为在国际上这方面的研究还是比较有竞争力的,所以就先发表了。但这并不是急功近利,因为很长时间我们都没有公布这个结果。

南都:你对“相面术”怎么看?

武筱林:我也是受过教育的人,也反对歧视。但纯粹的科学问题,就应该用科学的态度。

南都:谷歌研究员指出你们文末提到了对“研究结论感到兴奋”。

武筱林:“当时用了一个错误的词‘excited’。我们当时认为,研究也许会对社会心理学、管理学、犯罪学有启示,让相关领域的专家去探究真正的原因和解释。但有意义不是说用来对人进行歧视。只是说可能有这种相关性,比方说犯罪分子具有这种面貌特征,有可能是此前受到歧视被社会歧视边缘化,最后走向犯罪道路。我们的研究结论,其实恰恰可以用来作为反样貌歧视的根据。

采写:南都记者 嵇石 实习生 黄驰波 梁耀丹


【责任编辑:孙晓曼】

长三角织就算力“一张网”,数智加速度破局数字时代

一键下单,算力“网购”,87.3EFlops庞大算力资源在长三角地区正像水电一样便捷可及,一场区域一体化的数字革命悄然到来。江苏省一体化算力调度监测平台于11月13日在南京正式上线,这是全国首个省市一体化算力调度监测平台。该平台已监测全省在用数据中心282个,总算力规模达87.3EFlops,其中智能算力占比约70%,成为长三角数字经济的“主力能源”。与此同时,在11月

国家加速制造业升级:到2027年基本建立现代化中试平台体系

工信部最新部署,到2027年底,我国将基本建立现代化中试平台体系,初步形成多主体参与、多领域布局的全国制造业中试服务网络。工业和信息化部办公厅日前印发《关于进一步加快制造业中试平台体系化布局和高水平建设的通知》,明确提出到2027年底,高水平中试平台力量进一步壮大,现代化中试平台体系基本建立,多主体参与、多领域布局、多层次服务的全国制造业中试服务网络初步形成。中试

788 EFLOPS 领跑全球!我国智能算力撑起 AI 创新 “加速度”

截至 2025 年 6 月底,我国智能算力规模达 788 百亿亿次 / 秒(EFLOPS),相当于全球 80 亿人用普通计算器连续运算 4000 年的总量。这一来自工业和信息化部的最新数据,与 1085 万标准机架、1680 艾字节存力共同印证:我国算力基础设施规模已稳居全球前列,正成为人工智能创新的核心引擎。千行百业 “算力赋能” 成效凸显在内蒙古伊利智慧牧场,计算机

中国6G专利全球第一,2025年互联网蓝皮书揭示数字中国新图景

一份备受全球互联网行业关注的年度发展成绩单,在乌镇峰会上如期发布。11月8日,在2025年世界互联网大会乌镇峰会上,由中国网络空间研究院牵头编撰的《中国互联网发展报告2025》和《世界互联网发展报告2025》蓝皮书正式发布。这两份已连续九年面向全球发布的权威报告,全景式展现了过去一年中国和世界互联网发展的新进展与新成就。报告中的一系列数据令人振奋:中国6G专利申请

2025科技创新与产业创新深度融合大会在长沙成功举办

11月1日,由中南大学主办的2025科技创新与产业创新深度融合大会暨中南大学校企联理事会会议在长沙开幕。大会深入贯彻党的二十届四中全会精神,落实“推动科技创新与产业创新深度融合,引领发展新质生产力”的战略部署,旨在充分发挥中南大学教育、科技、人才“三位一体”优势,搭建一个汇聚校友力量、链接产业需求与大学科创资源的高能级平台。

科技赋能健康 创新引领未来 浙江省盐业健康科技研究院挂牌成立

聚焦盐、泛盐产品、泛食品、大健康等领域,致力于开展产品研发、技术创新、产业融合、成果转化、行业研究和人才培养等业务,为浙盐集团转型发展和拓展第二增长曲线提升科研创新支撑,为助力中国盐行业高质量发展注入浙盐新动能。

万亿科创债激活硬科技赛道!5月以来资金加速涌入AI、新能源领域,政策工具创新破解融资困局

自今年5月7日债券市场“科技板”正式落地后,科技创新债券(以下简称“科创债”)发行规模呈现爆发式增长。据最新数据显示,2025年前三季度全国累计发行科创债1428只,总规模达1.58万亿元,同比激增74.94%,其中5月新政后单月发行规模最高达3513.83亿元。资金精准流向人工智能、新能源、生物医药等战略新兴领域,政策工具创新如风险分担机制、长期限产品设计等,

未来π对·智引无界——2025世界青年科学家峰会“万有引力π”在温州启幕

10月23日,2025世界青年科学家峰会官方展示交流活动——“万有引力π”在温州瓯海奥体中心正式启幕,活动将延续至10月26日。本届活动以“未来π对·智引无界”为核心理念,打造了超2万平方米沉浸式科技展示空间,集结近百家头部科技企业、200余项前沿科技成果,吸引数万名青年科学家、科技创业者及公众共同参与,掀起一场科技创新与全民科普交织的“π级盛会”。

冰城论剑数智潮!第22届中国计算机大会在哈尔滨盛大启幕,1.2万名全球精英共绘智能未来

哈尔滨国际会议中心内,一场思想与技术的盛宴正在上演,万余名计算机领域专业人士汇聚一堂,共同描绘数字智能时代的未来图景。10月23日,第22届中国计算机大会(CNCC2025)在哈尔滨华旗饭店亚冬馆拉开帷幕。这场以“数智赋能·无限可能”为主题的科技盛会,吸引了全球1.2万名计算机领域顶尖学者、产业领袖、青年才俊及国际组织代表齐聚冰城,共同探讨数字智能技术的前沿趋势与产业变革

蒙牛亮相世界乳业峰会 全面展示乳业数智化的“中国样板”

当地时间10月21日,2025世界乳业峰会于智利圣地亚哥举行。蒙牛集团作为乳业领军企业受邀参加,并在大会上分享其贯穿全产业链的数智化实践成果。其中,蒙牛宁夏“灯塔工厂”作为全球乳业首座全数智化工厂,受到与会代表的广泛关注和讨论,展现了中国乳业在全球智能制造领域的硬核实力。

广东发放“模型券”“算力券”,262亿资金撬动制造业AI革命

制造业规模约占全国1/8的广东正式出台专项方案,通过16条政策措施推动人工智能在制造业全面落地,加速“广东制造”向“广东智造”跃升。广东省人民政府办公厅近日印发《广东省人工智能赋能制造业高质量发展行动方案(2025—2027年)》(以下简称《行动方案》),围绕强化关键供给、促进应用推广、构建支撑体系、优化要素保障4大方面提出了16条具体措施。在10月22

全球六成AI专利花落中国!数字核心科技突破激活新质生产力引擎

当人形机器人挥出精准拳击动作与观众互动,当农业大模型为千万亩耕地提供智能种植方案,当工业互联网平台赋能超3.5万家智能工厂——这些充满未来感的场景,正由中国人工智能领域全球领先的专利布局转化为现实生产力。全球六成AI创新源自中国国家数据局最新数据显示,截至2025年6月,我国人工智能专利数量占全球总量的60%,以157.6万件申请量稳居世界首位。联合国《世界知识产

湖北打造AI产业新高地,3500亿元目标背后有何布局?

武汉一场人工智能领域的盛会,揭示湖北在AI产业赛道上的雄心与蓝图。湖北省人工智能政策宣贯暨产业供需对接培训活动10月19日在武汉成功举办。活动以“政策赋能产业,供需激活生态”为核心,汇集政府、高校、企业及金融机构等多方力量,为湖北人工智能产业高质量发展注入新动能。湖北省经信厅党组书记、厅长朱万奎在致辞中指出,人工智能是引领新一轮科技革命和产业变

AI悄然重塑城市运行:从车间到街角的生活之变

走进广东佛山的海天调味品工厂,AI“豆脸识别”技术正以每秒2.5万亿颗的速度对原料进行精准检测;而在新疆的社保大厅,RPA机器人仅用3分钟就能完成失业保险业务的全程办理。这些看似不相干的场景,正勾勒出人工智能渗透城市每个角落的新图景。从产业车间到街头巷尾,AI不再只是科技论坛的热词,而是悄然改变城市运转方式的底层力量。智能制造:工厂的自我革命制造业作

构建新大陆贸易金融体系:数字人民币支点与宁波跨境结算科技模式创新的场景革命

中国构建自主可控贸易新体系的战略蓝图,正从宏观布局迈向微观落地。这一战略的核心,在于通过产业链闭环、货币结算网络、替代性贸易基础设施的三重布局,实现从“融入全球化”到“塑造全球化”的根本性转变。中欧班列与“数字丝绸之路”作为战略双翼,已初具规模。而近期上海数字人民币国际运营中心的落地运营,则为这一体系注入了决定性的“金融血液”,其中,宁波跨境结算科技场景的创新模式,正成为将

“终极能源”商业化不再遥远 中国“人造太阳”迈向发电倒计时

曾经只存在于科幻小说中的“人造太阳”,正悄然从实验室走向现实,一系列突破性进展标志着聚变能研发已进入决定性新阶段。近日,中国紧凑型聚变能实验装置(BEST)首个关键部件杜瓦底座成功安装就位,标志着项目主体工程建设步入新阶段。这个国内聚变领域最大的真空部件,将承载总重约6700吨的BEST主机。与此同时,在四川成都,国际原子能机构聚变能研究与培训协作中心正式授牌,这

中国的北斗 世界的北斗

第四届北斗规模应用国际峰会在湖南株洲举行,全面展示了北斗产业发展的最新成就与未来图景。从深空到地面,从产业链到生活圈,北斗正快速融入中国式现代化的发展进程。亮眼数据折射出产业的坚实跃升,创新成果展示了技术的勃勃生机,国际合作描绘着开放共享的新图景——今天的北斗,不仅是定位导航的“中国名片”,更是推动经济发展、改善民生、促进合作的全球公共产品。NO.01产业链条日益完整峰会期间,《

中国创新能力跃升至全球第十

从世界工厂到“世界脑厂”,中国科技创新能力的历史性跨越正在重塑全球创新格局。5年来,中国坚持把创新摆在国家发展全局的突出位置,科技事业取得历史性成就。国家综合创新能力排名从2020年的第14位提升至2024年的第10位,成为近十余年来进步最快的国家。这一飞跃使中国成为唯一进入全球创新能力前十的中等收入国家。中国科学技术发展战略研究院发布的《国家创新

中国人工智能产业规模突破9000亿元,完整生态链引领智能原生新世界

人工智能正从技术实验大步迈向行业实践,成为中国经济发展新质生产力的重要引擎。“经测算,2024年我国人工智能产业规模已超9000亿元,同比增长24%。”在日前举行的2025人工智能产业及赋能新型工业化大会上,中国信息通信研究院副总工程师王爱华发布了这一令人振奋的数据。这项测算成果描绘出中国人工智能产业的蓬勃生态:截至2025年9月,我国人工智能企业数量超
返回
顶部