科技

搜狗CEO王小川:将推海外搜索功能 帮助中国人了解海外信息

搜狗CEO王小川:将推海外搜索功能 帮助中国人了解海外信息

腾讯科技讯 (韩依民) 1月14日,在2017极客公园GIF大会上,搜狗CEO王小川发表“人工智能和你我会是什么关系”的主题演讲。

在演讲中,王小川对人工智能学术与应用之间的关系进行了阐述。王小川认为,从技术到产品再到商业价值要从彼此实现的角度来看。

王小川认为,有技术不一定有产品,不一定代表用户的规模,有技术有用户规模,也不一定背后可以带来商业价值。

基于这样的理解,王小川介绍,搜狗人工智能的大逻辑是让人工智能技术通过一些产品来实现,使得已经让千家万户用到的产品做升级,“其实深度学习已经通过搜狗武装到了牙齿”。

在演讲中,王小川还首次对外发布了搜狗的最新产品海外搜索,针对中国人,帮助英文不够流利,或者还是效率不够高的用户,实现用中文词输入可以翻译成英文,检索英文世界的内容,同时把它翻译成中文的结果。

“我们之前看到大量对海外感兴趣的事情,细胞免疫疗法,在中国得到很多虚假的信息,可以看到海外怎么说这个事。”

最后,王小川还阐释了他对人工智能与人之间关系的思考,王小川对人工智能的意义表示乐观,他认为人工智能不是取代人,而是帮助人类获得新的自由。

“我愿意把机器的智能文明带到人的世界里去,另一方面我们对于已经被分工细化的人有新的解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。”

以下为王小川演讲实录:

极客公园的朋友们大家好!今天给大家分享人工智能,这个话题已经谈了一年多。李飞飞教授给大家做了一个89页的PPT,讲了一下研究界做了多少工作。这种情况下我做了一个子标题,人工智能照进现实,我们把这些科研成果变成实实在在能够用到的产品。

一年的时间里面我们学了太多的词汇,包括Alpha Go、语音识别,里面有很多的学术概念。更多像对抗生成网络,有各种各样的词汇。

我提一个简单的模型,这个模型不仅对于人工智能或者对技术使用,我们从技术怎么把它变成产品,再怎么变成一个商业价值或者全人类共享的价值,要从三个维度看。

我自己讲,现在有一个词高大上,叫全栈工程师,我自己对自己的理解是需要做全栈的CEO。这里面我们看到,如果你一开始没有一个你的技术含量,我们知道是很难变成产品的,有技术不一定有产品,不一定代表用户的规模,有技术有用户规模,也不一定背后可以带来商业价值。

在这里面,我们简单做了一个图,我试图把我们现在有的技术产品放进去。在去年3月份,Alpha Go是一个黑科技,我们今天看在这些技术里面,我把所有跟人工智能相关的前沿都表达成是我们一种新技术。列的这些都有技术,但是前三项里面Alpha Go还有图像描述,刚才李飞飞教授讲的图像描述,还没法形成用户规模。我们说云端大家作为好奇者,你可以看到很惊艳的科技,其实没让你用到,还没有走到第二步。

今天在图像描述、图像合成里,包括大家注意到没有,张鹏和李飞飞都有一个风格迁移的技术。我称之为图像合成子的方向,这种产品没法形成用户的规模。有些技术不仅是黑科技开始变成用户规模,语音的识别、人脸识别,这两个技术我反复讲它不是让机器做判断做选择,最后它形成的商业价值或者给用户带来的变化,还是不够大的。

能够看到什么东西,我们作为一个好奇的群体,我们在想能够在无人驾驶,这是大家觉得既是黑科技又有很大的用户规模,对不起还没有面世。从这个维度讲,我们会发现今天人工智能变成所有人追捧的热潮,但是并没有找到一个既面世又是同时有巨大用户规模和改变世界的技术。这是在最近两三年需要发生的事情。

这个过程当中变得很难,我们能够做出技术,并且让技术领先就是一个困难的事情。有些技术刚刚引回国的时候是领先,还没等到产品的商业化,这个技术就开始落后了,发展特别快。保持技术领先,这是一个难题。

更难的是把技术变成产品,让很多的用户去受益。更难的是这个技术不仅有它的用户规模,还可以改变世界,有很大的商业上的意义,和对世界的冲击。

今天我分享的是我们在做的一些尝试。我之前的PPT叫AI这在过河。这个过河只是从搜狗,我们的想法是第一件事情,我们有这种技术,而且我们把这种技术用到搜狗的产品里去,很多创业的公司试图构造新产品。我们大的逻辑使得已经让千家万户用到的产品做升级,其实深度学习已经通过搜狗武装到了牙齿。我们主产品大量的使用,比如输入法就会用到语音识别和图像识别的能力,语音识别我们现在一天已经做到了用户规模有2亿次的识别量,7%的搜狗输入法的用户会运用到语音识别的技术。

同时,一天识别生产的语音数据量大概进入到18万小时,我们用了400台服务器支撑这样的规模。打开输入法可以看到OCR的能力,可以手写,或者拍照片,我们在做一个渐进的事情。我昨天在硅谷还跟Google他们的核心人在沟通,Google他们讲到用深度学习可以对于用户输入的命令去做分解,以前靠我们人在里面统计这些规则。今天靠深度学习做,对搜索引擎的规则描述,它的准确率提升了30%,和我们一样的,已经成为搜索引擎排序里面第三重要的因素。

深度学习我们在搜索这个类型的公司里面可以快速推向使用,但是这样一个技术还没有到颠覆性。符合刚才讲的面世了,有黑的技术,有大的用户规模,但是并不够对世界有更大的冲击。这里面我们还会做一些新的东西,这是今天我很荣幸可以在极客公园会场可以跟大家发布我们一款新的产品。

回到搜狗的逻辑,用户表达和获取信息更简单,通过输入法,很多中国人在打字里面提高的效率,搜索让大家获得很多信息。通过深度学习使得这样的产品更加聪明和丰满,还有什么事情可以借助深度学习前人的成果,我分享一个《圣经》里面的小故事,关于通天塔的故事,人类想通过自己的努力构造通天塔可以和上帝对话,上帝觉得藐视了他的权威,因此他让不同的人,不同的民族去说不同的语言。

由于大家说不同语言,沟通变成了一个障碍,所以人就没有能力修建通天塔。这是我经常引用的,由于信息不对称,使得我们难以合力做一件最伟大的事情。这里面不仅是网络连接,还有不同民族语言不一样。

去年11月份Google有一篇论文,把机器翻译推到一个新的高度,我们去畅想如果在表达,在获取的时候能够让不同民族的人,包括中文、英文自由交流,可以获得他们完整的信息,这世界会因此而变。这样的使命里面,我会认为如果能够跨语言进行沟通,这样的一个技术进步,人类发明电一样是很重要的事情,电使得我们生产力得到巨大解放。做到跨语言沟通,地球的文明会重新改写,大家战争会变得更少,不同民族之间的交流会带来新的文明产生。

这里面我们做了很多的工作,一方面在Google技术的指引下我们用了这样的技术,基于类似于深度神经元网络的翻译模型,已经被我们掌握的非常好。我们有幸和清华有更多的合作,有很多技术的经验融入到我们模型里面。不仅是深度学习的网络还有其他的合力。

我们比Google更有动力和决心去做好翻译这件事情,Google代表技术的高度,它在我心中有一种玩票的心态,作为中国人我们非常有意愿要和英语的直接去对话,Google一做就是上百种语言,或者8种语言之间怎么互译。对它是一种秀肌肉的事情,对于世界上最大的民族,中文我们有非常大的动力去真正变成现实。

在这样一种动力驱动下,我们实际做的产品的识别准确度比Google更加高。基于这样的事情,我们开始在产品上去发力,有一些黑科技。我们在去年乌镇互联网大会上首发了机器同传,在香港科技大学我们把同声传译带到实用。乌镇的会我们叫首秀,乌镇互联网大会说是世界互联网,但是在座的观众基本都是中国人。这个发布是一个概念性的产品,我们在香港科技大学发布这个产品,下面有30%,真正是国外的学生,没有提供同传的设备,问他们听懂了吗,他们说用中文演讲的内容也可以听懂。

我们没有做视频的宣传,在网上有一些传播。这样的技术并不符合我刚才的理念,是很好的技术,并不是给所有人去使用。在去年年底,我们把这个技术放到搜狗输入法你在里面敲中文的时候,只要点一个键,这句话就可以翻译成英文,再点一个键就可以发送出去,使得你跟国外的朋友去做聊天或者写邮件的时候,变得更加容易,这是我们输入法增加的功能。

点翻译键就可以得到后面翻译的结果,今天我想给大家带来的是之前一直保密,也是因为极客公园我们准备的一个新的产品,在这个场合下发布。我们叫做搜狗的海外搜索,能听到这个词一定和跨语言的翻译工作相关。它是什么?我们在以前搜索的时候,中文信息可能只占世界信息的10%,不会更多了。很多大量优质的内容是在海外,但是很不幸,一个是Google被封掉,即便我们会用Google,作为一个中国人英文水平确实承认不够高,用中文搜索的时候没有更多的信息。我们今天发布的海外搜索产品,是给中国人用,帮助英文不够流利,或者还是效率不够高的朋友,我们实现了你用中文词输入可以翻译成英文,检索英文世界的内容,同时把它翻译成中文。

这个产品三页就可以看到左边是搜索海外的英文内容,你点一个键就可以以中文的方式阅读,而且提供双语的翻译。可以干吗?我们之前看到大量对海外感兴趣的事情,细胞免疫疗法,在中国得到很多虚假的信息,可以看到海外怎么说这个事。人工智能国外发展,我们可以看人工智能国外初创公司,这个搜索到的就是国外最前沿的人工智能公司。我们想知道明星lady gaga,我们可以看到在西方世界怎么样的。

我们可以搜索到90%的世界,这对我们是巨大的促进。我们今天首发这样的产品,这是搜狗第一次在极客公园首发,而且也是全球第一次把神经网络元系统和产品相关的产品能够给你一个单独的翻译产品,我们放到搜索里去,就可以使得我们去搜索全世界的内容。

右边有我们的二维号,今天有机会给大家做这样的发布,欢迎大家来试用。

背后有很多工作要做,这个翻译技术非常的细腻,有些前沿的词汇并没有中英文对应。我昨天从美国回来,我查美联航空在线值机,翻译过去再翻回来就变成联合航空。我们需要把搜索技术和网页搜索做一个合体,现在是单独的海外搜索,之后要和网页搜索做整合,投入更大的资源,大家可以全面浏览不仅是搜索可以做翻译,使得海外的内容可以做到中文阅读,翻译之后用中文看到整个世界。

这里面我们做这个工作,翻译技术如何去解决,我们想到底去做思考未来有什么变化。我们是去取代人类还是帮助人类?在网上有了这样的讨论。取代人类,如果我们的翻译系统把专业的翻译给仍掉了,这个人群就没有工作,对更多人是有了帮助。我们反复讨论一个题目,有了机器学习之后,有了深度学习之后,究竟机器和人是什么关系?这是我的两个思考的结论。

我在前年极客公园大会上提到智慧的体外进化,有了机器之后我们要心甘情愿和机器合体,我和机器融合,不要孤立看人。我把机器当成我生命中的一部分,我们变得更加强了。你问一只猴子你希望变成人吗,猴子可能会茫然,你问一个人,你希望变成超人吗,我们可能会很茫然。

如果我的工作被取代了,是怎么样的?这几天我在读一些哲学的书,用尼采的思考,他说这个地球开始变成一个大的分工,每个人就像螺丝钉一样做了一个局部的事情。比如说翻译、司机,我们好像找到了一份工作,其实我们被限制了我们的自由,我们精确在社会工作中间完成我原有的使命。机器取代精确的分工之后,是把我们的束缚解放了,要求我们做一些更我创造性的事情,没有失去就没有新的获得。

我愿意把机器的智能文明带到人的世界里去,另一方面我们对于已经被分工细化的人有新的解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。

这是我想阐述的AI和我们之间的关系。

我给大家放一分钟时间的视频,是我们在乌镇和香港的视频。同声传译今天做到的高度,我今天给大家的演讲就分享到这,希望海外搜索会成为第一款面世能够改变我们生活,也是被广大用户使用的人工智能产品,谢谢!


【责任编辑:孙晓曼】

数字大物业 城乡新动能│厦门翔安“智理”方法论 数据赋能大物业重塑城乡未来

在厦门市翔安区,基层治理的日常正在被一系列智能化场景所改变:堆积如山的海蛎壳在智能系统的精准调度下,变废为宝转化为绿色的环保材料;AI数字社工化身为社区“新成员”,以数百倍于人工的效率完成和各类任务,让社区工作者有更多时间走进群众;无人机与智能摄像头织就全域感知网络,赋予城乡管理“千里眼”

数字化转型有了“导航图”!14个行业可“按图索骥”

曾经“摸黑走路”的制造业数字化转型,如今有了清晰的“施工图”。在近日沈阳举行的2025年两化融合暨数字化转型大会上,一位与会企业代表这样感慨。此次大会上,工业和信息化部正式发布《场景化、图谱化推进重点行业数字化转型的参考指引(2025版)》,为钢铁、石化等14个重点行业绘制了企业数字化转型“场景导航图”。

河北空天控股公司多项创新技术成果亮相 “三年上、五年强”科技成果展

12月6日至7日,河北省国资委监管企业研发投入“三年上、五年强”专项行动科技成果展在河北交投数智产业园盛大举办。河北空天控股公司作为河北交投集团空天信息领域科技创新核心力量,携系列北斗高精尖装备、省级低空交通监管平台、“北斗+低空”危化品监管系统等多项拥有自主知识产权与自主品牌的创新技术成果参展,通过图文解说、音频演示、动态视频等多元化形式,立体化呈现公司在空天信息领域

河北国资成果展:科技赋能,创新成果“多点开花”

科技赋能国企,创新引领发展。12月6日,河北省国资委监管企业研发投入“三年上、五年强”专项行动科技成果展在河北正定新区未来电子信息与装备制造产业基地成功启动,展期2天。成果展期间将举办专家主旨报告会、青年科技人才分享会、专利转化对接会、京津冀三地国资委联合发布《京津冀国有企业青年科技创新倡议书》等系列活动。现场还设有招商洽谈区、成果路演区,旨在打通创新成果与产业需求、金融资本对接的“最

从云计算到星计算:算力革命的技术演进与产业变革​

随着人工智能技术的快速发展和全球算力需求的爆发式增长,传统地面数据中心面临着前所未有的挑战。据统计,到 2026 年,全球数据中心的总用电量或将超过 1000 太瓦时,堪比日本全国的用电量。在能源消耗、土地资源和散热成本的多重压力下,算力基础设施正迎来从地面集中式向天地一体化分布式的范式跃迁。星计算作为这一变革的核心,通过将高性能计算、AI 与边缘计算集成于天基平台,构建分布式卫星星

京广铁路长台关站完成信号系统升级 “智慧机房”助力路网安全提效

日前,经过230分钟紧张有序的施工作业,京广铁路信阳段关键节点站 —— 长台关站计算机联锁设备技术改造工程顺利完工。升级后的新型信号系统与创新建设的“智慧机房”,为这条贯通南北的运输大动脉筑牢安全屏障,进一步提升区域路网运输效能。

智能模型与手术机器人协同,AI医疗开启精准诊疗新时代

医疗大模型具备“专家级”推理能力,手术机器人实现毫米级精细操作,人工智能正重塑从看病到手术的每一个医疗环节。在宁波大学附属第一医院方桥院区,70岁的王阿姨在AI数字人引导下精准挂号,就诊后收到一份AI生成的个性化复查建议。诊室里,医生屏幕已由AI助手自动生成初步病历;手术室内,骨科机器人正辅助医生进行毫米级精准操作。这些场景勾勒出“未来医院”的实景图。智能诊断模型将病变

瞄准九大前沿领域 工信部启动国家新兴产业发展示范基地创建

到2035年培育100个示范园区和1000家示范企业,这一长期计划为中国新兴产业绘制了清晰的发展路线图。工业和信息化部近日正式印发通知,启动国家新兴产业发展示范基地创建工作。该举措旨在面向2035年和“十五五”时期国家发展战略,聚焦新兴产业重点领域,遴选一批具有国内领先水平的产业园区和企业。示范基地创建瞄准新一轮科技革命和产业变革前沿,聚焦新一代信息技术、新能源、新材料、

中国启动“燃烧等离子体”国际科学计划,携手全球点燃“人造太阳”

在安徽合肥未来大科学城,一座名为BEST的紧凑型聚变能实验装置主机大厅内,全球能源未来的一页新篇章正悄然开启。11月24日上午,中国科学院在安徽合肥未来大科学城的紧凑型聚变能实验装置(BEST)主机大厅正式启动“燃烧等离子体”国际科学计划,并首次面向国际聚变界发布BEST研究计划。来自法国、英国、德国、意大利等十余个国家的聚变科学家齐聚合肥,共同签署了《合肥聚变宣言》,

数智赋能解锁文脉守护新范式“今古集”亮相长三角文博会获行业聚焦

11月20日,“今古集:数智赋能·守护文明”2025年社会教育活动在国家会展中心(上海)开幕,活动由中国文物保护基金会科技保护专项基金主办。中国文物保护基金会秘书长陶诚,上海市委宣传部二级巡视员、市文创办专职副主任黄建富,中国科学院院士、同济大学建筑与城市规划学院教授常青等出席活动并致辞,来自文博机构、高等院校、科技企业等众多专家学者与行业代表参加活动。

长三角织就算力“一张网”,数智加速度破局数字时代

一键下单,算力“网购”,87.3EFlops庞大算力资源在长三角地区正像水电一样便捷可及,一场区域一体化的数字革命悄然到来。江苏省一体化算力调度监测平台于11月13日在南京正式上线,这是全国首个省市一体化算力调度监测平台。该平台已监测全省在用数据中心282个,总算力规模达87.3EFlops,其中智能算力占比约70%,成为长三角数字经济的“主力能源”。与此同时,在11月

国家加速制造业升级:到2027年基本建立现代化中试平台体系

工信部最新部署,到2027年底,我国将基本建立现代化中试平台体系,初步形成多主体参与、多领域布局的全国制造业中试服务网络。工业和信息化部办公厅日前印发《关于进一步加快制造业中试平台体系化布局和高水平建设的通知》,明确提出到2027年底,高水平中试平台力量进一步壮大,现代化中试平台体系基本建立,多主体参与、多领域布局、多层次服务的全国制造业中试服务网络初步形成。中试

788 EFLOPS 领跑全球!我国智能算力撑起 AI 创新 “加速度”

截至 2025 年 6 月底,我国智能算力规模达 788 百亿亿次 / 秒(EFLOPS),相当于全球 80 亿人用普通计算器连续运算 4000 年的总量。这一来自工业和信息化部的最新数据,与 1085 万标准机架、1680 艾字节存力共同印证:我国算力基础设施规模已稳居全球前列,正成为人工智能创新的核心引擎。千行百业 “算力赋能” 成效凸显在内蒙古伊利智慧牧场,计算机

中国6G专利全球第一,2025年互联网蓝皮书揭示数字中国新图景

一份备受全球互联网行业关注的年度发展成绩单,在乌镇峰会上如期发布。11月8日,在2025年世界互联网大会乌镇峰会上,由中国网络空间研究院牵头编撰的《中国互联网发展报告2025》和《世界互联网发展报告2025》蓝皮书正式发布。这两份已连续九年面向全球发布的权威报告,全景式展现了过去一年中国和世界互联网发展的新进展与新成就。报告中的一系列数据令人振奋:中国6G专利申请

2025科技创新与产业创新深度融合大会在长沙成功举办

11月1日,由中南大学主办的2025科技创新与产业创新深度融合大会暨中南大学校企联理事会会议在长沙开幕。大会深入贯彻党的二十届四中全会精神,落实“推动科技创新与产业创新深度融合,引领发展新质生产力”的战略部署,旨在充分发挥中南大学教育、科技、人才“三位一体”优势,搭建一个汇聚校友力量、链接产业需求与大学科创资源的高能级平台。

科技赋能健康 创新引领未来 浙江省盐业健康科技研究院挂牌成立

聚焦盐、泛盐产品、泛食品、大健康等领域,致力于开展产品研发、技术创新、产业融合、成果转化、行业研究和人才培养等业务,为浙盐集团转型发展和拓展第二增长曲线提升科研创新支撑,为助力中国盐行业高质量发展注入浙盐新动能。
返回
顶部