综合

这篇文章告诉你AlphaGo隐藏弱点

作为战胜了人类围棋冠军的人工智能,AlphaGo强在小范围战斗,弱点在于对全局的判断。

李世石如何赢?从科技角度看,李世石必须在开局阶段建立优势,并且最好能够更频繁转移战场范围;未来,AlphaGo 会将人类棋手远远甩在身后。它就只能继续和自己玩了。

一、AlphaGo 是如何决定下每一步棋的?

企鹅智酷没有能够真的打开 AlphaGo 代码库,去检查它全面的运行逻辑。我们只能从已公开的权威论文中,来梳理这个迄今为止走进公众视野的最强大人工智能,是如何做出决策,战胜人类的。

简单说,AlphaGo 下的每一步棋,都依赖于概率。

1.当一开始,棋盘有大量空白区域,棋子较少时,AlphaGo会更愿意采用“固定策略”。

这种策略来自于 AlphaGo 自己模拟训练的数百万场棋局。这让 AlphaGo 心中有一个大概的最佳选择可能性,即下在点A和点B,哪个更好些。

在这个时候,AlphaGo 是通过经验来判断的。虽然这个经验不来自与人类,而是来自于它结合人类下棋方式学习后,自己和自己对弈的数百万经验值。但这种基于经验的判断,是人类挑战它的最佳机会——和“恐怖”的机器推演能力相比,经验,起码离人类更近一些。

为什么 AlphaGo 不在一开始就用蒙特卡罗算法,尽量穷尽所有可能性,去给出更可靠的“计算答案”,而不是“经验答案”呢?

我们猜测,一方面是当棋局尚未真正交锋时,各种选择的概率差不多,没必要做精确计算;另一方面,也为了节省时间。

2.当棋局有局部拼杀时,AlphaGo 的战力就升级了。棋局瞬息万变,李世石的下法,很可能是 AlphaGo 没有模拟过的。

这时候,AlphaGo 会不再聚焦于整个棋盘,而将计算精力缩到一个小范围。它会启动现场演算推理功能,即开始计算每一个落子位置的后续走势,来计算最佳一步。

这需要时间。所以,AlphaGo 在短兵相接时,不得不缩小观察范围,在局部启动现场计算。这虽然失去了一定的“大局观”,但换来了计算的效率,和电脑比,人脑的纯粹计算力是相对弱势的,所以,短兵相接,机器占大优势。

3.当局势需要兼顾大局和计算力时,AlphaGo 怎么办?

开局布局,AlphaGo 用经验;短兵相接,AlphaGo 用计算力。那么在局势复杂时,AlphaGo 的另一个特长就有用武之地了——兼顾大局观和计算能力。

AlphaGo是如何下棋的,AlphaGo 模拟了两个“自己”,然后随机落子计算每个位置对赢棋的价值。这种简单粗暴的计算是人类大脑无法训练的,只有机器可以肆无忌惮的这么做。

但和穷尽推演相比,这种价值估算并不是完全准确的。它是在兼顾时间和效率基础上,一种最适合的策略。这也是 AlphaGo的一个弱点。

二、AlphaGo 也会怀疑自己

我们觉得人机对战对李世石不公平的一个地方,是机器人不会受情绪影响,而人类棋手却时常受困于其中。

从单一棋局看,AlphaGo 每一步,都是它认定的最佳决策。但当你通过多局去观察 AlphaGo 时,会发现它快速分析促进它的进化。

原理很简单。AlphaGo 会怀疑自己,是因为在很多局面选择时,最优解不止一个,或者比较接近。

如果点A赢了,以后它会一直选择点A吗?这个我也不清楚,论文里没说。但从逻辑上推断,既然是经过了百万棋局的演算,那么一局的胜负,对于具体某点的概率提升,不会太明显。所以,AlphaGo 在应对同样局面时,它可能给出完全不同的下法——根据几个最优解,随机选择。

而这一点,也正是它可怕之处。连开发它的人类,都无法预测它的行为。因为你把随机函数的权利,交给了人工智能自己。

三、AlphaGo 为什么极少下臭棋?

我们通常把人工智能比作”高智商婴儿“,按照这个推断,AlphaGo 就算表现惊艳,但应该也会有下臭棋的时候。因为单纯的人工智能,是无法真的模拟人类思维的。

但 AlphaGo 没有丢过人。因为在一开始,它并非完全的“自学”。工程师们安排 AlphaGo 在网络对战平台上,与人类棋手不断下棋,用来学习人类下棋的风格和方式。当工程师们觉得 AlphaGo 足以“像个人类棋手”时,才让它开始自己和自己更疯狂的练棋。

你如果很早在KGS(网络围棋对战平台)上遇到过 AlphaGo ,那么,你可能有幸看到过 AlphaGo 还是婴儿时的样子。

四、AlphaGo 自己训练自己,而且效率吓人

前面提到了,和人类练棋不同,AlphaGo 在学会了人类下棋方式后,复制了两个自己,依托计算机性能优势,不断下棋,去丰富对局面判断力。这种效率非常之高,甚至已经超越了人类历史上所有的对弈棋局总数量。

这意味着 AlphaGo 会越来越”老练“。虽然它还是无法在每一局的每一步中,穷尽所有可能性,但它会不断通过训练积累大局观,而随着大局观提升,在实战中,它需要做现场精准推演的效率也会更聚焦——人类也就越来越难赢它。

在可以预见的未来,AlphaGo 会将人类棋手远远甩在后面。然后,它就只能在自己的世界里,自己和自己下棋玩了。

 

 

 


【责任编辑:赵洪】

分化世界中寻求合作 | 达沃斯2026:直面“新的竞争时代”

达沃斯白雪皑皑的山谷间,全球领袖们在一个充满地缘政治紧张的世界中寻找共同立场,中国声音为多边合作带来希望。世界经济论坛2026年年会今天在瑞士达沃斯开幕。来自130多个国家和地区的近3000名政商学界代表齐聚这座雪山小镇,在“对话的精神”主题下,探讨处于十字路口的世界经济前景。论坛总裁博尔格·布伦德坦言:“年会将在全球自二战以来最复杂的地缘政治背景下举行。” 随

包钢爆炸事故再现“安全周期律”,6年21起事故暴露管理沉疴

巨型球罐炸飞数公里,2死8失联84伤的惨痛代价背后,包钢集团6年内已发生21起安全事故,整改措施未能触及本质。1月18日15时03分,包钢股份板材厂炼钢作业部一个650立方米的饱和水、蒸汽球罐发生爆炸。截至19日,事故已造成2人死亡、8人失联、84人受伤,其中5人重伤。爆炸现场升起形似蘑菇的巨大白烟,冲击波震碎周边数公里内居民玻璃。事发监控画面显示,有巨大球状物

多地彻查“全网最忙五人组” 问责77人

从政府项目评审专家到行政执法处罚对象,从公益项目受助者到学术期刊编委,张吉惟、林国瑞、林玟书、林雅南、江奕云这五个源自网络人名大全的虚构角色,在过去四年间“活跃”于湖北、浙江、辽宁等四省多个官方公示文件中,被网友称为“全网最忙五人组”。事件曝光后引发社会对形式主义、官僚主义的强烈关注。1月15日最新追踪报道显示,多地已完成核心调查工作,累计问责77人,涉案资金全部追缴归还

企业年金新规落地:中小微企业职工迎来“第二养老金”

2026年开年,企业年金普惠制改革破冰,灵活缴费与简易程序为亿万职工铺就补充养老之路。1月15日,人力资源社会保障部、财政部联合发布《关于进一步做好企业年金工作的意见》,标志着我国补充养老保险制度进入普惠发展阶段。新规通过简化程序、灵活缴费等举措,旨在将企业年金覆盖面扩展至各类社会组织及中小微企业职工。截至2025年三季度,全国企业年金积累基金规模已达4.0

琼深社工携手启新程 共绘自贸港发展蓝图与民生暖心图景

岁序常易,华章日新。1月9日,海南省社会工作联合会秘书长王海燕受深圳社联理事长严书翔邀请,作为特邀嘉宾出席深圳市社联社工服务中心年会,与深圳同仁共话发展、共商合作新篇。年会现场,700余名社工的身影汇聚成一道亮丽的风景线。这场跨越岗位与领域的相聚,不仅彰显了社会工作者强烈的职业归属感,更凸显了深圳社联强大的行业凝聚力。在严书翔“党建为魂、专业为基”理念的引领下,深圳社联

燃情冰雪铸魂育人:哈体院“冰雪思政课”开启思政教育新范式

1月6日下午,由省委教育工委、省教育厅主办,哈尔滨体育学院(国家冰雪运动学院)承办的“黑土地上的精神力量”全省大中小学思政育人大课堂2026年首场“冰雪思政课”,在哈尔滨体育学院大学生滑冰馆精彩呈现。活动以“燃情冰雪砥砺报国志 接续奋斗筑梦新征程”为主题,省委教育工委常务副书记、省教育厅厅长许振宇出席,省教育厅相关负责同志、在哈高校及教育局代表、大中小学师生代表等1000余人现场

全国宣传部长会议:把经济宣传摆在新闻舆论工作重要位置

全国宣传部长会议1月5日在京召开,中共中央政治局常委、中央书记处书记蔡奇出席会议并发表讲话,强调要把经济宣传摆在重要位置,加强舆情应对与舆论引导,巩固壮大自信自强、团结奋进的主流思想舆论。新华社记者 殷博古 摄。蔡奇在讲话中指出,党的十八大以来,以习近平同志为核

网红玫瑰盐实为工业盐:重金属超标,监管存在空白

一款粉红色、号称“高营养价值”的玫瑰盐在网络平台热销,价格高达每斤240元,是普通食盐的数十倍,消费者不知道的是,这种所谓的“高端食盐”并不符合我国食用盐标准。近日,多个网络平台上出现粉红色的进口“玫瑰盐”,打着“纯天然无污染”、“富含矿物质”等营销标签迅速走红,成为不少消费者眼中的“高端食盐”。测评机构对五款“玫瑰盐”进行检测,发现均含有铅、砷、铬等重金属,且含

返璞归真,重塑生活:大喜村圆生活生态社区诠释当代乡居新范式

在快节奏的都市生活中,越来越多人渴望逃离钢筋水泥的桎梏,寻觅安放身心的净土。福建福州永泰大喜村,藏于群山之间,凭借澄澈溪流、浩渺湖面、葱郁树林与清新空气,成为一群追梦者的归宿。他们在此扎根打造圆生活生态社区,以回归本真的生活实验,诠释“乡村才是真正的奢侈”的内涵,更在城乡融合、南北联动与中外文化交流中,勾勒出独特的康养旅居新图景。

沪渝蓉高铁武宜段即将开通 汉口至宜昌最快69分钟可达

昨天上午10时,随着G9385次“复兴号”列车从汉口站驶出,沪渝蓉沿江高铁武汉至宜昌段(以下简称沪渝蓉高铁武宜段)媒体试乘体验活动启动。中国铁路武汉局集团有限公司党委宣传部,联合宜昌、荆门、天门市宣传部门,邀请中央省市媒体、网络达人等70余名记者,深入天门、钟祥、荆门、当阳、宜昌等沿线车站、城市开展行进式调研采访,亲身感受这条贯穿江汉平原的交通新动脉。

河北信息天路十年记:从“信号盲村”到“数字乡村”的蜕变

燕赵大地的信息版图被重绘,农村宽带用户增长逾千万,从太行山到渤海湾,数字化浪潮正席卷每个角落。塞罕坝机械林场深处,护林员王海涛结束上午巡护后,掏出手机与家人视频通话。而在几年前,这种随时在线的状态还是奢望——“想给家里打电话必须找到固定的信号点,提前约好时间”。这位“林二代”的亲身体验,正是河北打通农村和边远地区信息“大动脉”的缩影。2015年我国启动电

加勒比海对峙升级,马杜罗致信多国元首抗美能源胁迫

委内瑞拉外长希尔在首都加拉加斯宣读马杜罗签署的公报时,措辞严厉:“美国的封锁造成400万桶委内瑞拉原油无法正常运输,这是一种海盗行径。”马杜罗22日同时采取了三重外交行动——向拉美和加勒比地区国家元首致公开信、致函联合国、与俄罗斯外长进行战略协调。这位委内瑞拉总统正试图构建一个抵御美国能源胁迫的国际阵线。在致拉美和加勒比地区国家元首的公开信中,马杜罗谴责美国把能源当作战

特朗普外交系统“大换血”,29国大使遭撤换

美国外交系统正经历一场人事地震,特朗普政府要求近30名驻外大使在明年1月中旬前离任,波及全球三大洲。美国国务院近日向至少29个国家的外交使团负责人发出通知,要求他们在2026年1月15日或16日前离任。这些外交官均于拜登政府时期上任,此次大规模撤换行动主要影响美国驻非洲和亚洲的外交职位。美国外交官工会组织“外交人员协会”20日发表声明,对此次大规模撤换表示担忧,称“无故

雪舞梅江:柚香与碑影,一场红色与客韵的和鸣

记中国民主建国会广东省委会一支部及人资环专委会会员梅州红梦追忆行. 晨光切开薄雾时,泰安楼的轮廓如一块温润的墨,在雪色的宣纸上缓缓晕开。我们踏雪而来,脚印在青石板上开出转瞬即逝的花。这座石筑的方楼静立天地间,每一块卵石都像被时光反复摩挲的词语,在冬日的寂静中低语着客家人千年的迁徙史诗。掌心贴上石墙,冰凉之下,竟有地脉的温热暗暗传来——那是无数双手的温度,是炊烟的温度,是族谱在油灯下展开时,墨

涉台谬论引爆外交危机,高市早苗陷内外交困

日本国内抗议声浪与国际社会批评交织,高市早苗政府面临就任以来最严峻的政治危机。“高市此次在国会上的答辩,已经与以往日本政府在台湾问题上的答辩明显不同,等同于首次在国会表明一旦‘台湾有事’,日本将进入战争体制。”12月8日,日本民间团体“继承和发展村山谈话会”理事长藤田高景在东京记者会上宣读声明时如是说。十余名日本学界、前政府高官和媒体人士联合发声,强烈要求首相

欧盟批准150亿欧元防务计划,摆脱对美国军备依赖

欧洲防务自主迈出关键一步,新计划将重塑联盟的军工生产和战略采购模式。欧盟理事会12月8日正式批准“欧洲防务工业计划”,标志着欧盟在强化防务自主方面迈出关键一步。该计划将在2025年至2027年间投入150亿欧元,用于扩大防务生产能力、联合采购军备和发展供应链。这一计划首次为欧盟在国防领域的投资和联合采购奠定了法律框架基础。欧盟委员会主席冯德莱恩称这是欧盟朝着“2030年

沙南高速南平段正式建成通车 闽北交通网络再添强劲动脉

12月9日,福建南平的国高网福银联络线G7013沙县至南平高速公路南平段(简称“沙南高速南平段”)正式建成通车。这条横贯闽北的交通大动脉,将显著拉近顺昌、建阳等区域的时空距离,为沿线经济社会发展注入澎湃新动能。

宁古高速全线贯通:建管养协同铸精品 畅通山海绘新篇

12月6日中午12时,随着大甲互通至东峰枢纽互通段的正式通车,由福建高速路桥承建的宁德至古田高速公路实现全线贯通。作为福建省“十四五”综合交通运输发展专项规划的重点项目,宁古高速的建成不仅进一步完善了闽东区域高速公路网结构,更为沿线群众便捷出行、产业协同发展和区域融合注入了强劲动能。

闽籍专家送健康,京西义诊助惠民生 | 北京福建企业总商会医专委组织大型公益义诊活动

33名来自北京三甲医院的闽籍医学专家,带着专业医术和公益初心,走进京西门头沟。11月29日,北京福建企业总商会医学专家委员会组织33位资深医学专家,赴北京市门头沟区开展“闽籍专家送健康,京西义诊惠民生”大型公益义诊活动。这些来自北京协和医院、中日友好医院、北京大学人民医院等29家著名医院的专家团队,覆盖了骨科、神经内科、消化科、心内科、中医科等数十个专业领域,在北京同仁医
返回
顶部