别了,人类对手!中国围棋人工智能要“逼出”阿尔法狗

2018-08-15 10:28:23 来源:网络

原标题:别了,人类对手!中国围棋人工智能要“逼出”阿尔法狗

马博从未下过一盘完整的围棋,但他的“作品”很会下棋。
最近,在一场世界级的围棋大赛中,“绝艺”以7∶0战胜“星阵”获得冠军,俩选手都不是人。绝艺来自马博所在的腾讯AI团队,星阵的前身是清华大学开发的“神算子”。
参加本届世界人工智能围棋大赛前,绝艺曾对阵柯洁豪取13连胜,还以11连胜的战绩夺得第10届UEC杯计算机围棋大赛冠军,成为这项承载“攻克围棋”使命的AI赛事里最后一个冠军。它的名字来自杜牧诗句“绝艺如君天下少,闲人似我世间无”。
比起UEC杯,人工智能围棋大赛参赛门槛更高:参赛程序需要获得过世界人工智能围棋比赛(最近3年)前8名的成绩,或棋力在野狐围棋平台九段及以上。大赛吸引了包括日韩两国国家围棋队指定训练AI在内的众多高手,一度被外界认为是一场“众神之战”。

世界人工智能围棋大赛,“绝艺”大战“星阵”。
人类世界的围棋高手只是观众
2016年3月以来,在腾讯程序员马博的工作计算机里,绝艺几乎24小时都在跟自己下棋,每天对弈成千上万盘。
这样的对局数,是人类棋手一生几万盘棋难以企及的。而在19×19的方格世界中,存在着10171种有效对局盘,数量超过宇宙原子的总和。
两年前,李世石以1∶4败给阿尔法狗,后者的训练数据是3000万盘棋。人类不再心存“赢”的幻想。此后阿尔法狗又连胜中日韩高手60盘,其技艺“让人类棋手感到绝望”。
两周前,众多围棋国手来到他们熟悉的中国棋院对弈场,只当观众。马博和绝艺研发团队第一次走进中国围棋最高殿堂:“棋圣”聂卫平、“八冠王”古力、“天才少年”柯洁都曾在此留下名局。
AI棋手没有环肥燕瘦或迥异个性,它们不像聂卫平那样嗜烟如命,在烟雾缭绕中陷入棋局的沉思。也不会有柯洁的年少轻狂,对阵前辈李世石前放话“胜算95%”。它们是一行行代码和后台的计算资源,人类棋手要紧跟棋盘局势都显得十分吃力。
“比赛现场观众都是一些职业棋手。”马博对记者回忆,他将笔记本电脑接入比赛的对弈系统,点击屏幕上的“开始”后,就“与我无关”了,人类棋手则紧盯着对弈台后面的电子棋盘。虽然人类前辈在几千年前就已经开始黑白“搏杀”,并且一直是胜负的主角,但此刻的棋盘上还是有太多人类从未见过的“杀招”。
“我们和AI的思考层级不同,在计算量上存在着差距。”作为决赛解说嘉宾的古力表示,他曾和绝艺有过数次交手,但对手成长之快,他始料未及。3年前,风头正盛的日本围棋AI“DeepZenGo”开发者加藤英树曾表示,人工智能攻克围棋至少需要10年。

世界人工智能围棋大赛。
我们是人类,人类会犯错误
两年前的绝艺还只是业余五段的水平,如今古力已用“不可思议”来解说昔日对手的战术了。
就在4个月前,古力在个人微博上晒出“绝艺正式成为中国国家围棋队训练专用AI”画面,并配文“国家队的训练方式跟上了时代步伐”,而此前的中国国家队并没有专用AI。
在赛场上,马博偶尔也会听听解说嘉宾聊起的围棋段子,或是走下对弈台喝喝茶,和罗洗河聊聊天——后者是绝艺的围棋顾问,也是开发团队中唯一能下完一盘围棋的人。
这位曾在2006年1月终结“李昌镐时代”的传奇棋士,也是截至目前和绝艺对弈最多次的人类。他需要通过与之对弈发现漏洞,将它打造成“围棋上帝”。
比起棋盘走势,马博和他的对手更关心各自电脑屏幕上闪现出来的一行行胜率计算结果,那是AI通过算法分析落子位置得出的获胜概率。屏幕上胜率持续上升,意味着此前的算法分析没有出现失误,布局意图正逐步实现。但随着对手落下一颗棋子,局面的胜率就会被算法重新统计。
绝艺使用的算法框架并非马博团队的首创。“人工智能领域有很多公开的算法框架,按照这些框架很快就能做出产品。但如果要达到更高的胜率,就要在算法细节和计算能力上努力了。” 虽然马博为绝艺写下了第一行代码,但其核心算法框架来自于Deep Mind团队。
2016年1月28日,谷歌旗下的Deep Mind团队在《自然》杂志发表论文,介绍了阿尔法狗程序的技术细节,还附带它以5∶0横扫三届欧洲围棋冠军樊麾二段的喜讯。
樊麾并没有像1997年国际象棋世界冠军卡斯帕罗夫那样,在被IBM研发的象棋AI“深蓝”击败以后,指责这款电脑程序作弊,并要求重新比赛。
他也并没有像这位俄罗斯棋王一样,有过3次击败“棋桌对面新型智慧”的战绩,并坦言“自己还有几年的安稳日子”。面对比国际象棋10120种变化更为复杂的围棋,樊麾的劣势要更加明显。
“人类是会犯错误的,因为我们是人类。”阿尔法狗在樊麾眼里像一面没有任何情绪波动的墙,稳稳地堵住了他调动的一切经验和智力攻势,也压住了一名顶尖棋手求胜的欲望。如果没有事先告诉他阿尔法狗是程序的话,樊麾甚至会认为对方是一个棋路清奇的人类棋手。
一年后的乌镇棋局,阿尔法狗又以3∶0的战绩强势逼哭了棋盘对面的柯洁,这位围棋史上最年轻的五冠王第一次在赛场上失控落泪。在离开对弈台的20分钟里,他觉得自己就像一个“无助的孩子”,对过程和结局都感到绝望。
“对手非常完美,没有任何缺陷和失误,而且也没有任何心态上的波动。”柯洁赛后曾表示。阿尔法狗也在此战后成为中国第43位中国围棋九段获得者,它的42位九段前辈都是人类。

阿尔法狗战胜柯洁。
人工智能下围棋不需要人类对手了
“没有情绪”或许是人们对阿尔法狗最为感性的理解了。
实际上,阿尔法狗有着两个强大的决策网络:Policy Network(策略网络)和Value Network(价值网络)。前者主要判断在当前局面下,下一步棋该怎么走。
作出这样的判断,不仅需要提前输入人类已探索出的大量棋谱,还要让其能够通过大量的自我对局结果来学习评价每一步棋的优劣。后者则相当于人类棋手的“大局观”,阿尔法狗在自我对局中会逐渐学习评价整体局面的走势。
第一个网络在从人类棋手已有的走法中筛选出若干种可能的同时,也会通过蒙特卡洛树搜索来展开这些走法并给出优劣判断。蒙特卡洛树搜索正是围棋AI算法的核心之一。在对弈时,它会随机选择一种落子路径并向下展开,如果这种落子路径能够获胜,就会被赋予一定的权重,并在下次随机选择路径时被优先选中。
第二个网络则会利用整体局面的判断删除那些无法得到高胜率的落子路径,同时也能根据下一步棋将导致的新局面的优劣,给出落子建议。最终的落子决定则是由两个网络被平均加权后作出的。
这种既有局部判断又作全盘分析的思考方式已经接近人类棋手的思维。虽然棋手选择的落子位置并非由局部和全盘的思考加权平均决定,但DeepMind在论文中却得出了这样的结论:两个大脑取平均的结果比依赖两者各自得出的结果要好很多。
2017年10月,在宣布阿尔法狗退役后的5个月后,DeepMind又在《自然》杂志发表最新论文。他们最新的“狗”在3天时间内积累了490万盘围棋赛的训练数据,并以100∶0完胜曾经打败过李世石、柯洁等人的——过去的那个自己。
此时的阿尔法狗已经完全不再需要人类棋手的定式了,所有的训练都是通过自我博弈增强学习来完成。
马博团队先后借鉴了Deep Mind两篇论文,但他们已经不再热衷战胜人类棋手,以证明绝艺的实力了。很多围棋界的棋手期待绝艺能逼出阿尔法狗与之一战,探索围棋之道的极限。
这样的众望,人类曾寄托于吴清源、聂卫平、李昌镐……当然,也给过出战阿尔法狗之前的人类棋手。,别了,人类对手天福茗茶 !中国围棋人工智能要“逼出”阿尔法狗

相关:

东部战区领导尹洪文职务明确:副政委兼政治工作部主任原标题:东部战区领导尹洪文职务明确:副政委兼政治工作部主任至迟于今年2月担任东部战区领导的尹洪文,其具体职务现已获官方媒体披露。 据法制网8月13日报道,东部战区党委政法委会同驻地六省(市)党委政法委13日联合召开战区成立以来首次涉军维权工作协作会议。东部战区政治委员何平、副政治委员兼政治工作部主任尹洪文、解放军军事法院副院长程东方出席会议并讲话。 上述报道信息显示,尹洪文已担任东部战区副政委兼..

6小时两次弄丢儿子 这样的妈妈敢不敢再马虎些?民警在安抚被弄丢的孩子。在半天时间里,竟让两岁的儿子在火车站里走丢了两次,这样的妈妈敢不敢再马虎些?昨天上午,铁路宁波站派出所民警向记者讲起此事时,连连摇头。上个洗手间丢了孩子13日晚约6点20分,民警陈凯强巡逻至二楼北进口附近,远远地听到孩子的哭声。仔细一看,安检口旁,有个小朋友正在号啕大哭,一名女安检员正陪着他。“快来快来,这个小朋友好像走丢了。”安检员看到有民警,赶紧招呼。陈凯强走过去一看,小..

发补助啦!20亿资金下达河北多市县,分配表→原标题:发补助啦!20亿资金下达河北多市县,分配表→ 近日,省财政厅发布关于下达2018年中央农业生产发展资金(地下水超采综合治理资金)的通知,本次下达6市及雄安新区,共10亿元,用于支持开展地下水超采综合治理(季节性休耕)工作。近日,省财政厅发布关于下达2018年中央财政林业生态保护恢复资金的通知,本次下达8市,共6675.72万元↓↓↓近日,省财政厅发布关于下达2018年中央财政林业改革发展补助资金的..

孩子和二人世界真的只能二选一吗原标题:孩子和二人世界真的只能二选一吗 溪苒妈,亲子学堂编辑,90后新晋宝妈,溪苒是一个近9个月的高冷狮子座girl。在育儿上,溪苒妈希望结合溪苒的性格,在保持她的天性上做适当的科学育儿引导。并会定期和大家分享,她和溪苒一起成长的点滴。 孩子和两人世界,不会是道选择题,因为2+1的世界刚刚好。 这几天办公室的小哥哥、小姐姐们讨论最多的话题是七夕。大家不遗余力地,花式为读者准备各种礼物清单。适合送..

古道上的意大利③︱卡诺莎的玛蒂尔达:联姻、反抗与复仇原标题:古道上的意大利③︱卡诺莎的玛蒂尔达:联姻、反抗与复仇在意大利中北部的艾米莉亚大道上,有一座城市叫做雷焦-艾米莉亚(Reggio-Emilia),在它的西南方向20多公里、南枕亚平宁山脉的地方,有个坐落在小山丘上的城堡,破旧、低调而貌不惊人,几乎无法引起游客的关注。这座城堡没有火车通达,如果乘坐公交要换乘两三次,只有开车最为方便,半个多小时即可到达。专门去探访的人可能会大失所望,只有一座孤零零的小山丘,几..

1年多过去了,雄安为啥还没启动大规模建设?原标题:一年多过去了,雄安为啥还没启动大规模建设?清华教授的这篇文章讲透了据河北清华发展研究院网站消息,7月22日,雄安新区规划设计专家尹稚老师在“清华大学雄安新区规划建设发展高峰论坛”上,以深刻而独到的视角为来宾们做了主题为“雄安新区模式与城乡建设的未来”的报告。以下为讲话全篇:各位早上好,我先把话说到前头,我自打参与雄安新区规划以后签的保密协议都有一大沓子了。对不起各位今天我不能放任何一张图纸..

可喜可贺!在缅甸又发现一个世界稀有的“宝贝” 由于栖息地的减少、人类的捕捉与猎杀、环境污染和疾病等原因,世界上现存的赤颈鹤数量越来越少。赤颈鹤作为世界濒危物种之一,被多个国家列为濒危保护动物,缅甸也不例外。近年来,缅甸动物保护协会也一直在开展对赤颈鹤的研究保护工作。 【缅甸中文网讯】据缅甸动物保护协会(国家计划)的消息,伊江三角洲大约还剩余200-400只世界濒临灭绝的赤颈鹤。 林业局与敏玛那岛野生动物禁猎林区动物保护协会(国家计划)联合..

注意,后半周或有新台风! 会再次奔袭江浙沪吗?浙江在线8月15日讯(浙江在线见习记者来逸晨设计张源)最近,在西太平洋上演的风界一年一度“选秀女”达到高潮,出现了几年难得一见的“四旋共舞”。这“四美”分别是:“异域美女”17号台风“赫克托”,出身“飓风”的她来自“神秘”的东方,刚于昨日凌晨从东太平洋入境西太平洋;转身奔向日本的第15号台风“丽琶”,目前看来她对我国海域并无影响;脚步凌乱的“醉态丽人” 16号台风“贝碧嘉”,在广东近海布雨徘徊多日后,终..

缅甸掸邦大佬批评昂山素季民盟政府:言行不一,不讲信用 【缅甸中文网讯】日前,仰光市育德旦大厅举办了1990年人民议员代表组及同盟国家政治力量代表大会。会议结束后,与民盟结为同盟多年的吴坤吞乌评论称,民盟政府及议会言行不一,不守信用。 据悉,吴坤吞乌为掸民族民主联盟主席及1990年大选获胜人民议员代表组主席,其于1990年大选时,就与民盟结盟。目前,吴坤吞乌因身体健康原因,暂时从掸民族民主联盟退出休息。 吴坤吞乌在会议上称,民盟政府和议会说是往民主化..

非法盗采长江江砂案:采砂者昼伏夜出收益高得惊人原标题:非法盗采长江江砂案:采砂者昼伏夜出收益高得惊人 来源:正义网 江苏镇江地处长江下游,有着270公里的自然滨江岸线,这里江面开阔,江水平缓,沉积了大量优质江砂,这些江砂成了非法采砂者觊觎的肥肉。近年来,镇江境内长江非法采砂猖獗、屡禁不止。2017年,镇江市检察院专门组织开展打击长江非法采砂专项行动,监督公安机关对数十名非法采砂人员立案侦查,并向纪委及周边检察机关移送案件线索35件。齐伟等26人特大非..