碾压人类！Deepmind拆解定式玩星际2！

2017-08-14 05:37:01 [ 中关村在线原创 ] 作者：王征 | 责编：王征

1需要点基础围棋知识

【中关村在线原创】在乌镇围棋大会之后直到最近几天，Deepmind的AlphaGo项目负责人之一Aja Huang博士结束了休假，又恰逢欧洲围棋大会，带给了全世界围棋爱好者一个“上帝视角”看三大复杂定式的解说，定式就此改写。然后，Deepmind宣布与暴雪联合弄出了机器学习打星际的API，连游戏也要沦陷了……

需要点围棋基础知识

在理解本文之前，我们需要铺垫一些基础知识。关于围棋基本规则的，大家可以通过网上的几分钟教学视频大致了解一下，简单来说，就是无气要被提子，两个眼才是活期。那么什么是定式呢？

定式的落子位置、方向、次序不能错

定式这个词起源于中国古代。古代围棋对弈前要在四个角的星位放上黑白各两个子，然后再对弈，规则与今天的并不一样。围棋素有“金角银边草肚皮”的说法，角部可以用更少的子围出更多的空地，但是围绕角部的战斗也更激烈。

要想不吃亏，学棋这种定式大全要能熟背很多

在以千百年计的对弈中，人们总结出来了很多对双方看起来“五五开”的落子位置与顺序，这个称之为定式。但围棋盘的交叉点很多，所以定式也多，《定式大全》是厚厚的2本书，而随着规则的进化，定式也在变化。在众多定式当中，有三个定式公认的难解，人类棋手表示搞不清复杂的变化，着三个定式分别是大雪崩定式、定式以及大斜定式。

最接近上帝的AlphaGo是怎么评估定式的呢？

那么作为最强的围棋AI的AlphaGo，是怎么看待这些定式的呢？最近几天，Aja Huang在脸书上公布了AlphaGo的看法，让人耳目一新，千百年来我们的定式居然下的不对！

2AlphaGo VS 大雪崩定式

AlphaGo VS 大雪崩定式

大雪崩定式是常见的复杂定式，学围棋的时候要背好久。因为这个定式复杂变化多。我们先来看常见的：

碾压人类！AlphaGo拆解围棋三大定式
白16内拐常见变化

黑1拐再3立之后黑9扳是最简明的下法，本图是内拐最简明并且最常见的下法

黑9扳出也是一种下法，本图也是大雪崩中常见的一型

白8不在10位粘先爬，是防止黑棋A位扳简明转身的下法，但是黑棋可以在11先贴，本图也是一直被认为大致两分

这个变化AlphaGo认为黑棋亏了，但人类认为是两分的

黑11打是阿法狗认为的最佳下法

如果让AlphaGo强行下成大雪崩，给出的答案是：黑1立完以后5冷静的跳

后续阿法狗认为，白棋不让黑棋7先手便宜到是关键，白8一定要反击，如此双方可战黑将不利减到最小

黑如先手7位挡住，再9逼的话白棋会10位反击，如此也是白棋好一点的战斗

那么AlphaGo是怎么认为的呢？AlphaGo并不会下大雪崩定式，于是给出了上门的判断，至此，困扰棋界多年的大雪崩定式被AlphaGo交易了一下，宣告新的走法，并且应该是基于全局的目前最优解。

3AlphaGo VS 妖刀定式

AlphaGo VS 妖刀定式

AlphaGo对于妖道定式的全新理解与观念，是Aja Huang博士在自己的脸书上公布的，并且可以随意引用。在欧洲围棋大会，樊麾老师谈到了AlphaGo对大雪崩定式的看法。AlphaGo对妖刀定式又有什么看法呢？图1就是妖刀定式的基本型。在Master与职业棋士的对局中出现过图2的变化，AlphaGo认为白4靠不好，至黑19拆边，白棋的胜率下降近15个百分点。图3是AlphaGo所认为的双方最佳下法。如果图3中的黑5选择图4的挡下，至白12将形成战斗，AlphaGo认为白棋稍微有利。

碾压人类！AlphaGo拆解围棋三大定式
妖刀定式的基本型

这是Master年初对局的变化，AlphaGo认为白4不好，胜率下降15%！！！

AlphaGo认为的正解，这是五子棋吗？

这个变化认为白子有利一点

人类棋手的实战

图3的三路跳已经有职业棋手在正式比赛中下过(图5)。在这个局部，AlphaGo的下法(白1至11)与党毅飞九段是一致的，并且AlphaGo认为全局仍然是双方均势。胜率下降15%是什么概念？保守估计换算成日韩规则，要亏一目以上，以后妖道将不再妖刀……

4AlphaGo VS 大斜定式

AlphaGo VS 大斜定式

大斜定式是黄博士最后一个公布的AlphaGo眼中的“定式”，其实在AlphaGo眼中，就没有大斜定式，因为白的大飞它认为并不好。大家好，之前我们公布了AlphaGo对大雪崩定式与妖刀定式的看法，接着我们想向大家分享AlphaGo对大斜定式的看法。

碾压人类！AlphaGo拆解围棋三大定式
1，大斜定式基本型

AlphaGo的选择，注意白3的位置，和大斜定式的落子位置不同……

在这个场合下，AlphaGo会下大斜的走法，是一种场合下法而非定式

AlphaGo认为双方的理想下法，白4飘逸灵动的布局让人耳目一新

AlphaGo认为双方均势的一个变化

另外一个均势的下法，强调黑8、10的手段

这个变化白稍好

黑稍差

图1是大斜定式的基本型。简单来说，在一般的情况下AlphaGo认为大斜不如A位飞压，所以AlphaGo并不会下大斜定式。在这个局面，AlphaGo会选择图2的下法。不过，在三间低夹的情况下(图3)，AlphaGo是会下大斜的，这个局部的棋形在Master与职业棋士的对局中也出现过。接下来形成很多种可能的变化，图4至图7都是AlphaGo所认为双方可能的下法，并且AlphaGo都认为双方均势。其中，图6与图7的黑8扳再黑10挡是AlphaGo所强调的手段。在图3的局面如果黑棋选择尖顶，会形成图8的变化，AlphaGo认为白棋稍好。图5的黑7如果扳，则会形成图9的变化，AlphaGo认为黑棋稍差。

至此，人类认为三大难解的定式，AlphaGo都给出了自己的答案……

5如果你看过《棋魂》

如果你看过《棋魂》

《棋魂》是曾经风靡一度的漫画和动画片。让人最伤心的莫过于随着虎次郎棋盘血迹的变淡，Sai也感知到自己要消失，这段当年的笔者看的直落泪……然而现在，作为围棋爱好者，也要怀着一样的心情送别AlphaGo.

碾压人类！AlphaGo拆解围棋三大定式
黄博士脸书上伤感的告白

在今年乌镇的围棋峰会上，Deepmind就宣布中止了AlphaGo关于围棋项目的研究，AlphaGo进入倒计时。与柯洁三盘棋的复盘纪录片、新的论文以及AlphaGo的教学工具将给是AlphaGo的绝唱，江湖将只剩下一个需要仰望的高大背影离去。

在谷歌第一篇论文的参考下，腾讯绝艺团队的围棋AI有了很大的进步，现在野狐平台上对职业棋手已经是胜多负少，甚至让子棋都有很高的胜率，这就是AlphaGo带给我们的变革，而在两年前，计算机围棋水平不过业余六段左右，被一线职业杀的落花流水，并且普遍认为计算机围棋距离赢职业九段还太远，现在这一切都已经被颠覆了。

6Deepmind改玩星际了！

Deepmind改玩星际了！

前几天，Deepmind宣布，为了让全世界的开发者能够更好的开发出对抗即时战略游戏的AI，和暴雪娱乐一起，推出了关于星际2的机器学习开发套装。在Github上可以下载。

这些工具包括：

脚本 AI API

基于图像 AI API （功能图层）：

文档，示例代码和示例机器人

支持离线AI与AI播放

1v1天梯游戏的replay套件*

支持Windows与Mac

API完整功能的Linux软件包

碾压人类！AlphaGo拆解围棋三大定式
人的动作行为与机器（Agent）模仿，非常难

对于星际2的研究还处于很早期的阶段。由于玩家可以采用超过300种的基本行动，与Atari游戏相比，Atari游戏只有大约10个动作（例如上，下，左，右等），所以这对《星际争霸2》的空间研究带来了巨大挑战。除此之外，《星际争霸》中的操作动作是分级的，人们可以自由修改和扩充操作路径，即使是84x84的小屏幕尺寸，也可能有大约1亿个可能的动作。在新公布的API中，你可以自己动手来构建任务与模型，减少研发难度。

AI实现的小区域操作

AI眼中不同层的行动，非常复杂，目前只能在一个小区域里进行操作

Deepmind声明，感谢暴雪提供的百万份天梯比赛录像，目前研发的自主学习AI尚处初级阶段，甚至在完整地图中，连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成，并且需要耗费大量时间运算才能进行下一步。

不过这就是Deepmind研究的动力，同过机器学习来解决复杂的问题，并且实现方式是通过模拟人大脑的神经，不难不复杂的问题解决起来也没有成就感。年初在Deepmind的招聘广告上，要求的都是神经科学的博士以及计算机的博士，前不久还发表了相关的论文，认为这是实现通用型AI（比如既能下围棋、打星际，也能自动驾驶）的实现方式。我们迫不及待的期待这些AI研究机构能够开发出更多强力的AI、早日实现通用型AI，以解放我们的生产力。