热点:

    碾压人类!Deepmind拆解定式玩星际2!

      [  中关村在线 原创  ]   作者:王征   |  责编:王征
    返回分页阅读本文导航

    1需要点基础围棋知识

            【中关村在线原创】在乌镇围棋大会之后直到最近几天,Deepmind的AlphaGo项目负责人之一Aja Huang博士结束了休假,又恰逢欧洲围棋大会,带给了全世界围棋爱好者一个“上帝视角”看三大复杂定式的解说,定式就此改写。然后,Deepmind宣布与暴雪联合弄出了机器学习打星际的API,连游戏也要沦陷了……

    碾压人类!Deepmind拆解定式玩星际2!

    需要点围棋基础知识

            在理解本文之前,我们需要铺垫一些基础知识。关于围棋基本规则的,大家可以通过网上的几分钟教学视频大致了解一下,简单来说,就是无气要被提子,两个眼才是活期。那么什么是定式呢?

    碾压人类!Deepmind拆解定式玩星际2!
    定式的落子位置、方向、次序不能错

            定式这个词起源于中国古代。古代围棋对弈前要在四个角的星位放上黑白各两个子,然后再对弈,规则与今天的并不一样。围棋素有“金角银边草肚皮”的说法,角部可以用更少的子围出更多的空地,但是围绕角部的战斗也更激烈。碾压人类!Deepmind拆解定式玩星际2!

    要想不吃亏,学棋这种定式大全要能熟背很多

            在以千百年计的对弈中,人们总结出来了很多对双方看起来“五五开”的落子位置与顺序,这个称之为定式。但围棋盘的交叉点很多,所以定式也多,《定式大全》是厚厚的2本书,而随着规则的进化,定式也在变化。在众多定式当中,有三个定式公认的难解,人类棋手表示搞不清复杂的变化,着三个定式分别是大雪崩定式、定式以及大斜定式。

    碾压人类!Deepmind拆解定式玩星际2!
    最接近上帝的AlphaGo是怎么评估定式的呢?

            那么作为最强的围棋AI的AlphaGo,是怎么看待这些定式的呢?最近几天,Aja Huang在脸书上公布了AlphaGo的看法,让人耳目一新,千百年来我们的定式居然下的不对!

    2AlphaGo VS 大雪崩定式

    AlphaGo VS 大雪崩定式

            大雪崩定式是常见的复杂定式,学围棋的时候要背好久。因为这个定式复杂变化多。我们先来看常见的:

    碾压人类!AlphaGo拆解围棋三大定式
    白16内拐常见变化

    碾压人类!AlphaGo拆解围棋三大定式
    黑1拐再3立之后黑9扳是最简明的下法,本图是内拐最简明并且最常见的下法

    碾压人类!AlphaGo拆解围棋三大定式
    黑9扳出也是一种下法,本图也是大雪崩中常见的一型

    碾压人类!AlphaGo拆解围棋三大定式
    白8不在10位粘先爬,是防止黑棋A位扳简明转身的下法,但是黑棋可以在11先贴,本图也是一直被认为大致两分

    碾压人类!AlphaGo拆解围棋三大定式
    这个变化AlphaGo认为黑棋亏了,但人类认为是两分的

    碾压人类!AlphaGo拆解围棋三大定式
    黑11打是阿法狗认为的最佳下法

    碾压人类!AlphaGo拆解围棋三大定式
    如果让AlphaGo强行下成大雪崩,给出的答案是:黑1立完以后5冷静的跳

    碾压人类!AlphaGo拆解围棋三大定式
    后续阿法狗认为,白棋不让黑棋7先手便宜到是关键,白8一定要反击,如此双方可战黑将不利减到最小

    碾压人类!AlphaGo拆解围棋三大定式
    黑如先手7位挡住,再9逼的话白棋会10位反击,如此也是白棋好一点的战斗

            那么AlphaGo是怎么认为的呢?AlphaGo并不会下大雪崩定式,于是给出了上门的判断,至此,困扰棋界多年的大雪崩定式被AlphaGo交易了一下,宣告新的走法,并且应该是基于全局的目前最优解。

    3AlphaGo VS 妖刀定式

    AlphaGo VS 妖刀定式

            AlphaGo对于妖道定式的全新理解与观念,是Aja Huang博士在自己的脸书上公布的,并且可以随意引用。在欧洲围棋大会,樊麾老师谈到了AlphaGo对大雪崩定式的看法。AlphaGo对妖刀定式又有什么看法呢?图1就是妖刀定式的基本型。在Master与职业棋士的对局中出现过图2的变化,AlphaGo认为白4靠不好,至黑19拆边,白棋的胜率下降近15个百分点。图3是AlphaGo所认为的双方最佳下法。如果图3中的黑5选择图4的挡下,至白12将形成战斗,AlphaGo认为白棋稍微有利。

    碾压人类!AlphaGo拆解围棋三大定式
    妖刀定式的基本型

    碾压人类!AlphaGo拆解围棋三大定式
    这是Master年初对局的变化,AlphaGo认为白4不好,胜率下降15%!!!

    碾压人类!AlphaGo拆解围棋三大定式
    AlphaGo认为的正解,这是五子棋吗?

    碾压人类!AlphaGo拆解围棋三大定式
    这个变化认为白子有利一点

    碾压人类!AlphaGo拆解围棋三大定式
    人类棋手的实战


            图3的三路跳已经有职业棋手在正式比赛中下过(图5)。在这个局部,AlphaGo的下法(白1至11)与党毅飞九段是一致的,并且AlphaGo认为全局仍然是双方均势。胜率下降15%是什么概念?保守估计换算成日韩规则,要亏一目以上,以后妖道将不再妖刀……

    4AlphaGo VS 大斜定式

    AlphaGo VS 大斜定式

            大斜定式是黄博士最后一个公布的AlphaGo眼中的“定式”,其实在AlphaGo眼中,就没有大斜定式,因为白的大飞它认为并不好。大家好,之前我们公布了AlphaGo对大雪崩定式与妖刀定式的看法,接着我们想向大家分享AlphaGo对大斜定式的看法。

    碾压人类!AlphaGo拆解围棋三大定式
    1,大斜定式基本型

    碾压人类!AlphaGo拆解围棋三大定式
    AlphaGo的选择,注意白3的位置,和大斜定式的落子位置不同……

    碾压人类!AlphaGo拆解围棋三大定式
    在这个场合下,AlphaGo会下大斜的走法,是一种场合下法而非定式

    碾压人类!AlphaGo拆解围棋三大定式
    AlphaGo认为双方的理想下法,白4飘逸灵动的布局让人耳目一新

    碾压人类!AlphaGo拆解围棋三大定式
    AlphaGo认为双方均势的一个变化

    碾压人类!AlphaGo拆解围棋三大定式
    另外一个均势的下法,强调黑8、10的手段

    碾压人类!AlphaGo拆解围棋三大定式
    这个变化白稍好

    碾压人类!AlphaGo拆解围棋三大定式
    黑稍差

            图1是大斜定式的基本型。简单来说,在一般的情况下AlphaGo认为大斜不如A位飞压,所以AlphaGo并不会下大斜定式。在这个局面,AlphaGo会选择图2的下法。不过,在三间低夹的情况下(图3),AlphaGo是会下大斜的,这个局部的棋形在Master与职业棋士的对局中也出现过。接下来形成很多种可能的变化,图4至图7都是AlphaGo所认为双方可能的下法,并且AlphaGo都认为双方均势。其中,图6与图7的黑8扳再黑10挡是AlphaGo所强调的手段。在图3的局面如果黑棋选择尖顶,会形成图8的变化,AlphaGo认为白棋稍好。图5的黑7如果扳,则会形成图9的变化,AlphaGo认为黑棋稍差。

            至此,人类认为三大难解的定式,AlphaGo都给出了自己的答案……

    5如果你看过《棋魂》

    如果你看过《棋魂》

            《棋魂》是曾经风靡一度的漫画和动画片。让人最伤心的莫过于随着虎次郎棋盘血迹的变淡,Sai也感知到自己要消失,这段当年的笔者看的直落泪……然而现在,作为围棋爱好者,也要怀着一样的心情送别AlphaGo.

    碾压人类!AlphaGo拆解围棋三大定式
    黄博士脸书上伤感的告白

            在今年乌镇的围棋峰会上,Deepmind就宣布中止了AlphaGo关于围棋项目的研究,AlphaGo进入倒计时。与柯洁三盘棋的复盘纪录片、新的论文以及AlphaGo的教学工具将给是AlphaGo的绝唱,江湖将只剩下一个需要仰望的高大背影离去。

            在谷歌第一篇论文的参考下,腾讯绝艺团队的围棋AI有了很大的进步,现在野狐平台上对职业棋手已经是胜多负少,甚至让子棋都有很高的胜率,这就是AlphaGo带给我们的变革,而在两年前,计算机围棋水平不过业余六段左右,被一线职业杀的落花流水,并且普遍认为计算机围棋距离赢职业九段还太远,现在这一切都已经被颠覆了。

    6Deepmind改玩星际了!

    Deepmind改玩星际了!

            前几天,Deepmind宣布,为了让全世界的开发者能够更好的开发出对抗即时战略游戏的AI,和暴雪娱乐一起,推出了关于星际2的机器学习开发套装。在Github上可以下载

    这些工具包括:

            脚本 AI API

            基于图像 AI API (功能图层):

            文档,示例代码和示例机器人

            支持离线AI与AI播放

            1v1天梯游戏的replay套件*

            支持Windows与Mac

            API完整功能的Linux软件

    碾压人类!AlphaGo拆解围棋三大定式
    人的动作行为与机器(Agent)模仿,非常难

            对于星际2的研究还处于很早期的阶段。由于玩家可以采用超过300种的基本行动,与Atari游戏相比,Atari游戏只有大约10个动作(例如上,下,左,右等),所以这对《星际争霸2》的空间研究带来了巨大挑战。除此之外,《星际争霸》中的操作动作是分级的,人们可以自由修改和扩充操作路径,即使是84x84的小屏幕尺寸,也可能有大约1亿个可能的动作。在新公布的API中,你可以自己动手来构建任务与模型,减少研发难度。

    碾压人类!AlphaGo拆解围棋三大定式
    AI实现的小区域操作

    碾压人类!AlphaGo拆解围棋三大定式
    AI眼中不同层的行动,非常复杂,目前只能在一个小区域里进行操作

            Deepmind声明,感谢暴雪提供的百万份天梯比赛录像,目前研发的自主学习AI尚处初级阶段,甚至在完整地图中,连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成,并且需要耗费大量时间运算才能进行下一步。

            不过这就是Deepmind研究的动力,同过机器学习来解决复杂的问题,并且实现方式是通过模拟人大脑的神经,不难不复杂的问题解决起来也没有成就感。年初在Deepmind的招聘广告上,要求的都是神经科学的博士以及计算机的博士,前不久还发表了相关的论文,认为这是实现通用型AI(比如既能下围棋、打星际,也能自动驾驶)的实现方式。我们迫不及待的期待这些AI研究机构能够开发出更多强力的AI、早日实现通用型AI,以解放我们的生产力。

    返回分页阅读本文导航
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • 喷墨打印机
    • 新品上市
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错