我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

首先,看到 Google DeepMind 的电脑围棋人工智慧 AlphaGo 战胜樊麾二段的消息,的确有些意外,当然,也有一些恐惧。因为我知道樊麾的实力确实是职业棋手,而且是不会放水的,所以新闻一定是真的。

再来,看了各方围棋界大量的在讨论这则新闻,非常精彩!第一时间,我脑中立刻浮现出一个人:Aja Huang 黄士杰。2007 年我就读台湾师範大学研究所期间,召集师大对围棋有兴趣的学弟妹来创办围棋社,当时联繫到了就读资讯工程研究所的 Aja 学长,他是业余 6 段,也是唯一一位在围棋社年纪比我大的学长,他很热心地来指导学弟妹,有关于围棋 AI 的知识都是那时听他说的。

那时围棋 AI 公认最强的程式是 Zen ,大约业余 5 段,而 Aja 学长所设计的程式 Erica 棋力也不俗,曾在荣获 TAAI 2009 年电脑围棋竞赛 19 路银牌及 9 路铜牌等佳绩。Aja 学长的硕士跟博士论文都是在台湾师範大学资讯工程研究所林顺喜教授的指导下完成,分别是 2003 年的硕士论文《电脑围棋打劫的策略》 和 2011 年的博士论文《应用于电脑围棋之蒙地卡罗树搜寻法的新啓发式算法》 ,博士论文中 Rémi Coulom 为共同指导教授。

我为什幺支持AlphaGo:近距离观察AlphaGo背后推手
我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

后排左一为 Aja 学长,照片为 2007 年台湾大专杯围棋赛师大围棋社合影

我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

我在 2007 年时第一次听 Aja 学长介绍蒙地卡罗树搜寻法,我后来也上网查了一下,原理应该是:通过随机抽样的方法,以随机事件出现的频率估计其机率,或者以抽样的数字特徵估算随机变量的数字特徵,并将其作为问题的解。假设我们要计算一个不规则图形的面积,那幺图形的不规则程度和分析性计算的複 杂 程度是成正比的。

假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。藉助电脑程式可以生成大量均匀分布坐标点,然后统计出图形内的点数,通过它们佔总点数的比例和坐标点生成範围的面积就可以求出图形面积。所以,Aja 学长说他们每天都餵程式吃很多职业棋士的棋谱,那时我隐约觉得,只要程式吃的棋谱够多,一定能比人类还要强,没想到,这天来的这幺快!

此外,这几年他们可能还加入了 policy network 及 value network 等关键技术。这次 Nature 杂 誌上关于 AlphaGo 的论文 ,有心的人应该会发现,第一作者是 David Silver & Aja Huang。

我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

看到 Aja 学长也是 AlphaGo 的研发团队之一,而且是并列第一作者,代表在团队中的贡献度不小,感到与有荣焉。我知道 Aja 学长博士毕业后到英国,2014 年曾托我买了整套 2013 年《围棋天地》杂 誌合刊本,专门寄到英国给他。Aja 学长为人低调,去年他加入 DeepMind 我也是最近才知道,而且在最近的报导中,他仍保持低调作风,一切贡献以团队为主,我在 Facebook 上想跟他多了解一些 AlphaGo 的讯息,他说是整个团队的贡献,而且很多事情目前都需要保密,等到三月跟李世 乭 九段比赛后之后才能说。

关于最近有网友发现在弈城上有一个 deepmind 的帐号,揣测是否就是用来测试 AlphaGo 程式的帐号。1 月 29 日,在台湾的 书呆弈讨论区 中,Aja 学长已正式回应,那个帐号是他个人在使用的。原文如下:

我为什幺支持AlphaGo:近距离观察AlphaGo背后推手
我为什幺支持AlphaGo:近距离观察AlphaGo背后推手

依照 Aja 学长这样的回覆,AlphaGo 的真正实力应该有职业水平,不容小觑。加上 Google 肯定是有一定的把握,从去年开始经过缜密的筹备及醖酿,直到今年初公开消息,是有完整準备的。当亚洲围棋强国在为梦百合世界大赛冠军争夺时,英国的 DeepMind 团队已悄然走在超越人类世界冠军的道路上。

三月对战李世 乭 ,AlphaGo 研发团队坚持不透漏各种保密协议的内容,这使我更看好 AlphaGo。我不是不支持人类,而是除了棋手个人的棋力强之外,我更相信人类集体智慧的结晶成果,即 Google DeepMind 团队合作的智慧。

这里我想说一个题外话,可能不是很重要,但是或许也可以从侧面多了解一点线索。一般人会觉得电脑工程师一定是整天面对着电脑和大量的数据,思考必须非常理性。能够开发出打败人类的围棋程式,研发者的思维一定非常严谨,做事一板一眼。但是接触了 Aja 学长,发现并不是这幺回事。他们也是人,而且,Aja 学长还很喜欢音乐,甚至自己能够用 MIDI 作曲并弹奏。我自己从小一直是学音乐的,听到 Aja 学长的作品都觉得有专业水平,而且非常感性,我今天翻出来听都还是耐人寻味。我在想,这样一位理性感性兼备的电脑工程师所在的团队,其开发出来的电脑程式,或许会想过把一些人性的元素放进去。

很高兴,Google 团队里有这幺一位台湾人,Aja 学长说要低调,因为 AlphaGo 的团队成员很多,不是他一个人做出来的。但是,为什幺我们不能说,AlphaGo 的团队成员很多,但是其中有一位台湾人,而且拥有业余6段的棋力也是团队中棋力最高的,可谓「台湾之光」!身为师大校友、台湾人,甚至亚洲人,Aja Huang 能在英国的团队中贡献所学,都应该为之喝采。此时,是否我们可以用一种更宽大的胸怀,这群研发团队代表人类突破了围棋人工智慧,大家应该共同身为如此神奇的人类而讚叹。就算 AlphaGo 至今尚未打败人类世界冠军,但我相信这一天并不会太久,我乐见其成。

欢迎加入「Inside」Line 官方帐号,关注最新创业、科技、网路、工作讯息
我为什幺支持AlphaGo:近距离观察AlphaGo背后推手