AlphaGo之父哈萨比斯:是天才,也是生活里的普通人

一般人对AlphaGo都多少有些了解,但对创造AlphaGo的人却不知道。

 |  砺石商业评论

文|砺石商业评论 高冬梅

Deepmind创始人戴密斯·哈萨比斯是这个时代公认的天才,他不仅是世界AI领域的第一人,还是世界国际象棋大师、电脑游戏设计师、企业家和神经学家,世界范围内再无第二个人能把这些身份融为一体。

2016年3月发生了一件震惊全人类的大事,AI程序AlphaGo打败了世界顶级围棋手李世石!

要知道围棋可是号称人类发明的最复杂的游戏。一时间,人工智能即将取代人类的流言四起,引发了对人工智能伦理问题的大讨论。

一般人对AlphaGo都多少有些了解,但对创造AlphaGo的人却不知道。

AlphaGo的创造者是个被称为“人类史上最聪明的人之一”的大牛人戴密斯·哈萨比斯(Demis Hassabis),他来自英国的伦敦,不仅是世界AI领域的第一人,还是世界国际象棋大师、电脑游戏设计师、企业家和神经学家,恐怕世界范围内再无第二个人能把这些身份融为一体。

天生我材必有用

哈萨比斯从小就好奇心强、喜欢新鲜事物、兴趣广泛,这种天赋特质让他不断主动去征服一个又一个新的领域,棋盘游戏、电子游戏、计算机编程无一不精。

1976年7月,哈萨比斯出生于一个多血统家庭,父亲是希腊裔塞浦路斯人,母亲则来自新加坡华人家庭;他是家中长子,下面还有一弟一妹。

哈萨比斯的父亲年轻时是一名创作歌手,后来他家还开过玩具店,再后来他们的父母又都做了教师。父母“放荡不羁”的生活方式对子女的人生影响深远。哈萨比斯的妹妹长大后成了一名作曲家和钢琴演奏家,弟弟成了创造性写作的作家,但哈萨比斯却在父母“不要循规蹈矩,坚持走自己的路”的教导下突变为家里的“黑天鹅”,做着和家庭气质完全不吻合的科技事业。

小时候在父母的玩具店里疯玩,小小年纪的哈萨比斯从那些五花八门的玩具和游戏中汲取营养,甚至自己创造一些玩具和游戏规则带领弟弟妹妹一起玩,“我就是这么学会游戏设计的”!所以,也许“创造”一个天才的做法是容许他自由地从生活里的点点滴滴中汲取营养,“野蛮生长”。

4岁时,哈萨比斯对父亲和舅舅玩的国际象棋产生了兴趣,很平常的生活小事在他身上却变成了一段传奇故事:在爱因斯坦刚把说话学利索的年龄,他却只用两周时间学下国际象棋就赢了大人。之后他就一路开挂,5岁开始参加英国国内比赛,6岁赢得伦敦8岁以下锦标赛冠军,9岁成为当时象棋领域世界第二的英国的11岁以下国家象棋队队长,之后于13岁时修炼成为他所在年龄段内世界排名第二的象棋大师。

因为表现太过出色,他被“互联网之父”、英国计算机科学家蒂姆·伯纳斯·李评价为是“这个星球上最聪明的人之一”。喜欢深思和内省是哈萨比斯根植在血液里的特点,“下象棋需要深思熟虑,你必须有意识地进行全盘规划,这个过程让人很着迷”。

8岁时,哈萨比斯用参加象棋比赛赢得的200英镑给自己买了人生中第一台计算机,对一般小孩儿来说,这只会是个特别一点的大玩具,但对哈萨比斯来说,这却是一个通向新世界的过道。父亲某次带他去伦敦最大的书店Foyles看书的时候,一本关于编程的书吸引了他。

与国际象棋“更像是一种训练”,提升的只是诸多技能相比,编程的“深邃”更能吸引哈萨比斯。在键盘和棋盘上纵横驰骋的8岁小孩儿思考的却是两个和他的年龄完全不相称的高难度问题:一是大脑是如何学习和完成复杂任务的;二是电脑是否也能做同样的事。

“电脑的神奇之处在于可以编程,这让我能够尽情释放我的创造力”,在反复编程的过程中,哈萨比斯对计算机的认识更加深入了,他觉得计算机是一个像飞机、火车一样重要的发明,是能够扩展人类脑力的工具,之后他又买了一台新电脑并将其拆开来仔细研究。

很快哈萨比斯便编写出了一款自己的计算机游戏。作为一个天才,哈萨比斯的最大特点是对新事物的好奇心永无止境。在“征服”计算机编程之后,11岁时他又接触了AI,并把其用到自己编写的游戏中。他编的一个黑白棋游戏的程序竟然战胜了他弟弟。

此后电脑编程和AI就成了他生活的重要组成部分,像磁铁一样牢牢吸引着他。厉害的是,这样深度沉迷的兴趣爱好并没影响他的学业,14岁时哈萨比斯提前两年完成了类似中国中学会考的考试GCSE,15岁时他的数学水平达到A level,16岁时高等数学、物理和化学都达到了A level,这一年他考入了剑桥大学计算机科学专业,因为年龄太小,剑桥建议他休息一年。

所以,17岁时哈萨比斯到英国的一家游戏工作室工作,师从传奇游戏设计师彼得·莫利纽克斯。在这里他开发了首款引入AI元素的电子游戏“ThemePark”,这款游戏销售百万份,不仅让哈萨比斯获得了足够的资金来完成学业,还让他坚定AI必将取得惊人发展的信念。

1994年,哈萨比斯开始在剑桥大学学习计算机科学。尽管是在人人艳羡的高校学习当时最前沿的学科,但哈萨比斯却觉得剑桥大学本科生只能学习AI如何去执行具体的任务,这样的“狭义AI”远远不够,他对开发涉足范围更广的“通用AI”更感兴趣,这为后来埋下了伏笔。

在剑桥大学的4年间,哈萨比斯还接触并迷上了古老的东方智力竞技游戏——围棋。1997年,20岁的哈萨比斯以极为少见的双重一级荣誉学位(adouble first-class honours degree)从剑桥皇后学院毕业,然后创建了自己的电子游戏公司Elixir,为包括微软在内的全球发行商创造游戏。

Elixir在高峰期曾雇用过60人,制作了获得英国电影和电视艺术学院奖提名的AI模拟游戏如“共和国:革命”和“邪恶天才”等,公司估值最高时为1200万英镑。然而,正当公司大火之时,恃才任性的哈萨比斯却觉得自己知识不够用,要回学校读书去。

于是2005年他到伦敦大学学院(UCL)就学,在那里进行关于大脑海马体和情景记忆的前沿学术研究,完成4年认知神经科学的学习后获得了博士学位。

哈萨比斯早年的这些经历,不管是国际象棋还是编程,哪一项单独拿出来都是别人难以望其项背的成就,但于他而言不过都是轻举轻放。这不得不让人感慨天才确实不同凡响、有才任性,同时也不得不承认,“人生没有白走的路,每一步都算数”,因为他前面所走的每一步都和他日后取得的举世瞩目的成就息息相关。

AlphaGo之父

围棋因为具有依赖直觉、需要策略性思考等特点,一直以来被看成是一个计算机很难攻克的游戏。记住棋子位置组合、评估棋盘局势、思考决定和执行赢棋的策略对于那时的计算机来说具有很大的难度,AI科学家们一直试图把AI元素带入围棋游戏,但研究了几十年都无法突破。

在大学期间,哈萨比斯第一次接触围棋就被这个人类开发的最复杂的游戏之一深深吸引了。1997年,超级电脑“深蓝”战胜国际象棋的世界冠军卡斯帕罗夫之时,他就想着将来自己一定要为围棋写一个程序来打败全人类的围棋手。

上大学时,因为对围绕“狭义AI”的教学课程有所质疑,哈萨比斯一次在课堂上对身边的朋友们说老师是在“给我们洗脑”,被老师逐出教室,这让他更坚定了以后自己要创办一家研究AI的公司的想法。

这些植根于遥远的大学时代的梦想终于在2011年哈萨比斯离开大学十几年后得以实现。这一年,哈萨比斯和发小一起创立了以“解决智能,使世界变得更美好”为理念的DeepMind公司。哈萨比斯把从象棋、围棋等智力竞技游戏中学到的规划思维运用到创业中,“在当时我就意识到这将是一个20年的计划”。

当时霍金和马斯克这两位科技界大佬成立了反AI联盟来共同反对AI的研究。早就认定AI必将取得惊人发展的哈萨比斯决定去说服霍金,在与这个心系全宇宙的科学家促膝长谈了4个小时之后,终于让他相信了AI将会让世界变得更美好,并对哈萨比斯的相关研究表示关注和支持。

而马斯克则成了哈萨比斯公司的早期投资人,他曾评价DeepMind:“它让我对事情发展的速度有了更清晰的了解,事情的发展速度正在加快且远远快于人们能够意识到的。也许你家的Roomba或其他什么会走动,但它不会接管世界。”

与其他科技类初创公司不同,DeepMind开发的是一种叫作“深度学习”的混合了来自神经科学和机器学习的研究和专业知识复杂的自学习算法,可以在给定数据集面前自我学习、胜任特定任务。2013年12月,成立仅4年、团队不到20人,没有任何具体产品问世的DeepMind通过一款新软件震惊了全球。

在机器学习研究大会上的演示中,这款软件通过不断试错、不断学习找出得分的玩法,在雅达利三款经典游戏——乒乓、打砖块和摩托大战的试玩过程中表现优异,其从零开始学习并能掌握复杂任务的能力让人们惊叹并为之点赞。

谷歌看完这个演示后当即以4亿英镑(约6.6亿美元)的价格收购了DeepMind,成为当时欧洲规模最大的一笔收购。拉里佩奇不仅对哈萨比斯赞不绝口,更称Deepmind的技术为“长久以来我见过的最令人兴奋的事件之一”。

被谷歌收购后,哈萨比斯与他的团队仍然争取到了极大的自主权,不仅公司办公地点仍保持在伦敦,还把自己构想中结合人脑神经元与大数据的AI围棋项目命名为AlphaGo。在这之后,AI在围棋游戏上的进展势如破竹。

2016年1月,DeepMind宣布AlphaGo攻克了围棋并正式挑战人类棋手。3月,AlphaGo打败了世界顶级围棋手李世石,这个消息让全世界都为之沸腾,就连哈萨比斯自己都表示“很震惊”,惊讶于AlphaGo居然有自己的棋路。从那时开始,AI将取代人类的声音不绝于耳。

初战告捷之后,哈萨比斯对AlphaGo进行架构升级。2016年末2017年初,AlphaGo在中国棋类网站上以“大师”(Master)为注册账号,在弈城围棋网和野狐围棋网上与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。

2017年5月,在中国乌镇围棋峰会上,AlphaGo与排名世界第一的世界围棋冠军柯洁对战,再次轻松获胜。至此,围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平。与柯洁一战之后,AlphaGo团队宣布其将不再参加围棋比赛。

2017年10月18日,DeepMind团队公布了代号为AlphaGo Zero的最强版阿尔法围棋。哈萨比斯一直以来都想创造一个能够像人类一样“学习”如何玩游戏并达到高水平的AI,在他看来,AlphaGo并非人们认为的“机器”,“就好像和人类一起探索宇宙的哈勃望远镜一样,AlphaGo是和我们一起探索围棋的哈勃”。

他一直极其坚定地相信AI能够帮助人类以更快速度取得更大突破。像哈萨比斯这类“谢耳朵”型男生通常都做事专注认真但木讷、不善沟通,但哈萨比斯的难能可贵之处就在于他在带领团队的过程中还培养了在多种环境下工作的能力并逐渐成长为善于表达的沟通者。

他经常以深入浅出的方式向大众介绍自己复杂的工作以及这些工作有何重要意义。他娓娓道来地去分解描述DeepMind是如何把传统AI技术和新技术进行结合的,比如在围棋上,DeepMind结合了传统“树搜索”的方法和模拟大脑神经元的“深度神经网络”,并巧妙地融合了多种不同的AI技术。

他曾在做客BBC时讲到,在AI领域深度学习和强化学习是最让他兴奋的两件事,前者用于识别,后者用于决策,AlphaGo就是两者结合的产物。DeepMind将采用处理长期规划的更深层次的强化学习技术引入AlphaGo中,而不是简单地采用预编程系统按既定步骤下棋。

依靠增强学习系统,AlphaGo可以汲取人类棋手比赛的营养,然后开创自己的打法。未来DeepMind还将整合记忆等其他功能,“将所有这些不同领域整合在一起是关键。因为我们感兴趣的算法能够将针对某一领域的学习经验应用至新的领域”。

新技术的引进使得AlphaGo Zero能力卓越,与同类程序对弈胜率高达99.8%。能够达成这样的结果除了新技术的原因,还源于哈萨比斯对“智力(Mind)”的认知,“AlphaGo以人类的方式去下棋。它也是按照人类的方式去学习的,像你和我一样,在不断练习中技能得以提高”。

曾经击败国际象棋冠军的深蓝,需要国际象棋大师和程序员组成团队来教它下棋的技巧。不断进化的AlphaGo Zero,就像一个初生的婴儿,在围棋世界里面对既定规则和要赢的目标,先学习走路,在无数次自我对抗中完善自我理解与认知,产生了直觉。慢慢地,它不仅能掌握人类大师下棋的技能,还会自己发展出一些新的技能,并用这些技能摧毁人类智慧的壁垒。

随着AlphaGo变得声名卓著,哈萨比斯也获得了许多荣誉,包括“亚洲奖”年度科技最佳贡献奖、英国皇家学会颁发的“穆拉德奖”(Mullard Award)、Nature杂志评选的“年度十大人物”、《时代》提名的全球最具影响力100人等等。

坚持探索通用AI

哈萨比斯给自己设定的终极目标是理解时间、黑洞以及人类在整个宇宙中的真正地位,通用AI是他到达这一星辰大海的途径。读博时,哈萨比斯就开始寻求在人类大脑中寻找新的AI算法的灵感了。

2007年,他发现5位失忆症患者因为海马体受损而很难想象未来,这证明了大脑中以往被认为只与过去有关的部分对于规划未来也至关重要。这些年,在AlphaGo获得了不起的成功的同时,哈萨比斯坚持对通用AI的探索,带领DeepMind做了很多大事:

2016年底,DeepMind开源了其核心深度学习平台之一“DeepMind Lab”供研究人员和开发者使用。这是一套为玩游戏的智能机器人打造的娱乐学习游戏平台。开源之后,全世界的研究人员和开发者都可以在上面发挥才智,为AI发展群策群力。

同一时间,DeepMind还公布了一台“可微分神经计算机”(DNC),简单理解就是这台机器既能像人类一样思考,又能像计算机一样进行高速运算和记忆数据,使得“机器”向“人”更迈进了一步。

为了让“机器”更像“人”,DeepMind在图像生成和语音生成领域也有超前研究,其2016年公布的语音生成系统WaveNet据称将计算机输出音频与人类自然语音差距缩小了50%。

医疗是哈萨比斯强调的AI需要落地的领域。DeepMind Health是智能医疗系统,其根据与英国全国医疗系统合作获取的数据打造基于AI的诊疗和症状判断帮助;Alpha Fold能根据基因序列来预测蛋白质的3D结构,在有“蛋白质结构预测奥运会”之称的CASP比赛中力压其他97个参赛者夺冠,为医疗领域变革、新药物研发奠定了理论基础。

DeepMind还运用AI系统优化了冷却系统的用电效率,据说一次性帮谷歌节省了上亿美金的开销。2018年底,Alpha Zero只用一个算法就在围棋、国际象棋和将棋三个领域奠定了霸主地位,并因此登上了《科学》封面,被评价“能够解决多个复杂问题的单一算法是创建通用机器学习系统,解决实际问题的重要一步”。

打造通用AI并不容易,DeepMind另辟蹊径,从现实生活中获得灵感,把解决方案提炼总结为“在许多不同的可能组合中选择正确的路径”。他认为,在可以预见的将来,AI会像科学家一样工作,提出假设并设计实验来验证假设,然后“取得可能获得诺贝尔奖的重大突破”。

为了推进通用AI发展进程,哈萨比斯甚至还非常少见地亲手写下长篇文章,发表在神经医学界的顶级刊物《神经》中,提出“假如我们的目标是开发出接近或同等于人类智慧的智能技术,那么就绝不能放弃对人脑的研究和理解,因为人脑是唯一能够证明这种智慧存在的证据”的鲜明观点。

目前DeepMind主要专注于两方面的研究,一个是对前面提到的强化学习的深度探索,可能会与机器决策、物理世界处理等AI领域的技术相结合;另一个是AI可解释性,既用心理学和神经科学来破解AI黑箱,同时也希望用强化学习等“AI原理”帮助探秘人类大脑。

这些研究的重要意义不在于得到了什么具体成果,而在于给跨学科研究做出了扎实的示范,证明了神经学补全AI的可行性,其非常关键的机器心智理论可能会成为主流研究方向。

而且,哈萨比斯认为,不仅AI需要向神经科学学习,对人类大脑与神经的研究今天也需要向AI学习。用强化学习机制来解释人脑的运作模式被实验证明解释是正确的,那么对人类大脑机制的研究与模仿应该也可以加强对强化学习技术的理解和升级。

未来与记忆相关的AI技术或将成为DeepMind的研究重点,情景记忆、工作记忆、长期学习等技术很有可能成为突破方向。哈萨比斯的畅想是:通过AI来了解人类智慧,让AI与人类大脑形成比对,或许可能“对人类心灵中一些最深刻和最持久的奥秘如创造力、梦想等产生深刻的见解,甚至能触及意识的本质”。

天才领导者和生活里的普通人

作为企业家的哈萨比斯领导着Deepmind一个包括400名博士的共700名员工的团队。被谷歌收购后,热爱自己家乡的哈萨比斯不愿搬迁,“我在北伦敦出生并长大,非常喜欢这座城市。伦敦没有任何理由无法容纳一家世界级的AI研究机构。我很骄傲我们能留在这里。”

DeepMind办公楼的所有房间都以人类史上的天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人等。办公环境是最有利于人们发挥创造力的设计,大楼的一楼有咖啡厅、有带冰箱的会客室、桌上有足球游戏机。楼顶是一个可以看到伦敦美好风景的露天平台,每周五晚上员工们在那里举办聚会。

公司汇聚了全世界最优秀的人才,类似波兰物理奥赛的冠军或者法国顶级的数学博士等,他们都看起来健康、愉快、酷,空气中彷佛都弥漫着知识的味道。哈萨比斯花很多时间思考“DeepMind作为一种算法的效率”,他坚信自己能把事情做得更出色,因为公司融合了最优秀的学术氛围和最令人兴奋的创业文化。

这样的环境和氛围使得即使在谷歌最大的竞争对手大举挖人之时,DeepMind的员工离职率也为0。作为公认的天才的哈萨比斯,并非电影里那种疯狂地企图做出一件轰动人类大事的科学家,或者生活中常见的表面木讷、内心狂野的“极客”,他很接地气。

和绝大多数普通人一样,他在该结婚的年龄成了家,妻子是一名意大利的分子生物学家,专注于阿兹海默症的研究。他们育有两个儿子,分别擅长科学和创造性活动。与绝大多数人的不同之处在于,哈萨比斯一天之内有两个工作日。

他上午十点左右到办公室协调、沟通、决策,引导公司保持世界领先地位。然后在晚上7点半搭乘地铁准时回到距离他儿时生活地点不远的家中,陪伴家人进餐,与孩子们一同游戏、读书或是帮他们完成家庭作业。在把两个孩子哄睡之后,他重新开始工作至凌晨一点,之后用几个小时来进行深度思考,直至凌晨四点入眠。

那些震惊世人的想法都是来自深夜的思考。“完全是个超人”的哈萨比斯认为工作和生活“是同一块画布的不同部分”,他阅读、看电影、听音乐,但最终还是会回到工作上,变成他思考问题的引子。“在我醒来的每个时刻,工作都是我思考的问题,或许在梦里也是如此,这也是我最有热情的一件事。”

哈萨比斯谈到工作时的样子能够让你相信工作真的是一件最有趣的事,“我感觉非常幸运,每个时刻我都在做自己真正坚信的事。否则,生命那么短暂,为何要去做这些?”所谓天才,其实很大的部分来自于专注。