1月6日,江苏卫视《最强大脑》就以“匆匆那年”为主题,上演了中国版的首次人机对决:31.02秒就可记忆一副无规则扑克牌的人类代表王峰,迎战百度人工智能机器人“小度”。双方先比拼人脸识别——仅凭一张童年照认出十几年后的少女,包括一对双胞胎;第二局,则要从30张毕业照中,即约1500个花生米大小的头像中,根据长大后的男生照片找出儿时的他。
同“Master”横扫人类围棋大师一样,人工智能再一次战胜了人类。百度大脑如何分辨长大后的双胞胎?它和Master哪个更厉害?它还拥有哪些神奇的功能?《经济日报》记者就此采访了百度大脑的技术团队,得出迄今为止最靠谱的答案。
小度认出了长大后的双胞胎之一,人类没有
都说“女大十八变”,比赛中,选手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼里,长幼两张人脸被分解成一个个相似的五官形状,此中除了运用人类的记忆力、推理能力,还有人类的本能。
“千百万年进化过程中,人脑进化出一个专门的区域负责人脸识别(简称FFA)。”百度首席科学家吴恩达被戏称为小度的“爸爸”,他举例说,“一个3岁的孩子看见妈妈时,不管妈妈是微笑、生气,睁着眼、闭着眼,长头发、短头发,穿什么衣服,孩子都可以轻易认出这是妈妈”。
但是,人脑为何一瞬间就能完成人脸识别,至今全世界的科学家也说不清背后的原理。因此,小度对人脸的识别不是模仿人脑,而是更多基于数据分析和深度学习。
在人工智能“眼里”,它看见的不是一个图形,而是一些按数字1和0记录的像素点。因此,机器会把人脸分为很多个小方块来识别。根据眼睛、眉毛、鼻子等器官的特征及其相互之间的几何位置关系,计算总结出这些点,最终构成了一张人脸。
如果要辨认这张人脸是谁,机器还要提取面部特征进行特征建模,与需要对比的人脸比较后,根据相似程度,对人脸的身份信息进行判断。一旦人的面貌发生任何变化,哪怕只是轻微仰头,灯光变换,机器都需要重新计算一遍。
据百度深度学习实验室主任林元庆介绍,“为做到尽量精确,在百度的技术中,我们会在人脸上取72个点,最后通过神经网络计算,得到128维特征,每一维特征是人脸上的某种特点,比如狮子鼻”。
至于如何从72个点的信息里总结出128种特征,并将每种特征与人脸的特点一一对应,这是由深度学习从海量数据里自动学到的。换句话说,工程师并不知道这种特征究竟是“狮子鼻”,还是别的某种甚至没有词汇形容的特征。
计算机辨认人脸原本就非常困难,但在《最强大脑》的舞台上,又增加了时间跨度。现场嘉宾、北京大学心理学系教授魏坤琳解释说,成长中的人脸变化极大,一个人一辈子连身份证都要换好几次。对于人类来说,可以依靠整体神态、气质等无法言说的因素去主观猜测,但机器不会猜,只能根据深度学习得来的规律计算。
据林元庆介绍,为了备战,团队2个月里让小度看了200万个人的2亿张照片,并辅以少量有时间跨度的照片。经过“训练”,小度自己总结出了一种不为人所知的人脸随年龄变化的规律。
在遇到蜜蜂少女队的双胞胎时,人类和人工智能的差别就显示出来了:姐妹花长大后外表几乎一模一样,连姐妹俩自己都分辨不出旧照片里的人是谁,王峰用肉眼也无法辨别她们的五官特征。但是,在人工智能的计算方式下,虽然她们的面部骨骼极其相似,差别特别细微,总还是有一点区别。最终,小度计算出,其中一位跟老照片里的小姑娘有72.98%的相似度,另一位有72.99%,差距仅为万分之一。
百度大脑认脸和Master下棋,哪个更难?
很巧合,在百度大脑参加最强大脑比赛的几乎同一时间,曾经横扫国际象棋界的阿尔法狗改名Master,重出江湖,以60场连胜顶尖围棋手的傲人成绩,震惊了全世界。
这也让不少人好奇:如果Master和百度大脑比赛,谁输谁赢?
“很遗憾,这很可能将是一个永远没有答案的问题。”林元庆解释说,因为百度大脑和Master学习的是两种完全不同的技能:小度的强项是生活服务,比如人脸识别和语音识别,从来没有学过下棋。Master目前似乎也只会下棋,不会辨别人脸。
那么,对人工智能来说,认脸和下棋,哪个更难?
从本质上说,百度大脑和Master都不是记忆和推理的高手,而是数学大师,只不过一个算棋局的概率,一个算人脸相似的概率。
国际象棋、围棋等棋类是计算每一步会带来的概率变化,计算能力和算法越强,越能照顾到后面局势的变化。魏坤琳认为,人类不擅长逻辑运算,因此,只有少数人精于下棋,顶尖高手更是凤毛麟角。而且,人类脑力有限,即使是聂卫平在巅峰时期,也只能在局部多计算几个回合,无法考虑每一步对全盘战局的影响。
但逻辑运算是电脑的强项,它每次落子,都可以考虑对全局的影响。这也是为什么聂卫平等围棋大师会觉得Master不按常理下棋的原因。因为在某些时候,计算全局和计算局部的结果是不同的。
反过来,感知和运动是人类擅长的,机器却不擅长。机器无法理解雨打芭蕉的美,爬个楼梯也很费力,特别是台阶的高度、坡度、光照条件等参数无法预知时,机器人很难像人一样流畅地爬楼梯。
“同样,推理辨识长大后的人脸,不是简单的信息匹配和分类问题,而是从模糊复杂的信息中抽象出规律的问题。”魏坤琳说,“基于极少非结构化的信息来学习推理,这恰恰是人脑擅长的。我们把这些要素都设计到了最强大脑舞台上的挑战当中”。
因此,《最强大脑》科学顾问团首席顾问、北京师范大学心理学院院长刘嘉在首次媒体看片会上,曾正面回应道,“小度从计算上的难度来讲,甚至可能会超过Master”。
但魏坤琳不完全赞同。他反复强调这种难易比较只是“可能”,“因为,人工智能对不同认知功能有自身的难易评判,我们不能用人的直觉去作这个评判。这就像苹果和橘子,不能比”。
我们不怕汽车比人跑得快,为什么要畏惧机器比人聪明?
这场比赛还有一个细节——面对小度,曾经展现出超强记忆力、辨识力的人类选手都不敢应战,场面一度尴尬。在评委们的鼓励下,有3位选手带着点悲壮的感觉主动请战,称“即使必输无疑,也要维护战队和个人尊严”。
选手们的畏惧折射出当下人们对人工智能的恐惧心理。最强大脑的选手在记忆力、识别能力等方面都极其出类拔萃。他们在人类最擅长的领域,被最不擅长此项活动的机器打败,其冲击大于当年的AlphaGo,再次引发了“人工智能威胁论”。
“恐惧未知,这是人的正常心理。”魏坤琳觉得,新技术出现时都会造成恐慌,汽车、火车、计算机刚问世都有人害怕。他认为,大多数人其实是担心自己被人工智能替代,“人工智能的出现,可能让很多一般智力活动甚至专业人员的工作受到威胁。但是,有些工作被取代了,新的工作又产生了,人类整体的失业率不一定会上升”。
实际上,从人类生活的质量来说,有了人工智能的辅助,大家的生活变得更“智能”了,自动驾驶、家居机器人、专业决策辅助,这都是前人无法想象的生活。
在比赛现场,嘉宾就提出,小度可以帮助父母寻找失散多年的孩子,帮助公安机关搜寻偶然被摄像头拍到的犯罪分子。从商业化的角度,百度的人脸识别已经在浙江乌镇景区闸机得到应用,可满足每年千万人次的游客使用。还有一些国产手机也在接洽,希望使用百度的人脸识别技术。
而且,人工智能还可以做很多事情。比如小度不仅会辨别人脸,对人类语音的辨别率也能达到97%;小度还可以声情并茂地输出语句,基本可以代替忙碌的妈妈给孩子们讲故事。在智慧医疗、文物挽救、在线个性化教育等方面,人工智能大有可为。因此,近年来,微软、Facebook、IBM、谷歌、亚马逊都投入巨资研发人工智能。在最近的消费电子展(CES 2017)上,各大厂商都带来了自己的人工智能。
但是,再强的人工智能都是人类智慧的结晶。机器只能做人教给它的东西,也无法理解人类的感情。比如小度判断出双胞胎的存在,给出了两个概率。因为两个数字太过接近,在它的系统中无法抉择,最终还是吴恩达帮它挑选了概率稍高的那一张。
人工智能要威胁到人类,还有很远的距离。也许就像王峰说的,人和机器不是敌对的关系,虽然这次他输给了人工智能,但这其实代表人类的科技又进了一步。