給你1張4歲小女孩的照片,再讓你從電腦屏幕上看20個(gè)女孩跳舞唱歌,每個(gè)女孩只出現(xiàn)3秒鐘。你能從中找出長(zhǎng)大后畫著濃妝、戴著美瞳,甚至可能整容過(guò)的她嗎?
1月6日,江蘇衛(wèi)視《最強(qiáng)大腦》就以“匆匆那年”為主題,上演了中國(guó)版的首次人機(jī)對(duì)決:31.02秒就可記憶一副無(wú)規(guī)則撲克牌的人類代表王峰,迎戰(zhàn)百度人工智能機(jī)器人“小度”。雙方先比拼人臉識(shí)別——僅憑一張童年照認(rèn)出十幾年后的少女,包括一對(duì)雙胞胎;第二局,則要從30張畢業(yè)照中,即約1500個(gè)花生米大小的頭像中,根據(jù)長(zhǎng)大后的男生照片找出兒時(shí)的他。
同“Master”橫掃人類圍棋大師一樣,人工智能再一次戰(zhàn)勝了人類。百度大腦如何分辨長(zhǎng)大后的雙胞胎?它和Master哪個(gè)更厲害?它還擁有哪些神奇的功能?《經(jīng)濟(jì)日?qǐng)?bào)》記者就此采訪了百度大腦的技術(shù)團(tuán)隊(duì),得出迄今為止最靠譜的答案。
小度認(rèn)出了長(zhǎng)大后的雙胞胎之一,人類沒(méi)有
都說(shuō)“女大十八變”,比賽中,選手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼里,長(zhǎng)幼兩張人臉被分解成一個(gè)個(gè)相似的五官形狀,此中除了運(yùn)用人類的記憶力、推理能力,還有人類的本能。
“千百萬(wàn)年進(jìn)化過(guò)程中,人腦進(jìn)化出一個(gè)專門的區(qū)域負(fù)責(zé)人臉識(shí)別(簡(jiǎn)稱FFA)。”百度首席科學(xué)家吳恩達(dá)被戲稱為小度的“爸爸”,他舉例說(shuō),“一個(gè)3歲的孩子看見(jiàn)媽媽時(shí),不管媽媽是微笑、生氣,睜著眼、閉著眼,長(zhǎng)頭發(fā)、短頭發(fā),穿什么衣服,孩子都可以輕易認(rèn)出這是媽媽”。
但是,人腦為何一瞬間就能完成人臉識(shí)別,至今全世界的科學(xué)家也說(shuō)不清背后的原理。因此,小度對(duì)人臉的識(shí)別不是模仿人腦,而是更多基于數(shù)據(jù)分析和深度學(xué)習(xí)。
在人工智能“眼里”,它看見(jiàn)的不是一個(gè)圖形,而是一些按數(shù)字1和0記錄的像素點(diǎn)。因此,機(jī)器會(huì)把人臉?lè)譃楹芏鄠€(gè)小方塊來(lái)識(shí)別。根據(jù)眼睛、眉毛、鼻子等器官的特征及其相互之間的幾何位置關(guān)系,計(jì)算總結(jié)出這些點(diǎn),最終構(gòu)成了一張人臉。
如果要辨認(rèn)這張人臉是誰(shuí),機(jī)器還要提取面部特征進(jìn)行特征建模,與需要對(duì)比的人臉比較后,根據(jù)相似程度,對(duì)人臉的身份信息進(jìn)行判斷。一旦人的面貌發(fā)生任何變化,哪怕只是輕微仰頭,燈光變換,機(jī)器都需要重新計(jì)算一遍。
據(jù)百度深度學(xué)習(xí)實(shí)驗(yàn)室主任林元慶介紹,“為做到盡量精確,在百度的技術(shù)中,我們會(huì)在人臉上取72個(gè)點(diǎn),最后通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算,得到128維特征,每一維特征是人臉上的某種特點(diǎn),比如獅子鼻”。
至于如何從72個(gè)點(diǎn)的信息里總結(jié)出128種特征,并將每種特征與人臉的特點(diǎn)一一對(duì)應(yīng),這是由深度學(xué)習(xí)從海量數(shù)據(jù)里自動(dòng)學(xué)到的。換句話說(shuō),工程師并不知道這種特征究竟是“獅子鼻”,還是別的某種甚至沒(méi)有詞匯形容的特征。
計(jì)算機(jī)辨認(rèn)人臉原本就非常困難,但在《最強(qiáng)大腦》的舞臺(tái)上,又增加了時(shí)間跨度?,F(xiàn)場(chǎng)嘉賓、北京大學(xué)心理學(xué)系教授魏坤琳解釋說(shuō),成長(zhǎng)中的人臉變化極大,一個(gè)人一輩子連身份證都要換好幾次。對(duì)于人類來(lái)說(shuō),可以依靠整體神態(tài)、氣質(zhì)等無(wú)法言說(shuō)的因素去主觀猜測(cè),但機(jī)器不會(huì)猜,只能根據(jù)深度學(xué)習(xí)得來(lái)的規(guī)律計(jì)算。
據(jù)林元慶介紹,為了備戰(zhàn),團(tuán)隊(duì)2個(gè)月里讓小度看了200萬(wàn)個(gè)人的2億張照片,并輔以少量有時(shí)間跨度的照片。經(jīng)過(guò)“訓(xùn)練”,小度自己總結(jié)出了一種不為人所知的人臉隨年齡變化的規(guī)律。
在遇到蜜蜂少女隊(duì)的雙胞胎時(shí),人類和人工智能的差別就顯示出來(lái)了:姐妹花長(zhǎng)大后外表幾乎一模一樣,連姐妹倆自己都分辨不出舊照片里的人是誰(shuí),王峰用肉眼也無(wú)法辨別她們的五官特征。但是,在人工智能的計(jì)算方式下,雖然她們的面部骨骼極其相似,差別特別細(xì)微,總還是有一點(diǎn)區(qū)別。最終,小度計(jì)算出,其中一位跟老照片里的小姑娘有72.98%的相似度,另一位有72.99%,差距僅為萬(wàn)分之一。
百度大腦認(rèn)臉和Master下棋,哪個(gè)更難?
很巧合,在百度大腦參加最強(qiáng)大腦比賽的幾乎同一時(shí)間,曾經(jīng)橫掃國(guó)際象棋界的阿爾法狗改名Master,重出江湖,以60場(chǎng)連勝頂尖圍棋手的傲人成績(jī),震驚了全世界。
這也讓不少人好奇:如果Master和百度大腦比賽,誰(shuí)輸誰(shuí)贏?
“很遺憾,這很可能將是一個(gè)永遠(yuǎn)沒(méi)有答案的問(wèn)題。”林元慶解釋說(shuō),因?yàn)榘俣却竽X和Master學(xué)習(xí)的是兩種完全不同的技能:小度的強(qiáng)項(xiàng)是生活服務(wù),比如人臉識(shí)別和語(yǔ)音識(shí)別,從來(lái)沒(méi)有學(xué)過(guò)下棋。Master目前似乎也只會(huì)下棋,不會(huì)辨別人臉。
那么,對(duì)人工智能來(lái)說(shuō),認(rèn)臉和下棋,哪個(gè)更難?
從本質(zhì)上說(shuō),百度大腦和Master都不是記憶和推理的高手,而是數(shù)學(xué)大師,只不過(guò)一個(gè)算棋局的概率,一個(gè)算人臉相似的概率。
國(guó)際象棋、圍棋等棋類是計(jì)算每一步會(huì)帶來(lái)的概率變化,計(jì)算能力和算法越強(qiáng),越能照顧到后面局勢(shì)的變化。魏坤琳認(rèn)為,人類不擅長(zhǎng)邏輯運(yùn)算,因此,只有少數(shù)人精于下棋,頂尖高手更是鳳毛麟角。而且,人類腦力有限,即使是聶衛(wèi)平在巔峰時(shí)期,也只能在局部多計(jì)算幾個(gè)回合,無(wú)法考慮每一步對(duì)全盤戰(zhàn)局的影響。
但邏輯運(yùn)算是電腦的強(qiáng)項(xiàng),它每次落子,都可以考慮對(duì)全局的影響。這也是為什么聶衛(wèi)平等圍棋大師會(huì)覺(jué)得Master不按常理下棋的原因。因?yàn)樵谀承r(shí)候,計(jì)算全局和計(jì)算局部的結(jié)果是不同的。
反過(guò)來(lái),感知和運(yùn)動(dòng)是人類擅長(zhǎng)的,機(jī)器卻不擅長(zhǎng)。機(jī)器無(wú)法理解雨打芭蕉的美,爬個(gè)樓梯也很費(fèi)力,特別是臺(tái)階的高度、坡度、光照條件等參數(shù)無(wú)法預(yù)知時(shí),機(jī)器人很難像人一樣流暢地爬樓梯。
“同樣,推理辨識(shí)長(zhǎng)大后的人臉,不是簡(jiǎn)單的信息匹配和分類問(wèn)題,而是從模糊復(fù)雜的信息中抽象出規(guī)律的問(wèn)題?!蔽豪ち照f(shuō),“基于極少非結(jié)構(gòu)化的信息來(lái)學(xué)習(xí)推理,這恰恰是人腦擅長(zhǎng)的。我們把這些要素都設(shè)計(jì)到了最強(qiáng)大腦舞臺(tái)上的挑戰(zhàn)當(dāng)中”。
因此,《最強(qiáng)大腦》科學(xué)顧問(wèn)團(tuán)首席顧問(wèn)、北京師范大學(xué)心理學(xué)院院長(zhǎng)劉嘉在首次媒體看片會(huì)上,曾正面回應(yīng)道,“小度從計(jì)算上的難度來(lái)講,甚至可能會(huì)超過(guò)Master”。
但魏坤琳不完全贊同。他反復(fù)強(qiáng)調(diào)這種難易比較只是“可能”,“因?yàn)椋斯ぶ悄軐?duì)不同認(rèn)知功能有自身的難易評(píng)判,我們不能用人的直覺(jué)去作這個(gè)評(píng)判。這就像蘋果和橘子,不能比”。
我們不怕汽車比人跑得快,為什么要畏懼機(jī)器比人聰明?
這場(chǎng)比賽還有一個(gè)細(xì)節(jié)——面對(duì)小度,曾經(jīng)展現(xiàn)出超強(qiáng)記憶力、辨識(shí)力的人類選手都不敢應(yīng)戰(zhàn),場(chǎng)面一度尷尬。在評(píng)委們的鼓勵(lì)下,有3位選手帶著點(diǎn)悲壯的感覺(jué)主動(dòng)請(qǐng)戰(zhàn),稱“即使必輸無(wú)疑,也要維護(hù)戰(zhàn)隊(duì)和個(gè)人尊嚴(yán)”。
選手們的畏懼折射出當(dāng)下人們對(duì)人工智能的恐懼心理。最強(qiáng)大腦的選手在記憶力、識(shí)別能力等方面都極其出類拔萃。他們?cè)谌祟愖钌瞄L(zhǎng)的領(lǐng)域,被最不擅長(zhǎng)此項(xiàng)活動(dòng)的機(jī)器打敗,其沖擊大于當(dāng)年的AlphaGo,再次引發(fā)了“人工智能威脅論”。
“恐懼未知,這是人的正常心理?!蔽豪ち沼X(jué)得,新技術(shù)出現(xiàn)時(shí)都會(huì)造成恐慌,汽車、火車、計(jì)算機(jī)剛問(wèn)世都有人害怕。他認(rèn)為,大多數(shù)人其實(shí)是擔(dān)心自己被人工智能替代,“人工智能的出現(xiàn),可能讓很多一般智力活動(dòng)甚至專業(yè)人員的工作受到威脅。但是,有些工作被取代了,新的工作又產(chǎn)生了,人類整體的失業(yè)率不一定會(huì)上升”。
實(shí)際上,從人類生活的質(zhì)量來(lái)說(shuō),有了人工智能的輔助,大家的生活變得更“智能”了,自動(dòng)駕駛、家居機(jī)器人、專業(yè)決策輔助,這都是前人無(wú)法想象的生活。
在比賽現(xiàn)場(chǎng),嘉賓就提出,小度可以幫助父母尋找失散多年的孩子,幫助公安機(jī)關(guān)搜尋偶然被攝像頭拍到的犯罪分子。從商業(yè)化的角度,百度的人臉識(shí)別已經(jīng)在浙江烏鎮(zhèn)景區(qū)閘機(jī)得到應(yīng)用,可滿足每年千萬(wàn)人次的游客使用。還有一些國(guó)產(chǎn)手機(jī)也在接洽,希望使用百度的人臉識(shí)別技術(shù)。
而且,人工智能還可以做很多事情。比如小度不僅會(huì)辨別人臉,對(duì)人類語(yǔ)音的辨別率也能達(dá)到97%;小度還可以聲情并茂地輸出語(yǔ)句,基本可以代替忙碌的媽媽給孩子們講故事。在智慧醫(yī)療、文物挽救、在線個(gè)性化教育等方面,人工智能大有可為。因此,近年來(lái),微軟、Facebook、IBM、谷歌、亞馬遜都投入巨資研發(fā)人工智能。在最近的消費(fèi)電子展(CES2017)上,各大廠商都帶來(lái)了自己的人工智能。
但是,再?gòu)?qiáng)的人工智能都是人類智慧的結(jié)晶。機(jī)器只能做人教給它的東西,也無(wú)法理解人類的感情。比如小度判斷出雙胞胎的存在,給出了兩個(gè)概率。因?yàn)閮蓚€(gè)數(shù)字太過(guò)接近,在它的系統(tǒng)中無(wú)法抉擇,最終還是吳恩達(dá)幫它挑選了概率稍高的那一張。
人工智能要威脅到人類,還有很遠(yuǎn)的距離。也許就像王峰說(shuō)的,人和機(jī)器不是敵對(duì)的關(guān)系,雖然這次他輸給了人工智能,但這其實(shí)代表人類的科技又進(jìn)了一步。