近日,由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域頂級賽事SQuAD刷新了排名,AI的閱讀能力歷史上首次超越人類。阿里巴巴稱,其憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,并且超越了人類82.304的成績。
(圖片來源:阿里科技)
此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時(shí)的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。
值得一提的是,該自然語言處理團(tuán)隊(duì)還支撐了阿里巴巴整個(gè)生態(tài)的技術(shù)需求,由他們研發(fā)的AliNLP自然語言技術(shù)平臺每日調(diào)用1200億+次,Alitranx翻譯系統(tǒng)提供20個(gè)語種在線服務(wù)日調(diào)用量超過7億+次。
據(jù)悉,SQuAD比賽構(gòu)建了一個(gè)包含10萬個(gè)問題的大規(guī)模機(jī)器閱讀理解數(shù)據(jù)集,文章來源于500多篇維基百科文章。人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個(gè)基于文章內(nèi)容的問題,然后與標(biāo)準(zhǔn)答案進(jìn)行比對,得出精確匹配(ExactMatch)和模糊匹配(F1-score)的結(jié)果。
該比賽吸引了谷歌、卡內(nèi)基·梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業(yè)研究機(jī)構(gòu)和高校的深度參與。