機(jī)器閱讀理解:人工智能技術(shù)的重要分支之一

時(shí)間:2021-06-22

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):機(jī)器閱讀理解(英文Machine Reading Comprehension,簡(jiǎn)稱MRC)是近期自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)之一,更是人工智能在處理和理解人類語(yǔ)言進(jìn)程中的一個(gè)長(zhǎng)期目標(biāo)。得益于深度學(xué)習(xí)技術(shù)和大規(guī)模標(biāo)注數(shù)據(jù)集的發(fā)展,用端到端的神經(jīng)網(wǎng)絡(luò)來(lái)解決閱讀理解任務(wù)取得了長(zhǎng)足的進(jìn)步。

  人類可以輕而易舉地閱讀理解自己的母語(yǔ),而機(jī)器卻難于閱讀理解自然語(yǔ)言。要想讓機(jī)器閱讀理解自然語(yǔ)言,就需要把自然語(yǔ)言轉(zhuǎn)化成它可以用來(lái)讀取、存儲(chǔ)、計(jì)算的數(shù)值形式。當(dāng)若干自然語(yǔ)言被轉(zhuǎn)換為數(shù)值之后,機(jī)器通過(guò)在這些數(shù)值之上的一系列運(yùn)算來(lái)確定它們之間的關(guān)系,再根據(jù)一個(gè)全集之中個(gè)體之間的相互關(guān)系,來(lái)確定某個(gè)個(gè)體在整體(全集)中的位置。

  機(jī)器閱讀理解是一種利用算法使計(jì)算機(jī)理解文章語(yǔ)義并回答相關(guān)問(wèn)題的技術(shù)。由于文章和問(wèn)題均采用自然語(yǔ)言的形式,因此機(jī)器閱讀理解屬于自然語(yǔ)言處理的范疇,也是其中最新、最熱門的課題之一。近年來(lái),隨著機(jī)器學(xué)習(xí)(Machine Learning),特別是深度學(xué)習(xí)的飛速發(fā)展,機(jī)器閱讀理解研究有了長(zhǎng)足的進(jìn)步,并在實(shí)際應(yīng)用中嶄露頭角。

  隨著機(jī)器閱讀理解技術(shù)的發(fā)展,閱讀理解任務(wù)也在不斷升級(jí)。從早期的“完形填空形式”,發(fā)展到基于維基百科的“單文檔閱讀理解”,如以斯坦福大學(xué)設(shè)計(jì)的SQuAD 為數(shù)據(jù)集的任務(wù);并進(jìn)一步升級(jí)至基于web(網(wǎng)頁(yè))數(shù)據(jù)的“多文檔閱讀理解”,這一形式的典型代表是以微軟公司MS-MARCO、百度公司DuReader 為數(shù)據(jù)集的任務(wù)。

  目前,針對(duì)不同的閱讀理解任務(wù),研究人員已經(jīng)設(shè)計(jì)出多種模型,并取得初步成效。然而在多文檔閱讀理解任務(wù)中,由于與問(wèn)題相關(guān)的文檔很多,帶來(lái)的歧義也更多,由此可能最終導(dǎo)致閱讀理解模型定位錯(cuò)誤的答案。面對(duì)這些問(wèn)題,人類的思考模式通常為:先找到多個(gè)候選答案,通過(guò)對(duì)比多個(gè)候選答案的內(nèi)容,選出最終答案,由此來(lái)找到準(zhǔn)確率最高的答案。

  早期的閱讀理解模型大多基于檢索技術(shù),即根據(jù)問(wèn)題在文章中進(jìn)行搜索,找到相關(guān)的語(yǔ)句作為答案。但是,信息檢索主要依賴關(guān)鍵詞匹配,而在很多情況下,單純依靠問(wèn)題和文章片段的文字匹配找到的答案與問(wèn)題并不相關(guān)。隨著深度學(xué)習(xí)的發(fā)展,機(jī)器閱讀理解進(jìn)入了神經(jīng)網(wǎng)絡(luò)時(shí)代。相關(guān)技術(shù)的進(jìn)步給模型的效率和質(zhì)量都帶來(lái)了很大的提升,使機(jī)器閱讀理解模型的準(zhǔn)確率不斷提高。

  基于深度學(xué)習(xí)的機(jī)器閱讀理解模型雖然構(gòu)造各異,但是經(jīng)過(guò)多年的實(shí)踐和探索,逐漸形成了穩(wěn)定的框架結(jié)構(gòu)。機(jī)器閱讀理解模型的輸入為文章和問(wèn)題。因此,首先要對(duì)這兩部分進(jìn)行數(shù)字化編碼,變成可以被計(jì)算機(jī)處理的信息單元。在編碼的過(guò)程中,模型需要保留原有語(yǔ)句在文章中的語(yǔ)義。我們把模型中進(jìn)行編碼的模塊稱為編碼層。

  接下來(lái),由于文章和問(wèn)題之間存在相關(guān)性,模型需要建立文章和問(wèn)題之間的聯(lián)系。這可以通過(guò)自然語(yǔ)言處理中的注意力機(jī)制加以解決。在這個(gè)過(guò)程中,閱讀理解模型將文章和問(wèn)題的語(yǔ)義結(jié)合在一起進(jìn)行考量,進(jìn)一步加深模型對(duì)于兩者各自的理解。我們將這個(gè)模塊稱為交互層。

  經(jīng)過(guò)交互層,模型建立起文章和問(wèn)題之間的語(yǔ)義聯(lián)系,就可以預(yù)測(cè)問(wèn)題的答案。完成預(yù)測(cè)功能的模塊稱為輸出層;由于機(jī)器閱讀理解任務(wù)的答案有多種類型,因此輸出層的具體形式需要和任務(wù)的答案類型相關(guān)聯(lián)。這可以通過(guò)自然語(yǔ)言處理技術(shù)來(lái)尋找答案,并加以解決。

  自然語(yǔ)言處理是實(shí)現(xiàn)機(jī)器和人機(jī)交互愿景的重要技術(shù)基石,機(jī)器閱讀理解則可被視為自然語(yǔ)言處理領(lǐng)域皇冠上的明珠之一。機(jī)器閱讀理解將讓知識(shí)獲取不受人腦的限制;但對(duì)于機(jī)器閱讀理解的“能理解會(huì)思考”的終極目標(biāo)來(lái)說(shuō),現(xiàn)在還只是萬(wàn)里長(zhǎng)征的開始。

  有關(guān)專家認(rèn)為,端到端的深度神經(jīng)網(wǎng)絡(luò)可以更好地發(fā)現(xiàn)自然語(yǔ)言處理中的一些潛在特征,從而提高機(jī)器閱讀理解的準(zhǔn)確率。對(duì)自然語(yǔ)言的更深層次的歸納總結(jié)、知識(shí)引用、推理歸因以及知識(shí)圖譜和遷移學(xué)習(xí),將是機(jī)器閱讀理解的未來(lái)發(fā)展方向。

  作為人工智能技術(shù)的重要分支,機(jī)器閱讀理解將越來(lái)越多地應(yīng)用于各行業(yè)。正如國(guó)際知名學(xué)者周海中教授曾經(jīng)預(yù)言:“隨著科技進(jìn)步,人工智能時(shí)代即將到來(lái);屆時(shí),人工智能技術(shù)將廣泛應(yīng)用到各學(xué)科領(lǐng)域,會(huì)產(chǎn)生意想不到的效果。”

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0