91久久精品一区二区三区色欲,欧美黄色性生活视频,精品欧美一区二区三蜜桃

新聞頻道行業(yè)資訊企業(yè)動態(tài) 展會報(bào)道人物專訪產(chǎn)品新聞政策法規(guī) 技術(shù)前沿研究報(bào)告

傳動網(wǎng) > 新聞頻道 > 行業(yè)資訊 > 資訊詳情

機(jī)器閱讀理解：人工智能技術(shù)的重要分支之一

時間：2021-06-22

來源：網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語：機(jī)器閱讀理解(英文Machine Reading Comprehension，簡稱MRC)是近期自然語言處理領(lǐng)域的研究熱點(diǎn)之一，更是人工智能在處理和理解人類語言進(jìn)程中的一個長期目標(biāo)。得益于深度學(xué)習(xí)技術(shù)和大規(guī)模標(biāo)注數(shù)據(jù)集的發(fā)展，用端到端的神經(jīng)網(wǎng)絡(luò)來解決閱讀理解任務(wù)取得了長足的進(jìn)步。

　　人類可以輕而易舉地閱讀理解自己的母語，而機(jī)器卻難于閱讀理解自然語言。要想讓機(jī)器閱讀理解自然語言，就需要把自然語言轉(zhuǎn)化成它可以用來讀取、存儲、計(jì)算的數(shù)值形式。當(dāng)若干自然語言被轉(zhuǎn)換為數(shù)值之后，機(jī)器通過在這些數(shù)值之上的一系列運(yùn)算來確定它們之間的關(guān)系，再根據(jù)一個全集之中個體之間的相互關(guān)系，來確定某個個體在整體(全集)中的位置。

　　機(jī)器閱讀理解是一種利用算法使計(jì)算機(jī)理解文章語義并回答相關(guān)問題的技術(shù)。由于文章和問題均采用自然語言的形式，因此機(jī)器閱讀理解屬于自然語言處理的范疇，也是其中最新、最熱門的課題之一。近年來，隨著機(jī)器學(xué)習(xí)(Machine Learning)，特別是深度學(xué)習(xí)的飛速發(fā)展，機(jī)器閱讀理解研究有了長足的進(jìn)步，并在實(shí)際應(yīng)用中嶄露頭角。

　　隨著機(jī)器閱讀理解技術(shù)的發(fā)展，閱讀理解任務(wù)也在不斷升級。從早期的“完形填空形式”，發(fā)展到基于維基百科的“單文檔閱讀理解”，如以斯坦福大學(xué)設(shè)計(jì)的SQuAD 為數(shù)據(jù)集的任務(wù);并進(jìn)一步升級至基于web(網(wǎng)頁)數(shù)據(jù)的“多文檔閱讀理解”，這一形式的典型代表是以微軟公司MS-MARCO、百度公司DuReader 為數(shù)據(jù)集的任務(wù)。

　　目前，針對不同的閱讀理解任務(wù)，研究人員已經(jīng)設(shè)計(jì)出多種模型，并取得初步成效。然而在多文檔閱讀理解任務(wù)中，由于與問題相關(guān)的文檔很多，帶來的歧義也更多，由此可能最終導(dǎo)致閱讀理解模型定位錯誤的答案。面對這些問題，人類的思考模式通常為：先找到多個候選答案，通過對比多個候選答案的內(nèi)容，選出最終答案，由此來找到準(zhǔn)確率最高的答案。

　　早期的閱讀理解模型大多基于檢索技術(shù)，即根據(jù)問題在文章中進(jìn)行搜索，找到相關(guān)的語句作為答案。但是，信息檢索主要依賴關(guān)鍵詞匹配，而在很多情況下，單純依靠問題和文章片段的文字匹配找到的答案與問題并不相關(guān)。隨著深度學(xué)習(xí)的發(fā)展，機(jī)器閱讀理解進(jìn)入了神經(jīng)網(wǎng)絡(luò)時代。相關(guān)技術(shù)的進(jìn)步給模型的效率和質(zhì)量都帶來了很大的提升，使機(jī)器閱讀理解模型的準(zhǔn)確率不斷提高。

　　基于深度學(xué)習(xí)的機(jī)器閱讀理解模型雖然構(gòu)造各異，但是經(jīng)過多年的實(shí)踐和探索，逐漸形成了穩(wěn)定的框架結(jié)構(gòu)。機(jī)器閱讀理解模型的輸入為文章和問題。因此，首先要對這兩部分進(jìn)行數(shù)字化編碼，變成可以被計(jì)算機(jī)處理的信息單元。在編碼的過程中，模型需要保留原有語句在文章中的語義。我們把模型中進(jìn)行編碼的模塊稱為編碼層。

　　接下來，由于文章和問題之間存在相關(guān)性，模型需要建立文章和問題之間的聯(lián)系。這可以通過自然語言處理中的注意力機(jī)制加以解決。在這個過程中，閱讀理解模型將文章和問題的語義結(jié)合在一起進(jìn)行考量，進(jìn)一步加深模型對于兩者各自的理解。我們將這個模塊稱為交互層。

　　經(jīng)過交互層，模型建立起文章和問題之間的語義聯(lián)系，就可以預(yù)測問題的答案。完成預(yù)測功能的模塊稱為輸出層;由于機(jī)器閱讀理解任務(wù)的答案有多種類型，因此輸出層的具體形式需要和任務(wù)的答案類型相關(guān)聯(lián)。這可以通過自然語言處理技術(shù)來尋找答案，并加以解決。

　　自然語言處理是實(shí)現(xiàn)機(jī)器和人機(jī)交互愿景的重要技術(shù)基石，機(jī)器閱讀理解則可被視為自然語言處理領(lǐng)域皇冠上的明珠之一。機(jī)器閱讀理解將讓知識獲取不受人腦的限制;但對于機(jī)器閱讀理解的“能理解會思考”的終極目標(biāo)來說，現(xiàn)在還只是萬里長征的開始。

　　有關(guān)專家認(rèn)為，端到端的深度神經(jīng)網(wǎng)絡(luò)可以更好地發(fā)現(xiàn)自然語言處理中的一些潛在特征，從而提高機(jī)器閱讀理解的準(zhǔn)確率。對自然語言的更深層次的歸納總結(jié)、知識引用、推理歸因以及知識圖譜和遷移學(xué)習(xí)，將是機(jī)器閱讀理解的未來發(fā)展方向。

　　作為人工智能技術(shù)的重要分支，機(jī)器閱讀理解將越來越多地應(yīng)用于各行業(yè)。正如國際知名學(xué)者周海中教授曾經(jīng)預(yù)言：“隨著科技進(jìn)步，人工智能時代即將到來;屆時，人工智能技術(shù)將廣泛應(yīng)用到各學(xué)科領(lǐng)域，會產(chǎn)生意想不到的效果?！?/p>

傳動網(wǎng)版權(quán)與免責(zé)聲明：

凡本網(wǎng)注明[來源：傳動網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為傳動網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“傳動網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件，均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

工信部就車聯(lián)網(wǎng)網(wǎng)絡(luò)安全標(biāo)準(zhǔn)體系建設(shè)征求意見

車聯(lián)網(wǎng)，是汽車、電子、信息通信等深度融合下的新興產(chǎn)業(yè)。近年來，隨著自動駕駛、物聯(lián)網(wǎng)等新一代信息技術(shù)的快速應(yīng)用，車聯(lián)網(wǎng)日漸成為各國競爭焦點(diǎn)，在資本市...

返回新聞首頁