中國(guó)信通院?jiǎn)?dòng)AI大模型幻覺評(píng)測(cè)

時(shí)間:2025-03-20

來(lái)源:電子技術(shù)應(yīng)用

導(dǎo)語(yǔ):3 月 19 日消息,IT之家從中國(guó)信通院官方微信公眾號(hào)獲悉,為摸清大模型的幻覺現(xiàn)狀,推動(dòng)大模型應(yīng)用走深走實(shí),中國(guó)信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測(cè)評(píng)工作,發(fā)起大模型幻覺測(cè)試。

  3 月 19 日消息,IT之家從中國(guó)信通院官方微信公眾號(hào)獲悉,為摸清大模型的幻覺現(xiàn)狀,推動(dòng)大模型應(yīng)用走深走實(shí),中國(guó)信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測(cè)評(píng)工作,發(fā)起大模型幻覺測(cè)試。

  大模型幻覺(AI Hallucination)是指模型在生成內(nèi)容或回答問(wèn)題時(shí),產(chǎn)生了看似合理,實(shí)則與用戶輸入不一致(忠實(shí)性幻覺)或者不符合事實(shí)(事實(shí)性幻覺)的內(nèi)容。隨著大模型在醫(yī)療、金融等關(guān)鍵領(lǐng)域廣泛應(yīng)用,大模型幻覺帶來(lái)的潛在應(yīng)用風(fēng)險(xiǎn)日益加劇,正得到業(yè)界的廣泛關(guān)注。

  本輪幻覺測(cè)試工作將以大語(yǔ)言模型為測(cè)試對(duì)象,涵蓋了事實(shí)性幻覺和忠實(shí)性幻覺兩種幻覺類型,具體測(cè)評(píng)體系如下:

  測(cè)試數(shù)據(jù)包含 7000 余條中文測(cè)試樣本,測(cè)試形式包括對(duì)應(yīng)于忠實(shí)性幻覺檢測(cè)的信息抽取與知識(shí)推理兩類題型,以及對(duì)應(yīng)事實(shí)性幻覺檢測(cè)的事實(shí)判別題型??傮w涉及人文科學(xué)、社會(huì)科學(xué)、自然科學(xué)、應(yīng)用科學(xué)和形式科學(xué)五種測(cè)試維度。

  中國(guó)信通院邀請(qǐng)各相關(guān)企業(yè)參與模型測(cè)評(píng),共同推動(dòng)大模型安全應(yīng)用。


AI
中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0