時(shí)間:2025-01-16 14:56:02來(lái)源:21ic電子網(wǎng)
AI現(xiàn)在在所有的軟件開(kāi)發(fā)生命周期中很常見(jiàn),特別是在應(yīng)用程序設(shè)計(jì)、測(cè)試和部署中。然而,此類(lèi)系統(tǒng)的存在日益增加,因此必須確保它們服務(wù)于而不是違背人類(lèi)價(jià)值觀。人工智能代理人的不一致可能導(dǎo)致意外后果,如違反道德、決策中的歧視或?yàn)E用某些能力。
理解人工智能校準(zhǔn)
AI校準(zhǔn),或稱(chēng)價(jià)值校準(zhǔn),是指人工智能系統(tǒng)的目標(biāo)與其他人類(lèi)目標(biāo)和行動(dòng)相兼容或至少可以共存的過(guò)程或哲學(xué)。隨著人工智能技術(shù)的不斷發(fā)展,人工智能可能會(huì)自我毀滅或?qū)θ祟?lèi)采取行動(dòng),這使得投資人工智能倫理的需要變得更加緊迫。
不結(jié)盟人工智能代理人的風(fēng)險(xiǎn)
不符合人類(lèi)價(jià)值的人工智能系統(tǒng)有可能造成極大的破壞。人們應(yīng)該關(guān)注一個(gè)沒(méi)有道德方面的人工智能系統(tǒng)追逐目標(biāo)。這樣的人工智能系統(tǒng)有可能很好地發(fā)揮作用,但它的行為將是可怕的,會(huì)導(dǎo)致做出不恰當(dāng)?shù)倪x擇,侵犯隱私,破壞社會(huì)價(jià)值觀。這些弱點(diǎn)必須加以解決,所以人工智能設(shè)計(jì)師必須首先考慮道德問(wèn)題。
從人的反饋中強(qiáng)化學(xué)習(xí)
人工智能技術(shù)的最新進(jìn)展之一是從人類(lèi)反饋學(xué)習(xí)(RLHF).這是一種人類(lèi)強(qiáng)化的機(jī)器學(xué)習(xí)方法,它為模型指定了一個(gè)人類(lèi)教師,特別是在獎(jiǎng)勵(lì)功能復(fù)雜或定義不清的情況下。這種方法將提高人工智能系統(tǒng)的工作方式,使其使用更加復(fù)雜、相關(guān)和令人愉快,這將改善人類(lèi)與人工智能之間的互動(dòng)和互動(dòng)。
實(shí)施步驟
步驟1:預(yù)先培訓(xùn)語(yǔ)言模式
首先,對(duì)語(yǔ)言模型進(jìn)行培訓(xùn),使之符合其設(shè)計(jì)的傳統(tǒng)目標(biāo),從而建立一種強(qiáng)有力的基礎(chǔ)性理解。
步驟2:收集數(shù)據(jù)和培訓(xùn)獎(jiǎng)勵(lì)模式
獲得對(duì)模型輸出的人力投入,以創(chuàng)建一個(gè)圍繞活動(dòng)目標(biāo)和預(yù)期結(jié)果的獎(jiǎng)勵(lì)模型。
步驟3:通過(guò)強(qiáng)化學(xué)習(xí)對(duì)LM進(jìn)行微調(diào)
通過(guò)強(qiáng)化學(xué)習(xí),利用獎(jiǎng)勵(lì)模型提高語(yǔ)言模型的性能,從而使語(yǔ)言模型的行為圖更接近人類(lèi)。
吸收外部知識(shí)
現(xiàn)代人工智能系統(tǒng)應(yīng)納入外部知識(shí),以加強(qiáng)其自主運(yùn)作,同時(shí)與人類(lèi)道德標(biāo)準(zhǔn)保持一致。人工智能技術(shù)確保代理人作出富有成效的決定和執(zhí)行道德行動(dòng),由于有最新和相關(guān)的信息訪問(wèn),行動(dòng)是有效率的,這有助于維護(hù)道德標(biāo)準(zhǔn)和廉正。
整合外部數(shù)據(jù)來(lái)源的方法
1. 回收強(qiáng)化一代: RAG允許GTP模型檢索和整合來(lái)自外部文檔的特定知識(shí),使動(dòng)態(tài)和背景感知決策成為可能。
2. 知識(shí)圖: 有組織的實(shí)體網(wǎng)絡(luò)及其關(guān)系為人工智能提供了背景理解,加強(qiáng)了推理和決策。
3. 基于本體的數(shù)據(jù)整合: 本體定義結(jié)構(gòu)化的類(lèi)別和關(guān)系,幫助AI集成和解釋多領(lǐng)域信息,同時(shí)減少語(yǔ)義摩擦。
通過(guò)結(jié)構(gòu)化的外部知識(shí)改進(jìn)人工智能的業(yè)績(jī)
· 相關(guān)的更新訪問(wèn): 在AI中整合數(shù)據(jù)可以確保代理不會(huì)對(duì)陳舊的信息采取行動(dòng),即使情況是流動(dòng)的。
· 盡量減少錯(cuò)誤: 加入額外數(shù)據(jù)使理解環(huán)境變得更加容易,從而大大減少了出錯(cuò)的可能性,并且提高了由A生成的輸出信息的質(zhì)量。
· 道德配件: 人工智能系統(tǒng)可以將外部道德操守和標(biāo)準(zhǔn)作業(yè)程序納入其中,使其職能符合良好的道德原則和要求。
人工智能調(diào)整方面的挑戰(zhàn)
人工智能最大的問(wèn)題是將人工智能系統(tǒng)的價(jià)值觀與人類(lèi)相結(jié)合的問(wèn)題。應(yīng)對(duì)這一挑戰(zhàn)需要進(jìn)一步改進(jìn),特別是在盡量減少人類(lèi)認(rèn)知固有的偏見(jiàn)和克服人工智能模式可利用的外部信息來(lái)源的限制方面。
人類(lèi)反饋中的偏見(jiàn)
人類(lèi)反饋是培訓(xùn)人工智能模型的關(guān)鍵,強(qiáng)化學(xué)習(xí)是一種特別有效的技術(shù)。然而,這種輸入可能包括由個(gè)人主觀性、文化背景或無(wú)意中的變量引起的偏差,可能會(huì)損害AI的表現(xiàn)。
外部知識(shí)來(lái)源的局限性
將外部知識(shí)整合到AI系統(tǒng)中可以通過(guò)提供新的數(shù)據(jù)來(lái)改進(jìn)決策。然而,當(dāng)這些數(shù)據(jù)過(guò)時(shí)、部分或錯(cuò)誤時(shí),就會(huì)出現(xiàn)問(wèn)題,可能導(dǎo)致推理錯(cuò)誤。此外,處理和解釋大量混亂的外部數(shù)據(jù)可能很困難。因此,在將外部信息納入人工智能系統(tǒng)之前,必須實(shí)施確保外部信息質(zhì)量和可靠性的步驟。
道德智能發(fā)展最佳做法
有必要制定具體措施,納入人的反饋和其他措施,以提高透明度和問(wèn)責(zé)制,建立與人道主義原則同步的人工智能系統(tǒng)。
有效的人力反饋整合戰(zhàn)略
· 結(jié)構(gòu)性反饋機(jī)制: 執(zhí)行常規(guī)活動(dòng)以獲得用戶(hù)反饋,指導(dǎo)人工智能執(zhí)行其活動(dòng).這可以通過(guò)調(diào)查、在線(xiàn)測(cè)試和互動(dòng)歷史來(lái)實(shí)現(xiàn)。
· 反饋來(lái)源的多樣性: 在使用人工智能技術(shù)時(shí),收集盡可能多的用戶(hù)的反饋,以便最大限度地減少偏差和增強(qiáng)表示。
· 迭代發(fā)展: 遵循敏捷的方法,這樣人工智能模型就可以根據(jù)用戶(hù)的反饋進(jìn)行訓(xùn)練和再訓(xùn)練,人工智能代理就可以根據(jù)用戶(hù)的需求進(jìn)行進(jìn)化。
確保透明度和問(wèn)責(zé)制
大赦國(guó)際發(fā)展的透明度和問(wèn)責(zé)制對(duì)公眾信任和道德操守至關(guān)重要??山忉尩腁I(XAI)方法幫助利益攸關(guān)方了解AI系統(tǒng)如何工作、決策過(guò)程和監(jiān)控程序。
問(wèn)責(zé)制和審計(jì)需要數(shù)據(jù)集屬性、模型設(shè)計(jì)和培訓(xùn)資源的全面文檔。需要定期進(jìn)行道德評(píng)估,以發(fā)現(xiàn)和糾正偏見(jiàn)或不道德的做法,確保人工智能系統(tǒng)是負(fù)責(zé)、透明和符合人類(lèi)價(jià)值觀的。
結(jié)論
大赦國(guó)際的協(xié)調(diào)涉及開(kāi)發(fā)人員、道德專(zhuān)家、法律當(dāng)局和其他適當(dāng)?shù)睦尕P(guān)方的共同努力,以實(shí)現(xiàn)為人民設(shè)計(jì)和可供人民使用的大赦制度的建立。隨著人工智能系統(tǒng)領(lǐng)域越來(lái)越具有包容性,必須始終考慮以人為本的倫理難題,并建立透明度,以作為推動(dòng)因素。
中國(guó)傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
產(chǎn)品新聞
更多>鋼鐵廠的“眼科手術(shù)”:維宏線(xiàn)激光如何...
2025-04-30
性能躍升20%!維宏NK300CX Plus數(shù)控系統(tǒng)...
2025-04-11
rpi-image-gen:樹(shù)莓派軟件鏡像構(gòu)建的終...
2025-04-08
【產(chǎn)品解讀】全面提升精密制造檢測(cè)節(jié)拍...
2025-03-31
激光閃耀 智慧引領(lǐng) | WISE MASER 黑武士...
2025-03-20
推薦專(zhuān)題
更多>