您現(xiàn)在的位置：中國(guó)傳動(dòng)網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > 執(zhí)行人工智能道德，使人工智能與人類(lèi)價(jià)值相一致的實(shí)用技術(shù)

執(zhí)行人工智能道德，使人工智能與人類(lèi)價(jià)值相一致的實(shí)用技術(shù)

時(shí)間：2025-01-16 14:56:02來(lái)源：21ic電子網(wǎng)

導(dǎo)語(yǔ)：?AI現(xiàn)在在所有的軟件開(kāi)發(fā)生命周期中很常見(jiàn),特別是在應(yīng)用程序設(shè)計(jì)、測(cè)試和部署中。然而,此類(lèi)系統(tǒng)的存在日益增加,因此必須確保它們服務(wù)于而不是違背人類(lèi)價(jià)值觀。人工智能代理人的不一致可能導(dǎo)致意外后果,如違反道德、決策中的歧視或?yàn)E用某些能力。

　　AI現(xiàn)在在所有的軟件開(kāi)發(fā)生命周期中很常見(jiàn),特別是在應(yīng)用程序設(shè)計(jì)、測(cè)試和部署中。然而,此類(lèi)系統(tǒng)的存在日益增加,因此必須確保它們服務(wù)于而不是違背人類(lèi)價(jià)值觀。人工智能代理人的不一致可能導(dǎo)致意外后果,如違反道德、決策中的歧視或?yàn)E用某些能力。

　　理解人工智能校準(zhǔn)

　　AI校準(zhǔn),或稱(chēng)價(jià)值校準(zhǔn),是指人工智能系統(tǒng)的目標(biāo)與其他人類(lèi)目標(biāo)和行動(dòng)相兼容或至少可以共存的過(guò)程或哲學(xué)。隨著人工智能技術(shù)的不斷發(fā)展,人工智能可能會(huì)自我毀滅或?qū)θ祟?lèi)采取行動(dòng),這使得投資人工智能倫理的需要變得更加緊迫。

　　不結(jié)盟人工智能代理人的風(fēng)險(xiǎn)

　　不符合人類(lèi)價(jià)值的人工智能系統(tǒng)有可能造成極大的破壞。人們應(yīng)該關(guān)注一個(gè)沒(méi)有道德方面的人工智能系統(tǒng)追逐目標(biāo)。這樣的人工智能系統(tǒng)有可能很好地發(fā)揮作用,但它的行為將是可怕的,會(huì)導(dǎo)致做出不恰當(dāng)?shù)倪x擇,侵犯隱私,破壞社會(huì)價(jià)值觀。這些弱點(diǎn)必須加以解決,所以人工智能設(shè)計(jì)師必須首先考慮道德問(wèn)題。

　　從人的反饋中強(qiáng)化學(xué)習(xí)

　　人工智能技術(shù)的最新進(jìn)展之一是從人類(lèi)反饋學(xué)習(xí)(RLHF).這是一種人類(lèi)強(qiáng)化的機(jī)器學(xué)習(xí)方法,它為模型指定了一個(gè)人類(lèi)教師,特別是在獎(jiǎng)勵(lì)功能復(fù)雜或定義不清的情況下。這種方法將提高人工智能系統(tǒng)的工作方式,使其使用更加復(fù)雜、相關(guān)和令人愉快,這將改善人類(lèi)與人工智能之間的互動(dòng)和互動(dòng)。

　　實(shí)施步驟

　　步驟1:預(yù)先培訓(xùn)語(yǔ)言模式

　　首先,對(duì)語(yǔ)言模型進(jìn)行培訓(xùn),使之符合其設(shè)計(jì)的傳統(tǒng)目標(biāo),從而建立一種強(qiáng)有力的基礎(chǔ)性理解。

　　步驟2:收集數(shù)據(jù)和培訓(xùn)獎(jiǎng)勵(lì)模式

　　獲得對(duì)模型輸出的人力投入,以創(chuàng)建一個(gè)圍繞活動(dòng)目標(biāo)和預(yù)期結(jié)果的獎(jiǎng)勵(lì)模型。

　　步驟3:通過(guò)強(qiáng)化學(xué)習(xí)對(duì)LM進(jìn)行微調(diào)

　　通過(guò)強(qiáng)化學(xué)習(xí),利用獎(jiǎng)勵(lì)模型提高語(yǔ)言模型的性能,從而使語(yǔ)言模型的行為圖更接近人類(lèi)。

　　吸收外部知識(shí)

　　現(xiàn)代人工智能系統(tǒng)應(yīng)納入外部知識(shí),以加強(qiáng)其自主運(yùn)作,同時(shí)與人類(lèi)道德標(biāo)準(zhǔn)保持一致。人工智能技術(shù)確保代理人作出富有成效的決定和執(zhí)行道德行動(dòng),由于有最新和相關(guān)的信息訪問(wèn),行動(dòng)是有效率的,這有助于維護(hù)道德標(biāo)準(zhǔn)和廉正。

　　整合外部數(shù)據(jù)來(lái)源的方法

　　1. 回收強(qiáng)化一代: RAG允許GTP模型檢索和整合來(lái)自外部文檔的特定知識(shí),使動(dòng)態(tài)和背景感知決策成為可能。

　　2. 知識(shí)圖: 有組織的實(shí)體網(wǎng)絡(luò)及其關(guān)系為人工智能提供了背景理解,加強(qiáng)了推理和決策。

　　3. 基于本體的數(shù)據(jù)整合: 本體定義結(jié)構(gòu)化的類(lèi)別和關(guān)系,幫助AI集成和解釋多領(lǐng)域信息,同時(shí)減少語(yǔ)義摩擦。

　　通過(guò)結(jié)構(gòu)化的外部知識(shí)改進(jìn)人工智能的業(yè)績(jī)

　　· 相關(guān)的更新訪問(wèn): 在AI中整合數(shù)據(jù)可以確保代理不會(huì)對(duì)陳舊的信息采取行動(dòng),即使情況是流動(dòng)的。

　　· 盡量減少錯(cuò)誤: 加入額外數(shù)據(jù)使理解環(huán)境變得更加容易,從而大大減少了出錯(cuò)的可能性,并且提高了由A生成的輸出信息的質(zhì)量。

　　· 道德配件: 人工智能系統(tǒng)可以將外部道德操守和標(biāo)準(zhǔn)作業(yè)程序納入其中,使其職能符合良好的道德原則和要求。

　　人工智能調(diào)整方面的挑戰(zhàn)

　　人工智能最大的問(wèn)題是將人工智能系統(tǒng)的價(jià)值觀與人類(lèi)相結(jié)合的問(wèn)題。應(yīng)對(duì)這一挑戰(zhàn)需要進(jìn)一步改進(jìn),特別是在盡量減少人類(lèi)認(rèn)知固有的偏見(jiàn)和克服人工智能模式可利用的外部信息來(lái)源的限制方面。

　　人類(lèi)反饋中的偏見(jiàn)

　　人類(lèi)反饋是培訓(xùn)人工智能模型的關(guān)鍵,強(qiáng)化學(xué)習(xí)是一種特別有效的技術(shù)。然而,這種輸入可能包括由個(gè)人主觀性、文化背景或無(wú)意中的變量引起的偏差,可能會(huì)損害AI的表現(xiàn)。

　　外部知識(shí)來(lái)源的局限性

　　將外部知識(shí)整合到AI系統(tǒng)中可以通過(guò)提供新的數(shù)據(jù)來(lái)改進(jìn)決策。然而,當(dāng)這些數(shù)據(jù)過(guò)時(shí)、部分或錯(cuò)誤時(shí),就會(huì)出現(xiàn)問(wèn)題,可能導(dǎo)致推理錯(cuò)誤。此外,處理和解釋大量混亂的外部數(shù)據(jù)可能很困難。因此,在將外部信息納入人工智能系統(tǒng)之前,必須實(shí)施確保外部信息質(zhì)量和可靠性的步驟。

　　道德智能發(fā)展最佳做法

　　有必要制定具體措施,納入人的反饋和其他措施,以提高透明度和問(wèn)責(zé)制,建立與人道主義原則同步的人工智能系統(tǒng)。

　　有效的人力反饋整合戰(zhàn)略

　　· 結(jié)構(gòu)性反饋機(jī)制: 執(zhí)行常規(guī)活動(dòng)以獲得用戶(hù)反饋,指導(dǎo)人工智能執(zhí)行其活動(dòng).這可以通過(guò)調(diào)查、在線測(cè)試和互動(dòng)歷史來(lái)實(shí)現(xiàn)。

　　· 反饋來(lái)源的多樣性: 在使用人工智能技術(shù)時(shí),收集盡可能多的用戶(hù)的反饋,以便最大限度地減少偏差和增強(qiáng)表示。

　　· 迭代發(fā)展: 遵循敏捷的方法,這樣人工智能模型就可以根據(jù)用戶(hù)的反饋進(jìn)行訓(xùn)練和再訓(xùn)練,人工智能代理就可以根據(jù)用戶(hù)的需求進(jìn)行進(jìn)化。

　　確保透明度和問(wèn)責(zé)制

　　大赦國(guó)際發(fā)展的透明度和問(wèn)責(zé)制對(duì)公眾信任和道德操守至關(guān)重要。可解釋的AI(XAI)方法幫助利益攸關(guān)方了解AI系統(tǒng)如何工作、決策過(guò)程和監(jiān)控程序。

　　問(wèn)責(zé)制和審計(jì)需要數(shù)據(jù)集屬性、模型設(shè)計(jì)和培訓(xùn)資源的全面文檔。需要定期進(jìn)行道德評(píng)估,以發(fā)現(xiàn)和糾正偏見(jiàn)或不道德的做法,確保人工智能系統(tǒng)是負(fù)責(zé)、透明和符合人類(lèi)價(jià)值觀的。

　　結(jié)論

　　大赦國(guó)際的協(xié)調(diào)涉及開(kāi)發(fā)人員、道德專(zhuān)家、法律當(dāng)局和其他適當(dāng)?shù)睦尕P(guān)方的共同努力,以實(shí)現(xiàn)為人民設(shè)計(jì)和可供人民使用的大赦制度的建立。隨著人工智能系統(tǒng)領(lǐng)域越來(lái)越具有包容性,必須始終考慮以人為本的倫理難題,并建立透明度,以作為推動(dòng)因素。

標(biāo)簽： AI

分享到：

上一篇：人工智能時(shí)代的數(shù)據(jù)架構(gòu)關(guān)鍵...

下一篇：視覺(jué)智能替代方案：推動(dòng)人工...

傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明：凡本網(wǎng)注明[來(lái)源：傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件，版權(quán)均為傳動(dòng)網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“傳動(dòng)網(wǎng)”，違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件，均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士，版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者，禁止擅自篡改，違者自負(fù)版權(quán)法律責(zé)任。

相關(guān)資訊

技術(shù)熱點(diǎn)