據(jù)英國(guó)《獨(dú)立報(bào)》近日?qǐng)?bào)道,人工智能研究團(tuán)隊(duì)OpenAI最新公布的報(bào)告指出,機(jī)器人已經(jīng)學(xué)會(huì)了使用自創(chuàng)的新語言彼此交流并協(xié)同完成任務(wù)。
OpenAI的專家進(jìn)行了一個(gè)實(shí)驗(yàn),他們讓一些軟件機(jī)器人完成一系列任務(wù),如移動(dòng)到簡(jiǎn)單二維虛擬世界中某個(gè)特定的位置。而且,他們使用增強(qiáng)學(xué)習(xí)技術(shù)讓軟件機(jī)器人以合作而非競(jìng)爭(zhēng)的形式來完成挑戰(zhàn),并向那些完成任務(wù)的機(jī)器人提供獎(jiǎng)勵(lì)。
OpenAI團(tuán)隊(duì)在博客上寫道:“在實(shí)驗(yàn)中,我們將人工智能機(jī)器人放入一個(gè)簡(jiǎn)單的世界中,教它們創(chuàng)造一種語言,賦予它們交流能力,接著讓它們通過與其他機(jī)器人交流來完成任務(wù)。如果它們完成某個(gè)任務(wù),會(huì)獲得獎(jiǎng)勵(lì)?!?/p>
研究結(jié)果表明,機(jī)器人會(huì)通過不斷試錯(cuò),記住那些能幫助它們完成某一任務(wù)的符號(hào)、單詞和信號(hào),并將這些信息存儲(chǔ)在自己的循環(huán)神經(jīng)網(wǎng)絡(luò)中,從而學(xué)會(huì)了彼此合作和交流。
研究人員指出:“如果某個(gè)機(jī)器人意識(shí)到,第二個(gè)機(jī)器人發(fā)送其他信息,可以幫它更好地完成任務(wù),那么這個(gè)機(jī)器人會(huì)準(zhǔn)確地告訴第二個(gè)機(jī)器人如何修改信息來使得這些信息盡可能有用?!睋Q句話說,這些機(jī)器人是在問,怎樣改進(jìn)自己的“語言”才能得到最多的集體獎(jiǎng)勵(lì)。
隨著研究人員提出的任務(wù)不斷加碼,語言也不斷進(jìn)化,最終,機(jī)器人學(xué)會(huì)了通過用不同的單詞組成句子彼此交流,從而協(xié)同工作。
由于語言持續(xù)不斷地發(fā)展并變得越來越復(fù)雜,研究人員希望建造出一臺(tái)翻譯機(jī)器人,向人類翻譯它們彼此之間的交流。