神經(jīng)網(wǎng)絡(luò)控制器為復(fù)雜機器人提供了穩(wěn)定性保障,為自動駕駛汽車和工業(yè)機器的更安全部署鋪平了道路。麻省理工學(xué)院的研究人員開發(fā)了一種高效的算法來認證復(fù)雜系統(tǒng)中的Lyapunov函數(shù),確保神經(jīng)網(wǎng)絡(luò)控制的機器人在各種環(huán)境中實現(xiàn)穩(wěn)定性和安全性。
神經(jīng)網(wǎng)絡(luò)對工程師如何設(shè)計機器人控制器產(chǎn)生了巨大的影響,催生了自適應(yīng)能力更強、效率更高的機器。不過,這些類似大腦的機器學(xué)習(xí)系統(tǒng)也是一把雙刃劍:其復(fù)雜性使其功能強大,但也難以保證由神經(jīng)網(wǎng)絡(luò)驅(qū)動的機器人能夠安全地完成任務(wù)。
驗證安全性和穩(wěn)定性的傳統(tǒng)方法是通過稱為 Lyapunov 函數(shù)的技術(shù)。如果你能找到一個 Lyapunov 函數(shù)的值持續(xù)下降,那么你就可以知道,與較高值相關(guān)的不安全或不穩(wěn)定情況將永遠不會發(fā)生。不過,對于由神經(jīng)網(wǎng)絡(luò)控制的機器人來說,之前驗證 Lyapunov 條件的方法并不能很好地擴展到復(fù)雜的機器。
麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(CSAIL)和其他機構(gòu)的研究人員現(xiàn)在已經(jīng)開發(fā)出新的技術(shù),可以在更復(fù)雜的系統(tǒng)中嚴格認證Lyapunov計算。該算法高效搜索并驗證了Lyapunov函數(shù),為系統(tǒng)提供了穩(wěn)定性保障。這種方法有可能使機器人和自動駕駛車輛(包括飛機和航天器)的部署更加安全。
為了超越以往的算法,研究人員在訓(xùn)練和驗證過程中找到了一條省錢的捷徑。他們生成了成本更低的反例——例如,來自傳感器的對抗性數(shù)據(jù)可能會使控制器失靈——然后對機器人系統(tǒng)進行優(yōu)化,以應(yīng)對這些反例。了解這些邊緣案例有助于機器學(xué)習(xí)如何處理具有挑戰(zhàn)性的情況,從而使它們能夠在比以往更廣泛的條件下安全運行。然后,他們開發(fā)了一種新穎的驗證公式,能夠使用可擴展的神經(jīng)網(wǎng)絡(luò)驗證器α,β-CROWN,在反例之外提供嚴格的最壞情況保證。
“我們已經(jīng)在人形機器人和機器狗等AI控制的機器上看到了一些令人印象深刻的經(jīng)驗性能,但這些AI控制器缺乏對安全關(guān)鍵型系統(tǒng)至關(guān)重要的形式保證?!甭槭±砉W(xué)院電氣工程與計算機科學(xué)(EECS)博士生、CSAIL 附屬研究員Lujie Yang說:“我們的工作縮小了神經(jīng)網(wǎng)絡(luò)控制器的性能水平與在現(xiàn)實世界中部署更復(fù)雜的神經(jīng)網(wǎng)絡(luò)控制器所需的安全保證之間的差距?!?/p>
在數(shù)字演示中,該團隊模擬了帶有激光雷達傳感器的四旋翼無人機如何在二維環(huán)境中保持穩(wěn)定。他們的算法成功地將無人機引導(dǎo)到穩(wěn)定的懸停位置,僅使用激光雷達傳感器提供的有限環(huán)境信息。
在另外兩個實驗中,他們的方法使兩個模擬機器人系統(tǒng)能夠在更廣泛的條件下穩(wěn)定運行:倒立擺和路徑跟蹤車輛。這些實驗雖然規(guī)模不大,但比以前的神經(jīng)網(wǎng)絡(luò)驗證可能做的要復(fù)雜得多,特別是因為它們包含傳感器模型。
“與常見的機器學(xué)習(xí)問題不同,嚴格使用神經(jīng)網(wǎng)絡(luò)作為Lyapunov函數(shù)需要解決困難的全局優(yōu)化問題,因此可擴展性是關(guān)鍵瓶頸,”加州大學(xué)圣地亞哥分校計算機科學(xué)與工程副教授Sicun Gao說, “目前的工作通過開發(fā)算法方法做出了重要貢獻,這些算法方法更適合神經(jīng)網(wǎng)絡(luò)的特定使用,因為Lyapunov在控制問題中的作用?!?/p>
與現(xiàn)有方法相比,它在可擴展性和解決方案質(zhì)量方面取得了顯著的改進。這項工作為進一步開發(fā)神經(jīng)Lyapunov方法的優(yōu)化算法,以及深度學(xué)習(xí)在控制和機器人技術(shù)中的嚴格使用開辟了令人興奮的方向。
新的穩(wěn)定性方法具有潛在的廣泛應(yīng)用。在這些應(yīng)用中,保證安全至關(guān)重要。它可以幫助確保飛機和航天器等自動駕駛汽車的行駛更順暢。同樣,運送物品或繪制不同地形的無人機也可以從這種安全保證中受益。
新方法不僅限于機器人技術(shù),在未來可能會幫助其他應(yīng)用,如生物醫(yī)學(xué)和工業(yè)加工等。雖然該技術(shù)在可擴展性方面比以前的工作有所提升,但研究人員正在探索它如何在具有更高維度的系統(tǒng)中表現(xiàn)得更好。他們還希望考慮激光雷達讀數(shù)以外的數(shù)據(jù),例如圖像和點云。
作為未來的研究方向,該團隊希望為處于不確定環(huán)境和易受干擾的系統(tǒng)提供相同的穩(wěn)定性保證。例如,如果一架無人機面臨一陣強風(fēng),研究人員希望確保它仍然能穩(wěn)定飛行并完成預(yù)期的任務(wù)。
此外,他們打算將他們的方法應(yīng)用于優(yōu)化問題,其目標是在保持穩(wěn)定的同時最小化機器人完成任務(wù)所需的時間和距離。并計劃將他們的技術(shù)擴展到類人機器人和其他現(xiàn)實世界的機器,在這些機器中,機器人需要在與周圍環(huán)境接觸時保持穩(wěn)定。