控制算法手記: 基于模型 and/or 數(shù)據(jù)驅(qū)動

文:李磊2021年第五期

  對于工業(yè)自動化系統(tǒng)來說,動態(tài)控制算法應該具備實時(運算時間可短至毫秒級別或者更低)、可靠(始終保持對系統(tǒng)的一致、有效控制,保證控制系統(tǒng)的穩(wěn)定性)、魯棒性(干擾或不確定情況下,輸出偏差在給定范圍內(nèi),不能相差很大或得到完全相反的結(jié)果)、確定(輸出確定性指令使系統(tǒng)盡可能精確地跟隨參考輸入,而不是概率意義上的判斷)以及可解釋性(和現(xiàn)實的被控對象關(guān)聯(lián))的特點。根據(jù)在控制實施過程中是否引入被控對象動力學模型,可將控制方法分為兩類:基于模型的控制和數(shù)據(jù)驅(qū)動控制,分別如圖2(a)和(b)所示?;谀P偷目刂圃诤侠斫<僭O(shè)下,首先建立被控對象模型描述其動力學特性并以該模型為中心,完成控制器設(shè)計、參數(shù)整定、性能分析以及實時運算;數(shù)據(jù)驅(qū)動控制則直接從系統(tǒng)可用數(shù)據(jù)出發(fā),通過對數(shù)據(jù)的有效組織和整理(表現(xiàn)為數(shù)據(jù)模型),完成包含設(shè)計、分析以及實時運算的整個控制流程。

  基于模型的控制根植于這樣一種理念:既然是對被控對象進行動態(tài)控制,如果能夠準確知道被控對象動力學行為,便能有針對性地設(shè)計控制器以給出正確的控制指令;被控對象動力學行為如果能夠通過數(shù)學模型精確描述,即數(shù)學模型所代表的系統(tǒng)和實際被控對象等效,那以模型為中心得到的理論控制性能和控制器實際實施中性能一致。因此,如圖2(a)所示,基于模型的控制器設(shè)計第一步就是建立被控對象模型,最終控制性能分析和實際運算也是依據(jù)模型,其中模型可以經(jīng)辨識得到或者從作用機理(物理、化學定理定律)出發(fā)推導而來。

控制系統(tǒng)

圖 1 自動化系統(tǒng)組成部分

控制系統(tǒng)

圖 2 不同控制方法實施流程基于模型的控制

  理想情況下,如果建模精確、參數(shù)準確,模型能夠正確反映被控系統(tǒng)在各種激勵/工況下的變化情況:那么就能夠通過模型的計算結(jié)果得到被控系統(tǒng)的實時輸出值,代替?zhèn)鞲衅鞯淖饔茫@對于不便于安裝傳感器或傳感測量系統(tǒng)成本較高的場合至關(guān)重要;機理模型自動保證了被控系統(tǒng)輸入、輸出以及內(nèi)部狀態(tài)變量之間結(jié)構(gòu)化、可解釋的聯(lián)系(這種聯(lián)系已經(jīng)自動包含在由大量實驗和理論發(fā)現(xiàn)總結(jié)得到的各種普適性定理定律中),這正是利用深度學習利用各種深層神經(jīng)網(wǎng)絡(luò)所渴望達到的(相對于支持向量機等“淺層學習”方法,深度學習在多層次網(wǎng)絡(luò)結(jié)構(gòu)的架構(gòu)下,通過對原始數(shù)據(jù)進行逐層處理,逐步組合低層特征形成更加抽象的高層類別或特征)。充分利用模型所給出的信息,可以達到對被控對象最優(yōu)的控制效果。從上世紀60年代以來,最優(yōu)控制(Optimal Control)、模型預測控制MPC(Model Predictive)、自適應控制(Indirect AdaptiveControl)以及針對非線性系統(tǒng)的反饋線性化控制(Feedback Linearization)、反步控制(Back-stepping Control)等各種基于模型的控制方法取得了重要研究進展,在實際應用中也已經(jīng)體現(xiàn)了巨大威力,如模型預測控制(即根據(jù)數(shù)學模型預測被控系統(tǒng)未來動態(tài)變化情況,并根據(jù)此預測和當前約束計算出最優(yōu)的控制輸入指令)已經(jīng)成功地控制人形機器人Atlas(@BostonDynamics) 優(yōu)雅地完成奔跑、跳躍、后空翻以及高難度體操動作(在這些動作過程中,需要全身多達幾十個關(guān)節(jié)以及相應執(zhí)行機構(gòu)同步、精準完成規(guī)定動作)。

  由于高度依賴于模型,模型的準確性決定了基于模型的控制系統(tǒng)性能。為簡化模型并方便控制器設(shè)計,如圖2(a)所示,在建模時通常會進行合理假設(shè),未建模動態(tài)不可避免地存在。加之未知外界干擾或噪聲,使得被控對象實際的動力學行為和模型所代表的動力學行為出現(xiàn)偏差,等效原則不再適用,會導致基于模型的控制系統(tǒng)性能惡化甚至系統(tǒng)失穩(wěn)。此時,在對未建模動態(tài)或干擾進行假設(shè)的前提下,可通過相應的魯棒性設(shè)計以保證控制系統(tǒng)的控制性能。

  當被控對象無法準確建模(如隨機性或不確定性系統(tǒng))或者為高復雜性系統(tǒng)(用來等效描述其動力學行為的模型復雜度也隨之提高),基于模型的控制方法面臨著控制算法結(jié)構(gòu)復雜以及由此帶來的設(shè)計、分析、實時運算難度加大等問題,甚至無法設(shè)計出有效的基于模型的控制器。另一方面,隨著自動化系統(tǒng)數(shù)字化程度不斷增強,系統(tǒng)可用數(shù)據(jù)量也隨著增加。以上兩方面為數(shù)據(jù)驅(qū)動控制的發(fā)展及應用開辟了道路。

  數(shù)據(jù)驅(qū)動控制

  從字面上來看,數(shù)據(jù)驅(qū)動控制包含數(shù)據(jù)驅(qū)動和控制兩個詞,即利用數(shù)據(jù)驅(qū)動方法完成控制任務(wù)。從數(shù)據(jù)驅(qū)動的角度來看,一種常見的觀念是將數(shù)據(jù)驅(qū)動和機器學習、神經(jīng)網(wǎng)絡(luò)直接對應起來。實際上,機器學習或神經(jīng)網(wǎng)絡(luò)等方法并不代表著數(shù)據(jù)驅(qū)動的全部內(nèi)涵。數(shù)據(jù)驅(qū)動可以理解為利用特定框架或結(jié)構(gòu)來組織整理數(shù)據(jù)并挖掘相關(guān)信息以完成特定任務(wù),這個意義上來看,神經(jīng)網(wǎng)絡(luò)或者決策樹、支持向量機都可以理解為“特定框架/結(jié)構(gòu)”中的一種,對于工業(yè)自動化控制的應用場合來說,當然也存在著其它類型的組織、整理數(shù)據(jù)的方法。從控制的角度來看:數(shù)據(jù)驅(qū)動控制作為動態(tài)控制方法的一類,其性能應該滿足工業(yè)自動化系統(tǒng)對動態(tài)控制算法的一般性要求。在綜合了數(shù)據(jù)驅(qū)動控制的不同描述后,參考文獻給出了數(shù)據(jù)驅(qū)動控制嚴格定義。

  【數(shù)據(jù)驅(qū)動控制定義】:數(shù)據(jù)驅(qū)動控制包含所有這樣的控制理論及方法:這些理論和方法通過直接利用(被控系統(tǒng)在線/離線輸入/輸出數(shù)據(jù)或從數(shù)據(jù)處理過程中得到的知識),而并不通過(顯式地利用從被控對象數(shù)學模型得到的信息)來設(shè)計控制器;這些理論和方法的穩(wěn)定性、收斂性和魯棒性能夠在合理假設(shè)前提下能夠通過嚴格的數(shù)學分析得到保證。

  如圖2(a, b)所示,與基于模型的控制方法相比,數(shù)據(jù)驅(qū)動控制方法直接從系統(tǒng)可用數(shù)據(jù)(數(shù)據(jù)本身包含了系統(tǒng)結(jié)構(gòu)變化、未建模動態(tài)和未知干擾等信息)出發(fā),擺脫了對被控對象模型的依賴由此提高了控制系統(tǒng)的魯棒性、并能夠有效地處理難以建模的被控對象的控制問題。值得注意的是,盡管目前機器學習、深度神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)驅(qū)動方法已經(jīng)成功地應用到外部環(huán)境感知、推理決策、故障診斷及預測等不同環(huán)節(jié)中(見圖1),但其在動態(tài)控制中的應用、理論分析仍有待進一步發(fā)展。作為參考,這里給出參考文獻對機器學習控制(Machine Learning Control)的定義。

  【機器學習控制定義】:機器學習控制是一種使用機器學習算法來學習有效控制率的概念,該概念用來因應難以或不可能(對要處理復雜控制任務(wù)的系統(tǒng))進行建模的場合。在該定義中,機器學習控制也是針對基于模型的控制方法無法應用的場合,以已經(jīng)存在的有效控制率為學習對象或內(nèi)容。然而關(guān)鍵性的問題正是面臨復雜控制任務(wù)時,如何設(shè)計這一有效控制率以保證系統(tǒng)正常運轉(zhuǎn),并提供機器學習所需要的足夠數(shù)據(jù)。

  參考文獻給出了這樣的例子:在受控/訓練環(huán)境下,用動作捕捉系統(tǒng)準確獲知無人機位置,并根據(jù)位置信息通過模型預測控制器準確控制無人機避障,然后使用強化學習對模型預測控制器進行學習;在測試環(huán)境中,撤掉動作捕捉系統(tǒng)(只有機載傳感器),利用已經(jīng)訓練好的深度神經(jīng)網(wǎng)絡(luò)來控制無人機運動。這里實際利用了深度神經(jīng)網(wǎng)絡(luò)強大的擬合和泛化能力,使得控制系統(tǒng)面臨未知新情況也能進行有效控制。按照參考文獻對數(shù)據(jù)驅(qū)動控制的定義,深度神經(jīng)網(wǎng)絡(luò)作為控制器雖然使用了離線數(shù)據(jù)進行訓練,但該訓練數(shù)據(jù)從模型預測控制而來,仍然顯式地使用了被控對象模型信息,并不嚴格屬于數(shù)據(jù)驅(qū)動控制的范疇。

控制系統(tǒng)

圖 3. 控制方法總結(jié)

  實際上,在深度學習取得重要進展的領(lǐng)域(如計算機視覺、自然語言處理等)中,所針對的系統(tǒng)已經(jīng)獨立自主地運行,而且存在著大批量相對容易獲取的 “場域”數(shù)據(jù)。對于工業(yè)自動化系統(tǒng)來說,如何對被控對象進行有效動態(tài)控制以保證其良好運轉(zhuǎn)已經(jīng)是一項艱巨的任務(wù);加之數(shù)據(jù)大多為小批量、單點的數(shù)據(jù),某些場景下甚至無法安裝傳感器獲取數(shù)據(jù),如何提供足夠數(shù)據(jù)保證深度學習的訓練效果以用于動態(tài)控制又是另一項重大課題。因此,如何將以各類機器/深度學習算法和動態(tài)控制具體需求相結(jié)合,是一個開放性問題,需要不斷進行探索和研究。針對工業(yè)自動化系統(tǒng)的特點,應該開發(fā)適用于工業(yè)自動化場合的數(shù)據(jù)驅(qū)動控制方法。除已經(jīng)在前面文章介紹的PID、ILC、MFAC、去偽控制(Unfalsified Control)、懶惰學習(Lazy Learning))、迭代反饋調(diào)節(jié)(Iterative Feedback Tuning)等其它數(shù)據(jù)驅(qū)動控制方法也取得重要研究進展并得到了實際應用。

  總結(jié)

  回到最開始的問題,在選擇控制方法時應該清醒地意識到:沒有一類控制方法能夠適用于所有應用場合,各類控制方法的優(yōu)缺點也是相對應用場景來說的;不應存在對某一類控制方法的偏執(zhí),控制算法的設(shè)計應該建立在對被控對象和應用場景的深入理解和把握的基礎(chǔ)上。如圖3(a)所示,參考文獻給出了一種根據(jù)被控對象建模情況選用控制方法的方式:對于能夠建立精確模型的被控對象,應該優(yōu)先使用基于模型的控制方法(考慮到該方法能夠?qū)崿F(xiàn)對被控對象的最優(yōu)控制);對于被控對象模型不太精確且有不確定性的情況,既可選用各種魯棒、自適應控制,也可選擇數(shù)據(jù)驅(qū)動控制方法;對于基于模型

  的控制力有不逮的場合則選擇數(shù)據(jù)驅(qū)動控制方法。從另一個層面來說,為達到最佳的控制效果,

  兩種控制方法也可根據(jù)各自優(yōu)勢結(jié)合使用,形成各種混合控制方法。例如:在基于模型的控制方法中,利用數(shù)據(jù)驅(qū)動方法處理難以建模部分或未知干擾(利用神經(jīng)網(wǎng)絡(luò)擬合能力),以提高魯棒性或者在線調(diào)節(jié)基于模型的控制器;在數(shù)據(jù)驅(qū)動控制方法中,利用機理模型提供有用信息、數(shù)據(jù)給數(shù)據(jù)驅(qū)動控制器、或修正數(shù)據(jù)驅(qū)動控制器給出的控制指令等等。

  綜上,基于模型和數(shù)據(jù)驅(qū)動控制方法不是互相排斥“or”的關(guān)系,而是互為補充“and”的關(guān)系,兩者結(jié)合構(gòu)成了整個動態(tài)控制方法體系,如圖3(b)所示。

  作者介紹

  李磊,浙江大學機電博士,佐治亞理工學院訪問學者(2016-2017),目前從事自動化控制算法研發(fā)工作。博士期間在IEEETMech、TIE等期刊發(fā)表多篇文章,目前擔任TMech,IJIRA(InternationalJournalofIntelligentRoboticsandApplications)等機電國際期刊審稿人。

控制系統(tǒng)

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

伺服與運動控制

關(guān)注伺服與運動控制公眾號獲取更多資訊

直驅(qū)與傳動

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

中國傳動網(wǎng)

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0
往期雜志
  • 2025年第一期

    2025年第一期

    伺服與運動控制

    2025年第一期

  • 2024年第六期

    2024年第六期

    伺服與運動控制

    2024年第六期

  • 2024年第五期

    2024年第五期

    伺服與運動控制

    2024年第五期

  • 2024年第四期

    2024年第四期

    伺服與運動控制

    2024年第四期

  • 2024年第三期

    2024年第三期

    伺服與運動控制

    2024年第三期