摘 要:在研究基于自抗擾控制器的機器人無標定視覺伺服方法的基礎(chǔ)上,提出了一種新的雙環(huán)結(jié)構(gòu)機器人無標定自抗擾視覺伺服控制方法。內(nèi)環(huán)采用Kalman濾波算法進行圖像雅可比矩陣的在線辨識,可較好地逼近真實模型;外環(huán)采用自抗擾控制器,利用非線性觀測器實時估計系統(tǒng)相對于當前估計模型的總擾動,并在控制中加以動態(tài)補償。針對六自由度工業(yè)機器人進行了二維運動目標的跟蹤實驗,實驗結(jié)果表明了該方法的可行性和有效性。
關(guān)鍵詞:Kalman濾波;自抗擾控制器;無標定;視覺伺服
1 引言
近年來,無標定條件下的機器人視覺伺服控制以其靈活、魯棒等特點,逐漸成為機器人視覺伺服控制領(lǐng)域的研究熱點.所謂無標定是指在未知手眼關(guān)系模型的情況下,直接利用系統(tǒng)圖像信息設(shè)計控制律,驅(qū)動機器人運動,實現(xiàn)對運動目標的操作.要解決這個問題首先必須知道機器人手眼之間的非線性映射關(guān)系,根據(jù)描述該非線性關(guān)系所用的模型的不同,可將現(xiàn)有的各種無標定方法分為兩類.一類是基于圖像雅可比矩陣的方法,這是最基本的機器人無標定視覺控制方法,其基本思想是:在每一個時刻,用線性圖像雅可比矩陣實時估計機器人手眼之間的非線性映射關(guān)系,據(jù)此得出機器人下一時刻的運動控制量;第二類是用神經(jīng)網(wǎng)絡(luò)的方法擬合機器人手眼之間的非線性映射關(guān)系,這種方法需要事先離線訓練機器人運動空間內(nèi)的大量樣本點,對于機器人的多自由度運動空間,有時難以獲得足夠樣本.蘇劍波等人 把無模型理論和自抗擾控制器(Auto Disturbance Rejection Controller,ADRC) 思想應用于無標定機器人視覺伺服領(lǐng)域,設(shè)計了不依賴于特定任務(wù)的廣泛意義下的手眼協(xié)調(diào)控制器,取得了良好的效果.但是ADRC的擾動補償精度與系統(tǒng)估計模型和實際系統(tǒng)模型之間的差值有關(guān),差值越小,精度越高,差值越大,精度越低,甚至導致系統(tǒng)不穩(wěn)定.
基于以上原因,本文將圖像雅可比矩陣在線辨識方法與基于ADRC的機器人無標定視覺伺服方法相結(jié)合,提出了一種新的雙環(huán)結(jié)構(gòu)的機器人無標定自抗擾視覺伺服控制方法.
2 問題描述
基于ADRC的機器人無標定視覺伺服控制,其基本思想是首先估計出系統(tǒng)的圖像雅可比矩陣初值,以此作為系統(tǒng)的近似線性模型并在運動過程中保持不變,而把這種近似所造成的非線性模型誤差(即系統(tǒng)內(nèi)擾)以及圖像檢測誤差、未知外部擾動等之和(即系統(tǒng)外擾)看成是系統(tǒng)的總擾動量,用一個非線性的狀態(tài)觀測器(Extended State Obse~er,ESO)實時估計并在控制中加以動態(tài)補償 ,整個系統(tǒng)的結(jié)構(gòu)如圖1所示.
圖中(

)表示運動目標的期望位置坐標,這可用如式(1)所示的一階預估獲得:

式中,

表示。(k)表示k時刻目標在圖像坐標系中的位置矢量.

)表示k時刻機器人手爪在圖像坐標系中的位置坐,

)為目標在空間坐標系中的位置,Zx[sub]1[/sub]和Zx[sub]2[/sub]Zx2分別為x方向擴張狀態(tài)觀測器ESO的輸出,Zy[sub]1[/sub]和Zy[sub]2[/sub]分別為y方向擴張狀態(tài)觀測器ESO的輸出,Uox和Uoy分別為x,y方向非線性狀態(tài)誤差反饋控制器(Non.Linear States Error Feedback,NLSEF)的輸出,

為系統(tǒng)擾.采用圖像雅可比矩陣J,來描述機器人手眼之間的非線性映射關(guān)系,其中J,的定義
如式(2)所示.

式中,

為機器人手爪在機器人運動空間的運動速度,也就是機器人的運動控制量u,即


為其在圖像特征空間中的運動速度.離散化后為:

通過初始的試探運動可得到該矩陣的初始估計值

并在整個控制過程中保持不變.
實驗表明當J,的變化范圍較小時,這種控制策略具有一定的魯棒性.但當對象模型變化較大時,整個系統(tǒng)的控制效果會變差.若受控對象有已知部分,把此部分補償給擴張狀態(tài)觀測器輸入項,只對不確定部分進行估計,則擴張狀態(tài)觀測器的估計精度會提高.在本系統(tǒng)中,當目標靜止時J,的變化范圍較小,擴張狀態(tài)觀測器能較好地估計出系統(tǒng)的實時擾動,系統(tǒng)具有較好的控制性能;當目標運動時,實際的圖像雅可比矩陣變化范圍增大.目標的運動速度越快,圖像雅可比矩陣變化就越明顯。如圖2所示.其中圖2(a)表示目標和手爪在圖像平面的運動軌跡,圖2(b)為對應的圖像雅可比矩陣值(以J[sub]11[/sub](k) J[sub]22[/sub](k)為例)的變化曲線.
此時若仍用初始試探運動所估計的圖像雅可比矩陣值作為系統(tǒng)的模型,會導致估計模型與實際系統(tǒng)模型之問的差值過大,使得用來估計系統(tǒng)實時擾動的擴張狀態(tài)觀測器的估計精度降低,從而導致整個系統(tǒng)的控制性能下降.
3 基于雙環(huán)結(jié)構(gòu)的機器人無標定自抗擾視覺
伺服控制原理由以上分析可以看出,如果我們能夠較準確地估計出每個時刻的圖像雅可比矩陣的值:而不是用一個固定的圖像雅可比矩陣值來近似實時變化的系統(tǒng)模型,就可以減小估計模型與實際模型的差,提高擴張狀態(tài)觀測器的估計精度,從而使之能夠較好地實時估計出系統(tǒng)相對于當前估計模型的總擾動,提高補償精度,最終實現(xiàn)更高性能的目標定位與跟蹤.基于此,本文將圖像雅可比矩陣在線辨識方法和基于ADRC的機器人無標定視覺伺服方法相結(jié)合,構(gòu)建了如圖3所示的雙環(huán)結(jié)構(gòu)的機器人無標定自抗擾視覺伺服控制系統(tǒng).內(nèi)環(huán)采用Kalman濾波算法進行圖像雅可比矩陣在線辨識,通過前幾個時刻的運動特征不斷估計更新當前時刻的手眼關(guān)系模型,以較好地逼近真實模型.外環(huán)采用自抗擾控制器,這時由于內(nèi)環(huán)的作用,使得估計模型和實際模型的差值較小,非線性觀測器能夠更好地估計出系統(tǒng)相對于當前估計模型的總擾動并在控制中加以動態(tài)補償,從而提高視覺伺服系統(tǒng)的性能.
對于單眼固定平面視覺伺服系統(tǒng)(u[sub]z[/sub]=0),當目標靜止或勻速運動時可將式(3)寫為:

式中,J[sub]11[/sub](k)、J[sub]22[/sub](k)由Kalman濾波算法進行在線辨識


1為系統(tǒng)建模誤差與未知外部擾動

之
和,稱之為系統(tǒng)的總擾動量,用ESO實時估計.與直接基于ADRC 時系統(tǒng)的總擾


考y ] 相 比,顯然,當圖像雅可比矩陣變化明顯時,系統(tǒng)的總擾動量大大降低了.此時,可設(shè)計出如下形式的基于雙環(huán)結(jié)構(gòu)的離散ESO 和非線性狀態(tài)誤差反饋律(NLSEF):

其中,h為采樣步長,非線性函數(shù)fal()的表達式如下:

式(4)中,圖像雅可比矩陣的在線辨識可用Kal—man濾波實現(xiàn),其基本思想是首先構(gòu)造一個線性時變系統(tǒng),以待估的圖像雅可比矩陣參數(shù)作為系統(tǒng)的狀態(tài),也就是把對圖像雅可比矩陣的估計轉(zhuǎn)化為對這個線性時變系統(tǒng)狀態(tài)的觀測.然后,用Kalman濾波算法對此系統(tǒng)的狀態(tài)進行觀測,由于算法中考慮了噪聲對系統(tǒng)狀態(tài)觀測的影響,因此具有較強的魯棒性 J.該算法可簡單描述如下:
stepl:構(gòu)造線性時變系統(tǒng)
定義系統(tǒng)的狀態(tài)為:

step2:按照Kahnan濾波估計算法,建立遞推估計

其中

為噪聲方差陣,根據(jù)實際的噪聲情況設(shè)定,P(k)為狀態(tài)估計誤差方差陣.而狀態(tài)估計的初始值量x(O)(即J(0))可利用初始的試探運動獲得,此后在雅可比矩陣的估計中直接使用機器人已完成的運動獲得的信息,無需再引入冗余的試探運動.
4 實驗研究
實驗裝置如圖4所示,系統(tǒng)的硬件部分主要由:MOTOMANSV3機器人、SONY 1/3”彩色CCD攝像頭、機器人控制柜、控制計算機、北京微視圖像采集卡等組成,CCD攝像頭固定安裝于工作臺的正上方,可同時觀察機器人手爪和目標.CCD完成目標和機器人手爪圖像的獲取,經(jīng)過圖像處理和識別得到目標和機器人手爪在圖像中的位置.為簡化圖像處理過程,攝像機使用兩種不同顏色的正方形色塊來區(qū)分手爪和目標,分別取兩顏色塊的質(zhì)心坐標為手爪與目標的圖像坐標.采用RS-232串口通信,采樣周期為500 ms.實驗的任務(wù)是目標在給定的機器人工作平面上做折線運動,分別采用傳統(tǒng)的PI控制策略、基于ARDC的控制策略和本文所提出的基于雙環(huán)結(jié)構(gòu)的控制策略驅(qū)動機器人手爪去跟蹤在機器人工作平面上做任意折線運動的目標,使兩者在圖像平面上達到重合.
實驗1:基于PI的機器人無標定視覺伺服控制PI控制器參數(shù)設(shè)置如下:
比例系數(shù): 方向為0.28,Y方向為0.3,積分系數(shù): 方向為0.0008,Y方向為0.0012.
實驗結(jié)果如圖5所示,其中圖5(a)、(b)分別表示目標和手爪在圖像平面中 和Y方向上的運動軌跡.
實驗2:基于ARDC的機器人無標定視覺伺服控制ADRC控制器參數(shù)設(shè)置如下:
實驗結(jié)果如圖6所示,其中圖6(a)、(b)分別表示目標和手爪在圖像平面中 和Y方向上的運動軌跡,圖6(c)表示控制過程中圖像雅可比矩陣的變化曲線(以J[sub]11[/sub](k)、J[sub]22[/sub](k)為例),圖6(d)表示系統(tǒng)內(nèi)擾


的變化曲線.實驗結(jié)果表明,當手眼關(guān)系參數(shù)變化較小且具有較強線性特性時,采用PI控制和
ADRC控制都能達到較好的視覺跟蹤效果;當手眼關(guān)系參數(shù)變化較大時,兩者的跟蹤性能都會下降,但后者的跟蹤性能和對對象模型參數(shù)變化的魯棒性均強手前者.
實驗3:基于雙環(huán)結(jié)構(gòu)的機器人無標定自抗擾視覺伺服控制
圖像雅可比矩陣在線辨識參數(shù)設(shè)置如下:
狀態(tài)噪聲方差陣

2為二維單位陣),圖像觀察噪聲方差陣

,狀態(tài)估計方差陣P(k)的初始值P(0)=10[sup]5[/sup]I[sub]2*2[/sub],通過初始的試探運動獲得狀態(tài)估計的初始值圣x(0)(即J(0))與實驗2相同,仍為J。
ADRC控制器參數(shù)設(shè)置如下:

實驗結(jié)果如圖7所示,其中圖7(a)、(b)分別表示目標和手爪在圖像平面中 和Y方向上的運動軌跡,圖7(c)表示控制過程中圖像雅可比矩陣的變化曲線(以J[sub]11[/sub](k)、J[sub]22[/sub](k)為例),圖7(d)表示固定雅可比矩陣時系統(tǒng)內(nèi)擾口 (k)的變化曲線,圖7(e)表示引入雅可比矩陣在線辨識算法后系統(tǒng)內(nèi)擾


的變化曲線。
從實驗結(jié)果可以看出,采用基于Kalman濾波在線辨識的機器人無標定自抗擾視覺伺服這種雙環(huán)結(jié)構(gòu)的控制方法后,因圖像雅可比矩陣變化帶來的系統(tǒng)內(nèi)擾量降低了,系統(tǒng)的控制性能得到了提高.同時,在實驗中我們也發(fā)現(xiàn),當跟蹤快速運動的目標時,直接采用ADRC跟蹤性能會下降,但簡單地將基于圖像雅可比矩陣在線辨識的無標定視覺伺服方法和基于ADRC的無標定視覺伺服方法相結(jié)合,并不能很好地改善系統(tǒng)的性能,原因是,雙環(huán)結(jié)構(gòu)減小了系統(tǒng)的建模誤差(即內(nèi)擾),此時若不相應地減小ESO的參數(shù)(主要是用來估計系統(tǒng)實時擾動量的參數(shù){bx[sub]2[/sub],by[sub]2[/sub] }),相當于增大了{b加b }的值,從而導致估計值振蕩,同樣會使ESO的估計精度降低,進而使整個系統(tǒng)的性能下降.ESO相關(guān)參數(shù)的減少量與內(nèi)擾量之間到底存在著什么樣的量化關(guān)系,有待于進行進一步的深入研究.但可以肯定的是,這種獨立于具體系統(tǒng)的關(guān)系一定是存在的,而且是非線性的.
5 結(jié)論
本文將圖像雅可比矩陣在線辨識方法與基于ADRC的機器人無標定視覺伺服方法相結(jié)合,提出了雙環(huán)結(jié)構(gòu)的機器人無標定自抗擾視覺伺服控制策略.內(nèi)環(huán)采用Kalman濾波算法進行圖像雅可比矩陣在線辨識,可較好地逼近真實的視覺映射模型.外環(huán)采用自抗擾控制器,利用非線性觀測器實時估計出系統(tǒng)相對于當前估計模型的總擾動,并在控制中加以動態(tài)補償.針對六自由度工業(yè)機器人進行了二維運動目標的跟蹤實驗,實驗結(jié)果表明該方法在一定程度上解決了當目標做大范圍運動時,基于自抗擾控制器的無標定視覺伺服系統(tǒng),由于估計模型和實際模型差值過大,導致控制器補償精度降低、系統(tǒng)控制性能下降的問題.