1 引言
20世紀90年代以來,以DCS(集散控制系統(tǒng))為代表的現(xiàn)代化自動控制系統(tǒng)在火電機組中得到了普遍應(yīng)用,數(shù)以千計的傳感器數(shù)據(jù)提供了大量反映電站設(shè)備運行狀態(tài)的信息。但是由于傳感器的故障、漂移和各種干擾的存在使得測量數(shù)據(jù)中可能會產(chǎn)生一些不良值,從而使基于這些數(shù)據(jù)開發(fā)的系統(tǒng)性能下降,甚至造成系統(tǒng)無法工作。對測量數(shù)據(jù)中不良值的檢驗已經(jīng)引起了國內(nèi)外學(xué)者的重視[1]。
測量數(shù)據(jù)優(yōu)化估計值的求取是不良數(shù)據(jù)檢驗問題的關(guān)鍵,當(dāng)前有如下幾種求取方法:基于硬件冗余的互判法,該方法簡單實用,但是要增加相應(yīng)的硬件投入,只能適用于對一些關(guān)鍵參數(shù)的測量,而且當(dāng)冗余傳感器的數(shù)目較少時不能準(zhǔn)確定位故障傳感器;基于采樣數(shù)據(jù)的時間序列關(guān)系的AR、ARMA以及Kalman等時間序列預(yù)測模型,但它們對過程數(shù)據(jù)的突變會產(chǎn)生誤判,同時其模型參數(shù)要求大采樣,實際過程常常不能滿足;帶時間窗的新陳代謝方法,采用有限樣本進行預(yù)測,避免了大采樣的要求,但該方法只能對不良數(shù)據(jù)進行質(zhì)疑,不能完全檢驗,同時不能實現(xiàn)糾錯的目的;基于機理模型,采用解析冗余技術(shù)進行參數(shù)預(yù)測,但是這要求有足夠精確的機理模型,同時對于非線性復(fù)雜系統(tǒng)模型計算量大,有時不能滿足實時的要求[2~4]。

[align=left] 本文給出了基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)AANN(Auto-associate Neural Networks)的不良數(shù)據(jù)自校正檢驗方法,利用AANN進行過程參數(shù)間的主要特征識別與相關(guān)估計,采用參數(shù)預(yù)測模型并通過殘差決策邏輯實現(xiàn)網(wǎng)絡(luò)輸入數(shù)據(jù)的選擇,有效地避免“野點”引起的“殘差污染”問題,以便正確估計測量參數(shù)。
[b]2 自聯(lián)想神經(jīng)網(wǎng)絡(luò)AANN
2.1 AANN網(wǎng)絡(luò)結(jié)構(gòu)
[/b] 自聯(lián)想神經(jīng)網(wǎng)絡(luò)是在1987年由Ballard針對編碼/解碼問題首先提出的[5],其網(wǎng)絡(luò)原型是一種具有對稱拓撲結(jié)構(gòu)的五層前饋傳遞網(wǎng)絡(luò),如圖1所示。AANN應(yīng)用到數(shù)據(jù)檢驗問題時具有比較明顯的物理意義,首先通過輸入層、映射層以及瓶頸層實現(xiàn)了輸入數(shù)據(jù)信息的壓縮。從網(wǎng)絡(luò)輸入的高維參數(shù)空間中提取了反映系統(tǒng)結(jié)構(gòu)的最具代表性的低維子空間,同時有效地濾去了測量數(shù)據(jù)中的噪聲和測量誤差,再通過瓶頸層、解映射層和輸出層實現(xiàn)數(shù)據(jù)的解壓縮,將前面壓縮的信息還原到各個參數(shù)值,從而實現(xiàn)各測量數(shù)據(jù)的重構(gòu)。
為了達到信息壓縮的目的,AANN網(wǎng)絡(luò)瓶頸層節(jié)點數(shù)目明顯小于輸入層,又為了防止形成輸入輸出之間的簡單單一映射,除了輸出層激勵函數(shù)采用線形函數(shù)外,其它各層均采用非線形的激勵函數(shù)。
[b]2.2 AANN樣本選擇與學(xué)習(xí)算法
2.2.1 樣本選擇
[/b] AANN學(xué)習(xí)的是輸入?yún)?shù)間的相關(guān)性,一般可以認為測量數(shù)據(jù)中的噪聲是不相關(guān)的,因此可直接將帶有噪聲的測量數(shù)據(jù)同時作為網(wǎng)絡(luò)的輸入和訓(xùn)練目標(biāo)值,并以式(1)作為網(wǎng)絡(luò)訓(xùn)練的目標(biāo)函數(shù)[/align]
[img=272,47]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-1.jpg[/img]
[align=left] 式中 n為訓(xùn)練樣本數(shù);xi、yi分別為網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)。
由于噪聲的存在,網(wǎng)絡(luò)訓(xùn)練結(jié)束的條件不是E的最小化,而是當(dāng)E收斂到一個小的定值而趨向不變時就停止訓(xùn)練,否則網(wǎng)絡(luò)將試圖對噪聲進行學(xué)習(xí),即所謂的“過學(xué)習(xí)”,從而降低網(wǎng)絡(luò)的“泛化”能力。
2.2.2 改進的BP算法
本文在AANN訓(xùn)練時應(yīng)用改進的BP算法,訓(xùn)練時增加了附加動量因子并采用自適應(yīng)學(xué)習(xí)速率[6]。
節(jié)點權(quán)值的調(diào)整公式為[/align]
[img=348,203]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-2.jpg[/img]
[img=352,43]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-3.jpg[/img]
[align=left][b]3 基于AANN的測量數(shù)據(jù)自校正檢驗方法
3.1 常規(guī)檢驗方法[/b]
[/align]
[img=346,101]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-4.jpg[/img]
AANN網(wǎng)絡(luò)能夠提取測量數(shù)據(jù)中主要信息,濾去噪聲等次要信息,通過數(shù)據(jù)重構(gòu)可以對測量數(shù)據(jù)進行估計,因此可以直接用來進行測量數(shù)據(jù)的檢驗,如圖2所示。將過程測量矢量x (k)作為網(wǎng)絡(luò)輸入,網(wǎng)絡(luò)輸出矢量y(k)即為測量數(shù)據(jù)的估計值,再根據(jù)估計余差矢量e(k)進行數(shù)據(jù)檢驗。但是,當(dāng)網(wǎng)絡(luò)輸入?yún)?shù)中存在大的異常值時,如儀表發(fā)生大的漂移或者故障時,其測量數(shù)據(jù)明顯不可信,這樣會使網(wǎng)絡(luò)輸入數(shù)據(jù)的完整性受到大的破壞,如果還以此測量參數(shù)作為輸入值,會將其錯誤傳遞到其它參數(shù)中去,引起所謂的“殘差污染”,不能得到正確的結(jié)果。
3.2 基于AANN的測量數(shù)據(jù)自校正檢驗方法
為了克服常規(guī)檢驗方法的不足,本文提出如圖3所示的基于AANN的測量數(shù)據(jù)自校正檢驗方法。
[img=338,190]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-5.jpg[/img]
圖中 A為殘差生成模塊,通過過程測量參數(shù)x (k)、AANN輸出參數(shù)有y(k)以及單參數(shù)預(yù)測模型輸出參數(shù)[img=26,15]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-6.jpg[/img]生成殘差;T為網(wǎng)絡(luò)輸入?yún)?shù)選擇模塊。
數(shù)據(jù)檢驗時,首先以當(dāng)前時刻測量數(shù)據(jù)x (k)作為AANN的輸入,得到網(wǎng)絡(luò)對應(yīng)的輸出數(shù)據(jù) y(k),再根據(jù)網(wǎng)絡(luò)的歷史輸出數(shù)據(jù)通過單參數(shù)預(yù)測模型,求得各參數(shù)的預(yù)測值[img=26,15]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-6.jpg[/img],然后通過殘差決策邏輯確定是否存在大的不良數(shù)據(jù),如果第i個測量參數(shù)存在大的異常數(shù)據(jù),通過T模塊將相應(yīng)的測量數(shù)據(jù)xi(k)替換為[img=36,25]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-3.jpg[/img],重新形成網(wǎng)絡(luò)的輸入?yún)?shù)[img=34,22]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-1.jpg[/img],產(chǎn)生網(wǎng)絡(luò)新的輸出。
[b] 3.2.1 單參數(shù)預(yù)測模型
[/b] 在連續(xù)采樣的系統(tǒng)中,測量參數(shù)序列本身也是一個離散的隨機時間序列。同樣,經(jīng)過AANN處理后的輸出量也具有一定的時序特性,因此可以利用時間序列預(yù)測方法對單參數(shù)進行初步預(yù)測。根據(jù)預(yù)測值可以對單參數(shù)的大異常值進行質(zhì)疑,如果測量參數(shù)與預(yù)測參數(shù)相差不大,則此測量參數(shù)可以作為網(wǎng)絡(luò)的輸入?yún)?shù)。反之,可以用比測量參數(shù)更可信的預(yù)測值作為網(wǎng)絡(luò)輸入,以減少大的異常值對網(wǎng)絡(luò)輸出數(shù)據(jù)的影響。
3.2.2 殘差決策邏輯
對于同一個參數(shù),除了測量數(shù)據(jù)外,還有AANN的估計值與單參數(shù)預(yù)測模型的估計值,這些數(shù)據(jù)之間存在一定的殘差。
(1)當(dāng)所有測量數(shù)據(jù)與AANN對應(yīng)的輸出數(shù)據(jù)之間的殘差小于一定的閾值時,即式(6)成立時,表明不存在不良數(shù)據(jù)。
[img=328,27]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-2.jpg[/img]
式中 n為測量參數(shù)個數(shù);δi為相應(yīng)的閾值。
(2)當(dāng)式(6)不成立時,取
[sub][img=104,30]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-ss.jpg[/img][/sub], j=1,2,...,n ,其中σj為第j個測量參數(shù)的方差。如果式(7)不成立,則第i個測量參數(shù)中存在大的偏差,以[img=36,25]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-3.jpg[/img]替代xi(k)組成新的網(wǎng)絡(luò)輸入數(shù)據(jù)[img=34,22]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-1.jpg[/img],重新進行網(wǎng)絡(luò)計算。如果式(7)成立,則表明發(fā)生測量參數(shù)偏差不大,AANN輸出可以看作是測量數(shù)據(jù)的估計值。
[img=380,56]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-5.jpg[/img]
式中 αi為檢測閾值,且αi>δi。
4算例
[img=380,130]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-6.jpg[/img]
以圖4所示的某電廠200 MW機組回?zé)嵯到y(tǒng)為例,根據(jù)現(xiàn)場DCS系統(tǒng)測點的具體布置情況,以表1所列測點的測量數(shù)據(jù)作為研究對象。在機組的正常運行范圍內(nèi)通過DCS采集了各測點對應(yīng)的運行參數(shù),采樣間隔為30s,共400個樣本,并對它們進行了標(biāo)準(zhǔn)化處理。其中前200個作為網(wǎng)絡(luò)訓(xùn)練樣本,后200個作為測試樣本。數(shù)據(jù)檢驗時,AANN網(wǎng)絡(luò)結(jié)構(gòu)為5-8-3-8-5,采用改進的BP算法以此處理模式進行訓(xùn)練,誤差曲線如圖5所示。
[img=357,134]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-7.jpg[/img]
[img=342,211]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-8.jpg[/img]
[align=left]
為了驗證本文算法的有效性,以流量測點F2為例,在測試數(shù)據(jù)上迭加如式(8)所示定斜率漂移的不良數(shù)據(jù)。圖6顯示了應(yīng)用常規(guī)方法進行數(shù)據(jù)檢驗的結(jié)果,圖7顯示了本文方法的檢驗結(jié)果,兩圖中(a)為F2的測量值、估計值與真實值,(b)為各參數(shù)估計殘差的平方值,即各參數(shù)測量值與估計值之間的差的平方。[/align]
[img=297,383]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-9.jpg[/img]
[img=329,330]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-1.jpg[/img]
[align=center][img=288,44]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-2.jpg[/img]
可見,應(yīng)用AANN網(wǎng)絡(luò)能夠正確地反映測量數(shù)據(jù)中存在的不良數(shù)據(jù),但是,圖6中明顯地看出“殘差污染”的存在,從而使其它測量數(shù)據(jù)的估計值也具有比較大的重構(gòu)殘差。而采用本文方法(如圖7)可以對該現(xiàn)象進行有效地抑制。圖8(b)則顯示了應(yīng)用自校正方法前后各參數(shù)估計殘差平方和的變化情況,而如圖8(a)為不采用自校正方法時的檢驗結(jié)果。盡管F2對應(yīng)的殘差平方和明顯增大,但是其它測量數(shù)據(jù)的殘差也發(fā)生不合理的增加,顯然不能保證這些測量參數(shù)的估計精度。而采用本節(jié)的自校正方法后如圖8(b),只有故障儀表對應(yīng)的數(shù)據(jù)殘差發(fā)生大的變化,其它測量數(shù)據(jù)的殘差變化不大[/align][align=left]
5 結(jié)論
測量數(shù)據(jù)的正確性對電站監(jiān)測與優(yōu)化系統(tǒng)都是至關(guān)重要的,離開了數(shù)據(jù)的準(zhǔn)確性,任何研究與監(jiān)測算法是不切實際的。本文提出的基于AANN網(wǎng)絡(luò)的自校正數(shù)據(jù)檢驗方法,通過對神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)的處理與選擇,提高了神經(jīng)網(wǎng)絡(luò)方法在線應(yīng)用的準(zhǔn)確率,避免了數(shù)據(jù)檢驗時出現(xiàn)的“殘差污染”, 從而對測量數(shù)據(jù)中不良值進行正確檢測與定位,同時能夠?qū)Σ涣紨?shù)據(jù)進行正確的重構(gòu)與估計。通過現(xiàn)場實際采集數(shù)據(jù)驗證了該方法的有效性,表明本文方法具有十分重要的現(xiàn)實意義。[/align]
[img=301,329]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-3.jpg[/img]