技術頻道

娓娓工業(yè)
您現(xiàn)在的位置: 中國傳動網(wǎng) > 技術頻道 > 技術百科 > 機器視覺在人機對弈系統(tǒng)中的應用研究

機器視覺在人機對弈系統(tǒng)中的應用研究

時間:2007-11-15 15:45:00來源:dujing

導語:?本文結(jié)合攝像頭圖像采集,以VC++6.0為開發(fā)工具,實現(xiàn)人機對弈情況的自動識別。首先介紹機器視覺的特點,以及基于計算機與嵌入式系統(tǒng)的不同點。然后描述系統(tǒng)結(jié)構(gòu)及其執(zhí)行過程。最后構(gòu)建針對五子棋運行的測試程序,并測試。
河南理工大學電氣工程與自動化學院 吳冰 金梟宇 魏建

本文結(jié)合攝像頭圖像采集,以VC++6.0為開發(fā)工具,實現(xiàn)人機對弈情況的自動識別。首先介紹機器視覺的特點,以及基于計算機與嵌入式系統(tǒng)的不同點。然后描述系統(tǒng)結(jié)構(gòu)及其執(zhí)行過程。最后構(gòu)建針對五子棋運行的測試程序,并測試。通過程序測試,系統(tǒng)能夠準確識別出人在棋盤上的落子情況,并在屏幕上顯示計算機應對落子的坐標圖像。在結(jié)合執(zhí)行模塊后可現(xiàn)場執(zhí)子與人對弈。

1 引言

人類感知外部世界的手段主要通過視覺、觸覺、聽覺和嗅覺等感覺器官,其中約83%的信息是由視覺獲取。機器視覺是利用光電成像系統(tǒng)采集被控目標的圖像,經(jīng)計算機或?qū)S玫膱D像處理模塊進行數(shù)字處理,進行被控目標尺寸、形狀、顏色等特征的識別,獲取周圍環(huán)境的信息,以指導機器人進行運動。機器視覺是一門綜合了計算機軟硬件、數(shù)字圖像處理、機械、光學、模擬與數(shù)字電路等技術的綜合學科。在機器人領域中,計算機視覺為機器人提供眼睛的功能。簡言之,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺是機器人研究領域中的一個非常重要的方向,它在機器人研究和應用中占有十分重要的地位,對機器人的智能化起著決定性作用。

2 思路分析

2.1 可行性

從視覺系統(tǒng)的運行環(huán)境可分為基于計算機和嵌入式兩大類系統(tǒng)。 基于計算機系統(tǒng)利用了其開發(fā)性,高度的編程靈活性和良好的操作界面,同時系統(tǒng)總體成本較低,在WINDOWS環(huán)境下編程。用戶可用它快速開發(fā)復雜高級的應用。

嵌入式系統(tǒng)中,系統(tǒng)軟件固化在圖像處理器中,通過類似于游戲鍵盤的簡單裝置對顯示在監(jiān)視器中的菜單進行配置,或在計算機上開發(fā)軟件然后下載。系統(tǒng)在體現(xiàn)了可靠性高、集成化、小型化、高速化、低成本等特點的同時也反映出智能化較差、程序的應變能力不強等劣勢。為了使機器人能夠適應復雜、動態(tài)的環(huán)境,具有學習、歸納和分析的能力,我們常常要把神經(jīng)網(wǎng)絡、決策樹、遺傳算法等機器學習方法應用到機器視覺中來,實現(xiàn)復雜條件下的圖像分割以及目標識別,于是在很多情況下,系統(tǒng)需要處理繁冗的程序,和可靈活的調(diào)試相結(jié)合。因此,測試系統(tǒng)采用基于計算機系統(tǒng)實現(xiàn)對物體識別的機器視覺。

自上世紀八十年代以來,機器視覺的研究已經(jīng)歷了從實險室走向?qū)嶋H應用的發(fā)展階段,國內(nèi)外學者進行了相當規(guī)模的研究及其實踐,解決了很多技術和應用層面的問題,為后續(xù)研究打開了方便之門。從簡單的二值圖象處理到高分辨率多灰度的圖象處理,從一般的二維信息處理到三維視覺機理以及模型和算法的研究都取得了很大的進展。而計算機工業(yè)水平的飛速提高以及人工智能、并行處理和神經(jīng)元網(wǎng)絡等學科的相應發(fā)展,更促進了機器視覺系統(tǒng)的實用化和許多復雜視覺過程的研究成為可能。

圖1 深藍擊敗卡斯帕羅夫
圖2 系統(tǒng)示意圖
圖3 棋子坐標的識別

2.2 設想思路

圖1為1997年5月,IBM的“深藍”在國際象棋比賽中擊敗國際特級大師卡斯帕羅夫的現(xiàn)場(其中右為“深藍”現(xiàn)場操作者)。但遺憾的是,“深藍”需要人來幫助看局勢、判斷棋子位置和移動棋子,它沒有視覺感知和行為能動能力,在超過1頓體重具有超級快速的運算能力下,“深藍”的能力僅限于推理,并不能完成卡斯帕羅夫所作的一切工作,甚至連一個小孩的行為都實現(xiàn)不了。

要使計算機具有看局勢的能力,它就應該擁有類似人眼功能的外設。幸運的是,計算機攝像器材結(jié)合軟件已經(jīng)可以勝任這些工作。通過一系列的圖像減運算,并對其結(jié)果進行直方圖化就可以得到所落子的坐標,如圖3所示,其中,3a 為N時刻采集的圖像,3b N+1時刻采集的圖像,而兩圖像相減的圖像的水平及垂直直方圖分別為3c和3d。

于是,本系統(tǒng)的思路是基于PC機下的VC編程應用,利用攝像頭采集人機對弈過程圖像,再通過圖像處理技術在已采集的圖像中識別出玩家所落子的位置坐標,計算機分析此落點,在策略庫中找出應對策略,進而完成機器人的視覺系統(tǒng),真正實現(xiàn)人機實時對弈。結(jié)構(gòu)示意圖如圖2所示。

3 系統(tǒng)組成

根據(jù)以上思路,系統(tǒng)分成三個主要部分:1)采集部分,2)識別部分,3)策略部分。其中攝像頭負責采集圖像,而識別和下棋策略是由軟件編程實現(xiàn)的。

3.1 采集部分

攝像頭相當于人的眼睛,對預處理的圖像采集進而傳入計算機。兼顧傳入圖像質(zhì)量,價格和可移植性的考量,攝像頭選擇一般常用的普通攝像頭,即webcam。

現(xiàn)在市面上的攝像頭一般都可達到800×600以上的分辨率,而價格合適,大量使用USB接口,因而可移植性強而廣泛的使用。經(jīng)過測試,系統(tǒng)可以在176×144及其以上分辨率正確運行。考慮到運行速度和圖像質(zhì)量之間的矛盾,以及許多用戶的機器配置(老機器如P3以下,老式攝像頭),程序中加入輸入圖像可調(diào)整設置。

攝像頭鏡頭朝下,放置于棋盤上方,類似機器人足球比賽的攝像機架設狀態(tài)。但對放置位置的水平和垂直方向要求不需非常精確,偏差幾度亦可實現(xiàn)功能,不用專業(yè)工具,一般人員即可調(diào)試成功,有更好的實際應用性和可移植性。

3.2 識別部分

傳入計算機的圖像轉(zhuǎn)化為象素矩陣,首先識別出棋盤范圍及網(wǎng)格坐標,再經(jīng)過若干次點運算計算出人所走的棋子坐標。

要對棋盤進行識別,就要對待初始化棋盤圖像進行邊沿計算,本文中采用的是拉普拉斯算子。然后二值化所計算后的象素矩陣,再分別在水平方向及垂直方向?qū)ζ渲狈綀D計算,得出棋盤范圍及網(wǎng)格坐標。如圖4所示,其中4a為輸入棋盤圖像,4b為此圖像的水平直方圖,4c為同圖的垂直直方圖。

對落子位置的識別要計算一個檢測周期內(nèi)兩幀圖像的差值,如圖5(圖像N+1及N時刻的差值),再直方圖計算出落子坐標。但要排除人身體部分及其它干擾。設B(x)為對圖像x的相對二值化過程 (這里是相對于均值二值化而言的),P(x , y)為點x , y的灰度值,有:

且, 其中, w1、w2分別為棋盤區(qū)域左右邊界,h1、h2分別為棋盤區(qū)域上下邊界,Smin~Smax為棋子大小范圍,Nmin~Nmax為噪聲、人身體陰影等干擾范圍,Δ為經(jīng)過計算的象素點的個數(shù),即在此范圍中的情況屬于已落子的情況。

圖4 棋盤識別
圖5 程序流程圖
圖6 程序執(zhí)行情況截圖
表1 測試參數(shù)表S
表2 測試參數(shù)表N

3.3 策略部分

知道對手落子位置還不能達到系統(tǒng)要求,如圖5流程所示,還需要讓計算機判斷應該怎樣對應,所以還要加入策略庫。

在策略庫設計中,計算機必須要知道有那些獲勝的組合,因此它必須計算獲勝組合的總數(shù),這樣便可以在游戲中建立一個數(shù)組來判斷勝負。策略組在下每步棋時都要計算有那些獲勝的方式,即有多少種獲勝的可能,計算出每下一步棋到棋盤上的獲勝幾率,進而作出攻防應對。

因為考慮到本系統(tǒng)程序只是測試圖像采集并處理的可行性,只是要求計算機作出基本的對策,并沒有加入交互式學習或多層次學習等復雜的人工智能決策。盡管如此,經(jīng)最后程序測試證明,計算機對手還是有相當?shù)膽?zhàn)斗力。

4 程序測試

在程序的總體測試之前,那些未知的參數(shù)必須通過試驗推測出來。首先測試Nmin~Nmax的范圍。在盡量減少外界擾動的情況下,隨機測試兩時間間隔,假設為1秒,即比較第N秒和第N+1秒的,結(jié)果如表2。然后測試Smin~Smax的范圍。把一定數(shù)量的棋子放到棋盤上后取一時刻圖像(其中包括隨機擾動),與棋盤初始化圖像比較,減去Nmin~Nmax的均值,即去掉干擾量,再除以擺上的棋子數(shù)量,結(jié)果如表1。當然,我們可以逐一對棋子進行測量,但這樣需要113次試驗。

得到的S或N的參數(shù)只是針對測試時的圖像分辨率320×240的絕對參數(shù),但實際運用在多個分辨率模式下就要對其相對化。設X’為所要的在分辨率R下的參數(shù)值,而X為在320×240下的數(shù)值,則有X’/X=R/320×240。

經(jīng)過測試,程序可對多種材質(zhì)棋盤及棋子進行正確識別并作出對應的策略,滿足實際的應用需要,如圖6程序截圖所示(圖上框架為顯示窗,下為采集窗口,此次測試使用手工繪制紙質(zhì)棋盤及紙質(zhì)棋子,人執(zhí)子在紙上下棋,計算機作出對應并顯示)。

5 結(jié)束語

程序試驗證明,測試程序能實現(xiàn)設想的功能,不僅可以正確的識別出棋子的位置,而且具有一定的棋力。加入更復雜的策略算法和機械手執(zhí)行模塊之后,可使系統(tǒng)具有更加重大的科研和實用的價值。

標簽:

點贊

分享到:

上一篇:采用模糊控制技術的排爆機械手

下一篇:微能WIN-V63矢量控制變頻器在...

中國傳動網(wǎng)版權(quán)與免責聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

網(wǎng)站簡介|會員服務|聯(lián)系方式|幫助信息|版權(quán)信息|網(wǎng)站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動網(wǎng)-工業(yè)自動化與智能制造的全媒體“互聯(lián)網(wǎng)+”創(chuàng)新服務平臺

網(wǎng)站客服服務咨詢采購咨詢媒體合作

Chuandong.com Copyright ?2005 - 2025 ,All Rights Reserved 深圳市奧美大唐廣告有限公司 版權(quán)所有
粵ICP備 14004826號 | 營業(yè)執(zhí)照證書 | 不良信息舉報中心 | 粵公網(wǎng)安備 44030402000946號