摘 要:語音識別技術(shù)在智能設(shè)計方面的應(yīng)用廣泛。AP7003型IC是一款性能優(yōu)良和價格低廉的語音識別電路,文中介紹它的基本電路及其在機器人設(shè)計中的一些應(yīng)用友及主意識別系統(tǒng)的基本原理,為智能機器人的設(shè)計提供了一種思路。
關(guān)鍵詞:AP7003 語音識別 智能機器人 目標詞
語音識別技術(shù)以語言為研究對象,涉及生理學(xué)、語言學(xué)、計算機及信號處理等多個領(lǐng)域,是語言信號處理的一個重要研究方向,在智能控制、多媒體、人機對話等方面有著極其廣泛的應(yīng)用前景。
1 語音識別技術(shù)
語音識別技術(shù)首先要提取語音特征參量,也就是從語言信號中提取語音識別的有用信息。語音特征參量的提取要考慮單詞選定位置的基音、鼻輔音的頻譜、元音的頻譜、擦音的頻譜等要素。語音識別技術(shù)也必須有模式匹配及模型訓(xùn)練技術(shù),其中主要包括動態(tài)時間規(guī)整技術(shù)、HMM模型和人工神經(jīng)網(wǎng)絡(luò)。時間規(guī)整是把一個單詞內(nèi)的時變特征變?yōu)橐恢碌倪^程,在時間規(guī)整過程中,作為單詞的時間軸要不均勻的扭曲或彎曲,使其行征為模型特征對正,該技術(shù)是一種有力的矯正措施,對提高系統(tǒng)的識別精度極為有效。人工神經(jīng)網(wǎng)絡(luò)是一個自適應(yīng)非線性動力學(xué)系統(tǒng),模擬人體大腦活動的基本原理,具有學(xué)習、技藝、判斷、對比和概括等能力。另外,語音識別單元的選取也是語音識別的重要一步,語言識別單元有單詞、音節(jié)和音素。對于漢語而言,主要選取音節(jié)單元,因為漢語是單音節(jié)結(jié)構(gòu)的語言,而英語是多音節(jié)的語言,漢語約有400個音節(jié),數(shù)量相對較少,便于識別。
2 AP7003型語音識別電路
AP7003是一款低成本語音識別專用集成電路,內(nèi)置麥克風放大器、A/D轉(zhuǎn)換器、語音處理器和I/O控制器,經(jīng)預(yù)處理后可識別12組不同的字詞,每組1.5s時長,可連詞或單詞識別。可廣泛應(yīng)用于玩具、識別轉(zhuǎn)控和自動答錄等領(lǐng)域。
AP7003的功能框圖如圖1所示。表1給出AP7003的引腳功能。
[align=center]

表1 AP7003的引腳功能[/align]
AP7003的主要特征如下:
·內(nèi)置麥克風放大器
·內(nèi)置A/D轉(zhuǎn)換器
·采用DIP40雙列直插式封裝
·能識別12組1.5s時長字詞
·I/O:2個普通輸入,4個觸發(fā)輸入,2個輸出口分別有4個、12個輸出,2個LED驅(qū)動
AP7003具有二種工作模式,即錄音模式和識別模式,在進入識別模式之前,應(yīng)先將目標詞錄入電路內(nèi)。在AP7003內(nèi)有12個存貯體用于存貯12組不同的字句,每個存貯體可存貯1.5s時長的字句,可通過鍵盤或按程序編制的順序選擇存貯體來錄入及存放目標詞。語音可通過外部麥克風或其他媒體錄入電路內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字特征信號保存在存貯體中。
目標詞錄入電路內(nèi)后即可將工作模式轉(zhuǎn)換到識別模式,工作時電路將當前語音與事先錄入存貯體的目標詞語音相比較,如果語音特征相匹配,則在電路的相應(yīng)輸出端輸出高電平或低電平。
3 聲控機器人設(shè)計
語音識別電路廣泛應(yīng)用在智能控制中,把這種電路應(yīng)用在智能機器人設(shè)計中,使機器人初步具有與人對話的能力,且機器人的操作具有普遍性,極大地提高了操作者的興趣,圖2是機器人電路的主要原理框圖。
圖2中按鍵的定義如表2所示。上電后12個存貯器在錄入目標詞之前必須清空,開始錄入目標詞時使LED1有效,錄入后電路將進入識別模式。
[align=center]

表2 按鍵的定義[/align]
如果由麥克風錄入的單詞與存儲器原有單詞相匹配,對應(yīng)的POA輸出口有效,并驅(qū)動斷電器器,電機運動。在本設(shè)計中,機器人主要有“前進”(J1)、“后退”(J2)、“左轉(zhuǎn)”(J3)、“右轉(zhuǎn)”(J4)、“舉起”(J5)、“放下”(J6)、“停止”等幾種動作。其中,“停止”定義為clearOutput,其他依次定義為POA3、POA4、POA5、POA6、POA7和POA8。以“前進”(J1)和“后退”(J2)為例,如圖3所示。
當“停止”時,清除POA所有狀態(tài),機器人停止。
當然,語音識別電路對外部麥克風(MIC)的分貝值有一定的要求,經(jīng)驗表明在本語音識別電路中選用56dB的麥克風較好。另外,AP7003的工作電壓為2.4~4.5V,如果您的應(yīng)用系統(tǒng)是5V工作電壓,那么,通過一個二極管給AP7003供電,可以保證系統(tǒng)能長期穩(wěn)定、可靠的工作,也有利于降低系統(tǒng)功耗。
4 結(jié)束語
在實際應(yīng)用的過程中,麥克風的分貝值、Set R_Level匹配度的設(shè)置對于語音識別的效果影響較大。如果這二個參數(shù)設(shè)置合理,該電路可具有較高的識別率,一般可達80%以上,不失為一種效好的語音識別電路。