時間:2018-12-03 10:24:08來源:網(wǎng)絡(luò)轉(zhuǎn)載
中文自動分詞是中文信息處理技術(shù)中最基礎(chǔ)、最關(guān)鍵的一個環(huán)節(jié)。所謂分詞,就是把一個句子中的詞匯按照使用時的意義切分出來。和英語單詞不同,在中文里,只有段與段之間、句子與句子間有明顯分割,而單詞之間不存在分隔符。
目前中文信息處理包括字詞處理、句法和語義處理、語料庫統(tǒng)計方法、統(tǒng)計與規(guī)則相結(jié)合等方法。做語言處理時一般用準確率作為關(guān)鍵指標。但氖星智能提出了利用識別句子語法結(jié)構(gòu)來提取關(guān)鍵詞的方法,并用同一原則、差異原則、模糊原則、一致原則來作為關(guān)鍵指標。
本文從自然語言處理在智能建筑中的應(yīng)用這個角度,分析氖星智能語言處理的性能。
智能建筑指以建筑物為平臺,利用信息化應(yīng)用系統(tǒng)、建筑設(shè)備管理系統(tǒng)等,向人們提供高效、安全的建筑環(huán)境。涉及要控制的裝置包括:空調(diào)、電燈、電梯、家用電器、窗簾等。例如,根據(jù)光照度的亮和暗控制窗簾關(guān)閉和打開,控制電燈的關(guān)閉和打開;根據(jù)是否有人進入房間和溫度的高低,控制空調(diào)的開關(guān)和空調(diào)溫度。
這里對于空調(diào)控制提出4個應(yīng)用場景:
場景1:手動調(diào)節(jié)空調(diào)
場景2:空調(diào)自動調(diào)節(jié)到某個值
場景3:空調(diào)自動調(diào)節(jié)到某人設(shè)定的值
場景4:根據(jù)識別的人調(diào)節(jié)空調(diào)到某個值
一、關(guān)鍵詞提取測試
根據(jù)四種場景,在氖星智能語義理解工具中輸入不同的句子,提取關(guān)鍵詞。從結(jié)果看出,關(guān)鍵詞提取都比較準確。如果有句子本身存在歧義,才會出現(xiàn)一些偏差。分詞類型選1,表示做了同義詞替換。
二、語義相似對比測試
根據(jù)四種場景,在氖星智能語義相似性對比工具中輸入不同的句子,比較它們的相似度,數(shù)值越大,相似度越高;數(shù)值越小,相似度越低。
1.場景1:手動調(diào)節(jié)空調(diào)
第(3)句包含有打開空調(diào)的動作,和其他三句意思不同,所以相似度低。
(1)小明把空調(diào)打開到20度
(2)小明把空調(diào)開到20度3796
(3)小明開空調(diào)到20度-700(句子包含有打開空調(diào)的動作。)
(4)小明把空調(diào)調(diào)到20度3796
2.場景2:自動調(diào)節(jié)空調(diào)到某個值
以下四句意思相同,相似度數(shù)值高。
(1)小明進來前,空調(diào)自動調(diào)到20度。
(2)小明進來后,空調(diào)自動調(diào)到20度。18536
(3)讓小明進來前,空調(diào)自動調(diào)到20度。17290
(4)空調(diào)自動調(diào),小明進來后到20度。6113
3.場景3:自動調(diào)節(jié)空調(diào)到某人設(shè)定的值
第(2)句包含有溫度不直接應(yīng)用的意思,其他人還要調(diào)空調(diào),和其他兩句有所不同。
(1)有人進,空調(diào)自動調(diào)到小明設(shè)的溫度。
(2)小明設(shè)的溫度用于其他人進來后調(diào)空調(diào)。-1820(句子包含有溫度不直接應(yīng)用的意思)
(3)小明設(shè)的空調(diào)溫度被其他人使用。7780
4.場景4:根據(jù)識別的人調(diào)節(jié)空調(diào)到某個值
以下3句意思相近,第1步,小明先設(shè)定溫度值;第2步,智能家居系統(tǒng)通過圖像識別裝置識別出小紅進來;第3步,調(diào)節(jié)空調(diào)到設(shè)定值。
(1)小紅進來后,溫度調(diào)到小明設(shè)定的值。
(2)識別出小紅,溫度調(diào)到小明設(shè)定的值。8010
(3)小明設(shè)定溫度值,小紅進來后調(diào)到此值。14190
三、分詞準確性測試
1.當“時空”為完整詞。輸入“水資源時空調(diào)節(jié)”(指通過工程技術(shù)措施對水資源在一定時間或不同地域間的重新分配。和空調(diào)無關(guān)。)
分詞結(jié)果:水資源時空調(diào)節(jié)
關(guān)鍵詞提取:時空+調(diào)節(jié)++水資源+
2.當“空調(diào)”為完整詞。輸入:“小明來時空調(diào)自動開?!?/p>
分詞結(jié)果:小明來時空調(diào)自動開。
關(guān)鍵詞提取:小明+開+空調(diào)+來時+自動
實際得到正確結(jié)果。如果是分詞錯誤:關(guān)鍵詞提取結(jié)果為:小明來時空調(diào)自動開
3.當我們加大分詞難度,輸入“小明來時空調(diào)節(jié)能模式自動開?!边@里和第1句一樣,包括“時空調(diào)節(jié)”四個字。如果判斷錯誤和第1句得到同樣的關(guān)鍵詞。
分詞結(jié)果:小明來時空調(diào)節(jié)能模式自動開。
關(guān)鍵詞提取:空調(diào)+節(jié)能++小明+開
如果是分詞錯誤:關(guān)鍵詞提取結(jié)果為:小明來時空調(diào)節(jié)能模式自動開
四、智能建筑中控制電梯的語句測試
對電梯控制語句進行語義相似對比。
1、控制電梯到某一層
3句意思相近,相似度數(shù)值較高。
(1)電梯到人最多的一層
(2)哪層人多,電梯到哪層3088
(3)哪層人多,然后電梯到這層620
2、對優(yōu)先級進行設(shè)置。即控制電梯是里面的人按樓層還是外面的人按樓層優(yōu)先級高。3句意思相同,相似度數(shù)值較高。
(1)外面優(yōu)先控制電梯
(2)電梯外面優(yōu)先控制10639
(3)外面電梯優(yōu)先控制7954
本文從關(guān)鍵詞提取、語義相似對比、分詞準確性測試三個角度分析了氖星智能語言處理工具的性能,可以看出和傳統(tǒng)通過計算詞語頻率的方法相比,關(guān)鍵詞提取準確性提高很多,語義相似度對比效果也很好。
本人認為,本文使用的對各種場景枚舉并測試的方法,是一個很好的測試和比較機器人性能方法,同樣適用于其他場合,例如家政服務(wù)機器人、智能導(dǎo)航機器人、問答機器人等。
標簽:
中國傳動網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。
產(chǎn)品新聞
更多>2025-04-30
性能躍升20%!維宏NK300CX Plus數(shù)控系統(tǒng)...
2025-04-11
rpi-image-gen:樹莓派軟件鏡像構(gòu)建的終...
2025-04-08
【產(chǎn)品解讀】全面提升精密制造檢測節(jié)拍...
2025-03-31
激光閃耀 智慧引領(lǐng) | WISE MASER 黑武士...
2025-03-20