自動化所參與W3C中系列標(biāo)準(zhǔn)的制定工作

時間:2007-01-02

來源:中國傳動網(wǎng)

導(dǎo)語:隨著我國加入WTO,我國的標(biāo)準(zhǔn)化工作越來越呈現(xiàn)國際化的趨勢,無論是自身標(biāo)準(zhǔn)被國際采用

隨著我國加入WTO,我國的標(biāo)準(zhǔn)化工作越來越呈現(xiàn)國際化的趨勢,無論是自身標(biāo)準(zhǔn)被國際采用,還是參與國際標(biāo)準(zhǔn)化組織的步伐都急速的加快。近幾年來,在World Wide Web Consortium (W3C)下面成立了兩個與人機(jī)交互密切相關(guān)的兩個工作小組,語音合成置標(biāo)語言 (Speech Synthesis Markup Language – SSML)工作小組、情感標(biāo)注語言 (Emotion)工作小組,這個標(biāo)準(zhǔn)的制定對面向下一代的人機(jī)交互平臺具有十分重要的意義。中國科學(xué)院自動化研究所陶建華作為國內(nèi)學(xué)術(shù)單位的正式代表,參加了這兩個標(biāo)準(zhǔn)的制定工作,具體情況如下:   一 語音合成標(biāo)注語言(SSML)   SSML(Speech Synthesis Markup Language)工作組是W3C(World Wide Web Consortium)Voice Browsing Working Group下屬的一個致力于制訂語音合成置標(biāo)語言規(guī)范的團(tuán)體。工作組的目標(biāo)是為開發(fā)者(主要是針對互聯(lián)網(wǎng)的應(yīng)用)提供一套基于XML語言的規(guī)范,使得用戶能夠在不了解語音合成技術(shù)細(xì)節(jié)的情況下,使用這 套規(guī)范,調(diào)用語音合成引擎,定制所需要的語音。到2005年為止,這個工作組已經(jīng)推出了SSML1.0:http://www.w3.org/TR/speech-synthesis。   SSML1.0版本針對的主要是英語,沒有考慮到其他語系的特點(diǎn),使得它無法被更加廣泛地應(yīng)用。在這個背景下,SSML工作組在2005年開始了語音合成置標(biāo)語言國際化的工作。中國科學(xué)院自動化所作為科學(xué)院的唯一代表,加入了SSML國際化的工作,致力于修改當(dāng)前的SSML版本,使之能更好的適應(yīng)漢語的需求。   從去年以來,工作組分別于2005年10月、2006年4月、7月和10月,在北京和香港等地召開了四次會議。在這次會議上,對SSML1.0提出了針對漢語特點(diǎn)的若干修改意見,力圖使傳統(tǒng)SSML語言能夠適應(yīng)于漢語的特殊要求,如漢語的詞特性、拼音標(biāo)記特性、聲調(diào)特性、姓氏特性等。經(jīng)過這四次討論,已經(jīng)完成了針對SSML1.0的修改草案。并按照預(yù)定計(jì)劃在2007年提出SSML1.1版本。屆時,該版本將使XML語言框架中,對中文語音合成能夠產(chǎn)生更好的支持。為推廣漢語語音合成技術(shù)的應(yīng)用,使之能產(chǎn)生更大的經(jīng)濟(jì)效益和社會效益,將產(chǎn)生重要的意義。   二、 情感標(biāo)注語言(EMOTION)   隨著信息時代的來臨,各種web技術(shù)日新月異,紛紛涌現(xiàn)出來。如何引導(dǎo)新技術(shù)的潮流,使新技術(shù)更好地應(yīng)用于、服務(wù)于日常生活中,是當(dāng)前IT領(lǐng)域從業(yè)者所首先要考慮的問題。近年來,情感的研究一直是人機(jī)交互領(lǐng)域研究的一個熱點(diǎn),由于人類相互之間的溝通與交流是自然而富有感情的,因此,在人機(jī)交互的過程中,人們也很自然地期望計(jì)算機(jī)具有情感以及自然和諧的交互能力。對情感的研究就是要賦予計(jì)算機(jī)類似于人一樣的觀察、理解和生成各種情感特征的能力,最終像人一樣能進(jìn)行自然、親切和生動的智能交互。W3C的Emotion小組正是基于這樣一個目的建立的,期望通過全球范圍研究者的討論、交流,建立一個一般意義的、完整統(tǒng)一的情感標(biāo)注和表達(dá)體系,該標(biāo)注可以應(yīng)用在任何涉及情感研究的項(xiàng)目,如情感識別、情感表達(dá)中,從而促進(jìn)情感研究的發(fā)展。參與Emotion小組的成員包括了中科院自動化所、德國DFKI研究所、德國電信、英國Edinburgh大學(xué)、意大利電信等21個成員單位。   Emotion小組所討論的內(nèi)容主要包括以下三個部分:第一部分是研究情感數(shù)據(jù)的標(biāo)注,包括應(yīng)該標(biāo)注什么內(nèi)容以及如何進(jìn)行標(biāo)注。所涉及的數(shù)據(jù)類型相當(dāng)廣泛,文本數(shù)據(jù)、語音數(shù)據(jù)以及多模態(tài)數(shù)據(jù)都在討論范圍之內(nèi)。第二部分主要處理情感的自動識別和分類,主要研究如何從文字、語音、多模態(tài)數(shù)據(jù)中提取特征,然后利用機(jī)器學(xué)習(xí)算法進(jìn)行情感的識別。第三部分主要處理情感的產(chǎn)生,研究如何基于一定標(biāo)準(zhǔn)的標(biāo)注信息產(chǎn)生情感,在包括語音、表情及姿態(tài)的多模態(tài)數(shù)據(jù)中產(chǎn)生情感。   中科院自動化所作為整個標(biāo)準(zhǔn)的發(fā)起單位之一,參與了所有三個項(xiàng)目的討論,并且同日本Emotion AI的Ian Wilson教授共同擔(dān)當(dāng)情感產(chǎn)生討論小組的主席。中科院自動化所在情感研究方面已經(jīng)有了較多的研究積累:在情感標(biāo)注方面,自動化所提出了基于多維矢量的情感標(biāo)注方法;在情感識別方面,自動化所建立了在通信環(huán)境下的情感識別系統(tǒng),可以判斷對話人的友好度及關(guān)注度,并且成功地應(yīng)用在電信增值服務(wù)中,在福州聯(lián)通中已經(jīng)發(fā)展到2萬用戶。除此之外,自動化所還研制了基于多模態(tài)數(shù)據(jù)的情感識別系統(tǒng),通過有效的整合音頻特征和視頻特征,極大地提高了識別的準(zhǔn)確率;在情感產(chǎn)生方面,自動化所構(gòu)建了基于韻律轉(zhuǎn)換的情感語音合成系統(tǒng)和基于fap參數(shù)的情感表情表達(dá)系統(tǒng)。   到目前為止,W3C Emotion小組已經(jīng)召開了三次電話會議,整個標(biāo)準(zhǔn)的討論工作已經(jīng)漸漸走上軌道,參與討論的各方在一些基本性問題上已經(jīng)達(dá)到了一定的共識。相信隨著討論的深入進(jìn)展,一定能夠極大地促進(jìn)情感研究的發(fā)展,為創(chuàng)建更為和諧的人機(jī)交互環(huán)境而鋪平道路。
中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.wangxinlc.cn)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0