專注條碼技術19年
條碼系統(tǒng)應用集成服務提供商
聲音識別的迅速發(fā)展以及高效可靠的應用軟件的開發(fā),使聲音識別系統(tǒng)在很多方面得到了應用、這種系統(tǒng)可以用聲音指令擬應用特定短句實現“不用手”的數據采集、其最大特點就是不用手和眼睛,這對那些采集數據同時還要完成手腳并用的工作場合尤為適用。由于每個人的聲音千差萬別,因此聲音可以用作安全認證的依據之一。別人可以模仿你的簽字,猜測你的密碼,甚至能留下你的指紋,但要模仿你的聲音就有點太苛刻了。美國的一座智能化大廈就采用了聲音識別的方式。到達公司門口,你必須通過安全檢查。電子聲控門衛(wèi)將問候“早上好!”你也該回答“你好!”或“早上好!”之類的禮貌用語。此時電子門衛(wèi)通過你的聲音來辨別你是不是該公司的工作人員,如果確認你是,它將主動為您打開門,但如果不是,電子門衛(wèi)將客氣地將你“拒之門外”。
如果你視力不好或行走不便,聲控設備也可助一臂之力。比如,你可以通過說話控制洗衣機、電視機、電腦等設備。讓它們執(zhí)行開啟、關閉等簡單的任務。裝有聲控設備的電腦還能為你朗讀新收到的電子郵件,告訴你最新的消息。荷蘭飛利浦公司最近還研制出了一種新型音響設備,如果你想聽音樂,不用走到音響前找按鈕,也用不著遙控器,目口使你在廚房,只要喊一聲“開始放音樂吧!”遠在客廳的音響就能自動開啟,再說出歌曲的名字,音響就能在幾秒鐘之內找到這首歌自動播放。更為神奇的是,如果你想不起來歌曲的名字,只要哼幾句歌曲的旋律,音響就能辨別出是哪首歌,然后播放給你聽。在2003年9月的CeBIT大展上,SONY亮出了他們QRIO家庭娛樂機器人。為強化對話功能,這款機器人配備了專門用于聲音識別與聲音合成的CPU。這樣,在原機型“SDR-4X”中通過外部PC實現的大詞匯量連續(xù)聲音識別可以由機器人獨立完成。機器人可使用的詞匯量約2萬條。為擴展記憶對話功能,不僅能記住對話者的面部與姓名,還能記住對話者在對話寸使用的單詞。因此,當新款機器人與同一個人第二次碰面寸,不僅能認出對方是誰,還能想起過去的對話內容。這樣就能對曾經遇到過的人“產生一定的感情”,原型號的機器人只能想起面部與姓名。
美國中央情報局近年來一直在秘密開發(fā)“聲音自動處理系統(tǒng)”,并用“經典故事”來命名代替。這是一種可以“實寸自動鑒別語言、說話人和武器平臺”的系統(tǒng),這種系統(tǒng)不需要人工的介入,也不管說話人的語言是什么,即可以通過語音識別技術確認該人的身份,并鎖定他說話時所在的地理位置。2003年8月?日,卡塔爾半島電視臺再次播放了據稱是伊拉克前總統(tǒng)薩達姆的講話錄音。薩達姆在講話中號召伊拉克人民“利用各種方式”趕走美英占領軍。美國中央情報局官員隨后發(fā)表聲明稱,中情局專家在對這盤錄音帶進行對比分析后,認為錄音帶上的聲音“十有八九出自薩達姆本人”。
這次美國中情局就動用了語音識別系統(tǒng)。每個人的聲音束、嘴型、喉嚨、鼻道以及發(fā)音肌肉都各不相同,這些有差異的物理特性,決定了每個人聲音的獨一無--i性。據一位曾在蘇聯侵略阿富汗期間為美國工作的巴基斯坦將軍透露:“所有的國家領導人由于其口音、停頓、用詞或表達習慣不同,因此都有著特定的識別方式,這就像人類的指紋。美國可以給每個領導人都編上號碼”。對于采集到的各國領導人的聲音資料,為便于使用,美國中央情報局對聲音加以記錄,并將其轉變?yōu)槁曌V圖或聲紋的直觀形式。聲譜圖中的電子過濾器僅允許某一特定波段的頻率通過,并對這一頻率的強度加以記錄。
聲音識別也是一種非接觸的識別技術,用戶可以很自然地接受。但聲音識別和其他的行為識別技術一樣,聲音因為變化的范圍太大,故而很難進行一些精確的匹配;聲音會隨著音量、速度和音質的變化(例如當你感冒時)而影響到采集與比對的結果。為此,近年來美國中情局在識別聲音時還采用了聲紋技術,目口將聲音信號以時間、頻率及振幅的形式顯示出來,極大地提高了識別效率。
當卡塔爾電視臺播出薩達姆的講話錄音后,美國中情局的聲音識別專家及語言專家目口開始對這些錄音進行分析,他們首先將錄音帶中的聲音與資料庫中存儲的聲音進行對比,辨別出其相似之處及不同之處,這些相似或不同之處涉及呼吸方式、語調的抑揚變化、不尋常的語音習慣以及地方方言等。然后這些專家又利用肉眼及專業(yè)計算機分析軟件對兩種來源的聲紋加以分析研究,發(fā)現資料庫中的聲紋與錄音帶中的聲紋基本一致,而且包含有部分相同的單詞。