聲紋鑒別及其應(yīng)用
- 期刊名字:武警學(xué)院學(xué)報(bào)
- 文件大小:503kb
- 論文作者:侯遵澤
- 作者單位:武警學(xué)院
- 更新時(shí)間:2020-06-12
- 下載次數(shù):次
2002年12月武警學(xué)院學(xué)報(bào)Dec.2002第18卷第6期JOURNAL OF THE CHINESE PEOPLE S ARMED POLICE FORCE ACADEMYVol 18 No 6聲紋鑒別及其應(yīng)用●侯遵澤(武警學(xué)院訓(xùn)練部,河北廊坊065000)【摘要】聲紋是人說話聲音的頻譜圖,由于人的個(gè)性,決定了不同人聲紋的差異性,因此,聲紋識別或聲紋鑒定能夠確定說話人的身份。聲紋鑒別在很多領(lǐng)域有著廣泛的應(yīng)用價(jià)值和前景,這里,簡單介紹聲紋和聲紋鑒定與識別的概念及其應(yīng)用的歷史與現(xiàn)狀,探討聲紋鑒別的方法原理和步驟,討論聲紋鑒別在個(gè)人身份證明、刑事偵察、軍事、通信、防偽等領(lǐng)域的應(yīng)用,展望聲紋鑒別的應(yīng)用前景?!娟P(guān)鍵詞】聲紋;聲紋鑒定;聲紋識別;濾波;特征提取;模式匹配中圖分類號:TN912.34文獻(xiàn)標(biāo)識碼:A文章編號:1008-2077(2002)06-0087-031引言形中反映說話人生理和行為特征的語音參數(shù),自動識別說話人身份的技術(shù)。它的基本原理是通過分析人的發(fā)聲和聽覺當(dāng)一起刑事案件發(fā)生后,偵察人員極有可能利用從案發(fā)為每個(gè)人構(gòu)造一個(gè)獨(dú)一無二的數(shù)學(xué)模型,由計(jì)算機(jī)對模型和現(xiàn)場獲得的一段錄音得到有價(jià)值的破案證據(jù);當(dāng)空難發(fā)生后,實(shí)際輸人的語音進(jìn)行精確匹配,根據(jù)匹配結(jié)果辨認(rèn)出說話人從找到的“黑匣子”里,可以通過聲音的記錄,解開事故原因是誰。首先是對鑒別對象的聲音進(jìn)行采樣,即輸入語音信號之謎;當(dāng)一個(gè)要挾電話打來之后,經(jīng)過對電話錄音進(jìn)行處理,再對采樣數(shù)據(jù)進(jìn)行濾波等處理,而在聲紋鑒別過程中最主要就可以確定來電人是誰。這些都是聲紋鑒定或聲紋鑒別技術(shù)的兩部分內(nèi)容是特征提取和模式匹配。特征提取,就是從聲的應(yīng)用實(shí)例。音中選取唯一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的特征;模聲紋( voIce pant)是指借助一定的儀器描繪出來的人說式匹配就是對訓(xùn)練和鑒別時(shí)的特征模式做相似性匹配。聲紋話聲音的圖像,即人的聲音的頻譜圖。雖然人的發(fā)音器官生鑒別過程示意于圖1。理構(gòu)造總的是相同的,但人的語言產(chǎn)生是人體語言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,人在講話時(shí)使用的器官——舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)等方面,每兩個(gè)信號處理特征」模式識別提取匹配結(jié)果人之間的差異會很大,所以任何兩個(gè)人的聲紋圖譜都有差異,而對于每個(gè)人而言,從十幾歲發(fā)育變聲后直到五十多歲,其聲紋基本保持不變。利用聲紋的這些特點(diǎn),就可以通過聲紋鑒圖1聲紋鑒別過程示意圖別進(jìn)行個(gè)人身份識別,從而達(dá)到司法鑒定的目的。聲紋鑒定,就是通過對所記錄的語音與被鑒人聲紋的比限于篇幅,這里僅簡要討論特征提取和模式匹配兩部分較確定二者是否為同一人的一種技術(shù)手段。聲紋鑒定技術(shù)內(nèi)容,然后簡要介紹聲紋技術(shù)在刑事案件偵破過程中應(yīng)用的適用于刑事偵察和司法鑒定領(lǐng)域,能起到提供線索和審判證方法步驟。據(jù)的作用。利用聲紋鑒定技術(shù)可鑒別錄音語聲的真?zhèn)?可以2.1特征提取提供線索;可以提供證據(jù)。從20世紀(jì)60年代開始,聲紋鑒別聲紋鑒別系統(tǒng)中的特征檢測即提取語音信號中表征人的技術(shù)被廣泛地應(yīng)用到了電話查詢、電話交易、個(gè)人身份證明、基本特征,此特征應(yīng)能有效地區(qū)分不同的說話人,且對同一說偵察技術(shù)、防偽技術(shù)等諸多領(lǐng)域話人的變化保持相對穩(wěn)定??紤]到特征的可量化性、訓(xùn)練樣2聲紋鑒別方法本的數(shù)量依靠聲紋識別屬于生物識別技術(shù)的一種,是一項(xiàng)根據(jù)語音波(1)譜Vu#的評價(jià)問題,目前的聲紋鑒別系統(tǒng)主要中國煤化工。聲紋特征大體分為:CNMHG組輸出,以合適的速率收稿日期:2002-09-12作者簡介:侯遵澤(1956-),男,山東平度人,武警學(xué)院訓(xùn)練部科研所副所長,教授博士?!段渚瘜W(xué)院學(xué)報(bào)》2002年第6期(總第97期)基礎(chǔ)科研對濾波器輸出抽樣,并將它們作為聲紋鑒別特征;(2)基音輪紋鑒別的性能。廓、共振峰頻率帶寬及其軌跡,這類特征是基于發(fā)聲器官如聲2.3聲紋刑事案件偵破方法步驟門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù);(3)線性預(yù)測系在刑偵方面,聲紋鑒別技術(shù)可以在一段錄音中查找出嫌數(shù),即以線性預(yù)測導(dǎo)出的各種參數(shù),如線性預(yù)測系數(shù)、自相關(guān)疑人。通過辨析、頻譜分析、提取特征和進(jìn)行模式匹配等方法系數(shù)、反射系數(shù)、對數(shù)面積比線性預(yù)測殘差及其組合等參數(shù),步驟,進(jìn)行聲紋鑒定,從而偵破案件作為鑒別特征,可以得到較好的效果。主要原因是線性預(yù)測首先辨析樣本語音材料,對有關(guān)方言、語音速度、言語習(xí)與聲道參數(shù)模型是相符合的(4)反映聽覺特性的參數(shù)模擬慣鼻音輕重音高變音變調(diào)、節(jié)奏聲源譜特性(聲音的厚人耳對聲音頻率感知的特性而提出了多種參數(shù),如美倒譜系薄,余音的強(qiáng)弱)、清晰度、流暢度、口頭語贊語、虛詞、言語數(shù)、感知線性預(yù)測等。此外,人們還通過對不同特征參量的組缺陷以及是否偽裝等進(jìn)行辨別。另外,還要聽辨語義、詞匯合來提高實(shí)際系統(tǒng)的性能,當(dāng)各組合參量間相關(guān)性不大時(shí),會語法及其表達(dá)方式的異同,最后得出相似或差異程度的評價(jià)。有較好的效果。在對樣本語音材料辨析的基礎(chǔ)上,進(jìn)行頻譜分析,求出多2.2模式匹配種聲學(xué)特征圖譜,這些圖譜反映的是多種多樣的聲紋形態(tài),它2.2.1概率統(tǒng)計(jì)方法們有帶狀(寬帶、窄帶)譜、曲線譜線狀譜和連續(xù)譜等,聲紋語音中說話人信息在短時(shí)內(nèi)較為平穩(wěn),通過對穩(wěn)態(tài)特征鑒定一般至少要進(jìn)行觀察和定量檢測的圖譜有:(1)波形圖如基音、聲門增益、低階反射系數(shù)的統(tǒng)計(jì)分析,可以利用均值、即聲波的圖形,它表征振幅隨時(shí)間的動態(tài)變化;(2)振幅曲方差等統(tǒng)計(jì)量和概率密度函數(shù)進(jìn)行分類判決。線,是語音波的振幅包,是一條高低起伏的曲線,表示語音強(qiáng)2.2.2動態(tài)時(shí)間規(guī)整方法弱;(3)基頻曲線,是表征聲音的基礎(chǔ)頻率隨時(shí)間變化的動態(tài)說話人信息不僅有穩(wěn)定因素(發(fā)聲器官的結(jié)構(gòu)和發(fā)聲習(xí)曲線,又稱聲調(diào)曲線;(4)三維聲譜,表征聲音的頻率、強(qiáng)度和慣),而且有時(shí)變因素(語速、語調(diào)、重音和韻律)。將識別模時(shí)間的關(guān)系的曲線,它又包括兩種形式:寬帶語譜,其特點(diǎn)是板與參考模板進(jìn)行時(shí)間對比,按照某種距離測定得出兩模板時(shí)間分辨能力較強(qiáng)、但頻率分辨能力較弱;窄帶語譜,其特點(diǎn)間的相似程度。常用的方法是基于最近鄰原則的動態(tài)時(shí)間規(guī)與前者相反;(5)過零率曲線,表征聲音波形通過橫坐標(biāo)的比整DTW。率與時(shí)間的關(guān)系,用于分析某個(gè)音是嗓音還是噪音,或者是輔2.2.3矢量量化方法音的濁化現(xiàn)象;(6)二維聲譜,是聲音的振幅隨時(shí)間變化形成矢量量化最早是基于聚類分析的數(shù)據(jù)壓縮編碼技術(shù)。的,包括瞬時(shí)頻譜、光標(biāo)間功率譜、長時(shí)平均功率譜三種頻譜Helms首次將其用于聲紋識別,把每個(gè)人的特定文本編成碼在提取特征的基礎(chǔ)上,對檢材和樣本的相同語音材料的本,識別時(shí)將測試文本按此碼本進(jìn)行編碼,以量化產(chǎn)生的失真主要聲學(xué)特征參量的數(shù)值,包括共振參量、振幅曲線參量、基度作為判決標(biāo)準(zhǔn)。Bel實(shí)驗(yàn)室的 rosenberg和 Soong用VQ進(jìn)頻曲線參量、音節(jié)時(shí)長、長時(shí)平均功率譜參量、長時(shí)平均聲調(diào)行了孤立數(shù)字文本的聲紋識別研究。這種方法的識別精度參量等進(jìn)行匹配對比,得出是否同一的定量評價(jià)。高,判斷速度快。224隱馬爾可夫模型方法3聲紋鑒別的應(yīng)用隱馬爾可夫模型是一種基于轉(zhuǎn)移概率和傳輸概率的隨機(jī)聲紋鑒別技術(shù)有著十分廣闊的應(yīng)用前景,在世界范圍內(nèi),模型,最早在CMU和IBM被用于語音識別。它把語音看成聲紋鑒別技術(shù)正廣泛應(yīng)用于諸多領(lǐng)域。目前,我國市場尚屬由可觀察到的符號序列組成的隨機(jī)過程,符號序列則是發(fā)聲啟動階段,其發(fā)展空間更為廣闊在金融、證券、社保公安、軍系統(tǒng)狀態(tài)序列的輸出。在使用HMM識別時(shí),為每個(gè)說話人隊(duì)及其他民用安全認(rèn)證等行業(yè)和部門有著廣泛的需求。建立發(fā)聲模型,通過訓(xùn)練得到狀態(tài)轉(zhuǎn)移概率矩陣和符號輸出有資料介紹,世界上最早用聲紋破案的是于1963年4月概率矩陣。識別時(shí)計(jì)算未知語音在狀態(tài)轉(zhuǎn)移過程中的最大概發(fā)生的東京下谷的“吉展幼兒拐賣案”。臺灣華航“5·25”空率根據(jù)最大概率對應(yīng)的模型進(jìn)行判決。HMM不需要時(shí)間規(guī)難事件調(diào)查中,聲紋也起到了一定的作用。聲紋鑒別也曾有整,可節(jié)約判決時(shí)的計(jì)算時(shí)間和存儲量,在目前被廣泛應(yīng)用。效地應(yīng)用于海下探測。例如,一艘艦艇的聲納接收到了250m缺點(diǎn)是訓(xùn)練時(shí)計(jì)算量較大水下的一個(gè)奇怪的聲音,似乎這是一艘潛艇。經(jīng)過與計(jì)算機(jī)2.2.5人工神經(jīng)網(wǎng)絡(luò)方法資料中的各種艦艇聲紋對比,得出了初步結(jié)論:“這可能是美人工神經(jīng)網(wǎng)絡(luò)在某種程度上模擬了生物的感知特性,它國派來的弗吉尼亞號核潛艇?!笔且环N分布式并行處理結(jié)構(gòu)的網(wǎng)絡(luò)模型,具有自組織和自學(xué)聲紋鑒別在司法鑒定中也有成功的范例。有一起指使謀習(xí)能力、很強(qiáng)的復(fù)雜分類邊界區(qū)分能力以及對不完全信息的殺案,偵察人員采用聲紋技術(shù),取得了成功。首先,偵察人員魯棒性,其性能近似理想的分類器。其缺點(diǎn)是訓(xùn)練時(shí)間長,動通過磁帶的語音是否連續(xù),背景噪聲是否連貫,還有一些信號態(tài)時(shí)間規(guī)整能力弱,網(wǎng)絡(luò)規(guī)模隨說話人數(shù)目增加時(shí)可能大到的波中國煤化工是否經(jīng)過剪輯;接著偵察難以訓(xùn)練的程度。小波變換方法具有多分辨分析功能,可以人員CNMH低它的噪聲,突出增強(qiáng)它有效地進(jìn)行頻譜分析,利用小波變換的方法,可以將聲音信號語音y。察入貝付犯非現(xiàn)場留下的犯罪分子的聲分解成各種不同音頻頻段的譜,從而得到高質(zhì)量的聲紋頻譜音與在看守所提取的犯罪嫌疑人的聲音轉(zhuǎn)化為聲紋后,比較它們的異同發(fā)現(xiàn)其聲紋的很多地方的共同點(diǎn),通過相同的方把以上各類方法與不同特征進(jìn)行有機(jī)組合可顯著提高聲法,偵察人員又找到大量相同語句的聲紋是一致的,說明磁帶88·侯遵澤:聲紋鑒別及其應(yīng)用中嫌疑人的聲音就是被鑒定人的,最終偵破了此案。大大地提高電話訂購商品的效率推動電話商務(wù)的發(fā)展。在信息查詢領(lǐng)域中,呼叫中心為了向用戶提供個(gè)性化服在PC機(jī)及手持式設(shè)備上,也需要進(jìn)行用戶身份的識別,務(wù),并提高坐席的工作效率,在坐席的電腦端采用了“ Screen從而允許或拒絕用戶登陸電腦或者使用某些資源,或者進(jìn)入Pop”技術(shù)。電話撥打進(jìn)入呼叫中心后,系統(tǒng)通過識別撥打者特定用戶的使用界面。同樣采用傳統(tǒng)的用戶名加密碼的保護(hù)的電話號碼來進(jìn)行用戶識別,并從數(shù)據(jù)庫里調(diào)出該用戶的個(gè)機(jī)制存在著用戶名和密碼泄密、被竊取、容易遺忘等問題人及歷史交易信息從而能夠提高人工坐席的工作效率并向聲紋鑒別技術(shù)應(yīng)用到PC機(jī)以及手持式設(shè)備上面,可以無須用戶提供更具針對性的信息服務(wù)。但通過電話號碼來進(jìn)行用記憶密碼,保護(hù)個(gè)人信息安全,大大提高系統(tǒng)的安全性,方便戶身份識別的缺陷是顯而易見的。而聲紋鑒別技術(shù)就可以很用戶使用。好的解決這些缺陷?;诿總€(gè)人的聲音特征都是唯一而且?guī)自诒0蚕到y(tǒng)以及證件防偽的應(yīng)用中,聲紋鑒別系統(tǒng)可用乎很少會發(fā)生變化的特性可以很好地通過聲紋鑒別技術(shù)進(jìn)于信用卡銀行自動取款機(jī)、門車的鑰匙卡、授權(quán)使用的電行用戶身份鑒別從而提高呼叫中心的工作有效性,尤其在更腦、聲紋鎖以及特殊通道口的身份卡等。在卡上事先存儲了加需要人性化服務(wù)的醫(yī)療、教育投資、票務(wù)、旅游等方面,聲持卡者的聲音特征碼需要時(shí)持卡者只要將卡插入專用機(jī)的紋鑒別顯得尤其重要插口上,通過一個(gè)傳聲器讀出事先已儲存的暗碼,同時(shí)儀器接在通過電話進(jìn)行交易的系統(tǒng)中,如電話銀行系統(tǒng)商品電收持卡者發(fā)出的聲音,然后進(jìn)行分析比較,從而完成身份確話交易系統(tǒng)證券交易電話委托系統(tǒng)交易系統(tǒng)的安全性是最認(rèn)。同樣可以把含有某人聲紋特征的芯片嵌入到證件之中,重要的,也是系統(tǒng)設(shè)計(jì)者所要重點(diǎn)考慮的內(nèi)容。傳統(tǒng)的電話通過上面所述的過程完成證件防偽交易系統(tǒng)采取“用戶名+密碼”的控制機(jī)制,以確認(rèn)用戶的身與二維條碼技術(shù)相結(jié)合的防偽應(yīng)用。PDF417二維條碼份并確保交易的安全性,然而這種控制機(jī)制缺點(diǎn)明顯。若在是一種高密度高信息含量的便攜式數(shù)據(jù)文件,PDF417二維電話交易系統(tǒng)內(nèi)采用聲紋鑒別技術(shù)來進(jìn)行交易者身份識別與條碼及其系統(tǒng)的開發(fā)應(yīng)用范圍極廣,在國外已廣泛應(yīng)用在國確認(rèn),不僅提高了交易的安全性,大大降低了用戶名和密碼被防、公安交通運(yùn)輸、醫(yī)療保健、工業(yè)、商業(yè)、金融、海關(guān)及政府猜中或者竊取的可能性而且對交易系統(tǒng)的用戶來說,交易過管理等領(lǐng)域。其典型優(yōu)點(diǎn)為:可容納約1000個(gè)漢字信息,比程更加簡單和人性化。若與電話自動語音識別技術(shù)相結(jié)合,普通條碼信息容量高幾十倍,可將照片、指紋、掌紋、聲音、簽通過語音下達(dá)交易指令,則更能提高交易的快捷性,縮短撥打字、文字等凡可數(shù)字化的信息進(jìn)行編碼,糾錯能力強(qiáng),可靠性用戶的撥打時(shí)間降低電話交易難度。準(zhǔn)確的用戶身份識別,高容易制作且成本低廉。利用現(xiàn)有的點(diǎn)陣激光、噴墨、熱可通過用戶信息數(shù)據(jù)庫和歷史交易數(shù)據(jù)庫,為提供真正的敏/熱轉(zhuǎn)印制卡機(jī)等打印技術(shù),可在紙張、PVC、甚至金屬表One-to-One個(gè)性服務(wù)打下基礎(chǔ),降低交易系統(tǒng)費(fèi)用,提高面上印出PDF417二維條碼,采用聲紋鑒別的方法對重要的效率。由于縮短了撥打用戶的撥打時(shí)間,從而會減少IVR硬證件、文件、單據(jù)進(jìn)行防偽。在需要進(jìn)行證件確認(rèn)時(shí),通過件系統(tǒng)的通道需求數(shù)量,降低欺詐的可能性。商家可以根據(jù)維條碼識別出用戶的聲紋特征并輸入到聲紋確認(rèn)儀器中,同有關(guān)的聲紋鑒別技術(shù),判斷這些信息的可信度,并據(jù)此決定是時(shí)與持證人的聲音進(jìn)行對比,從而完成證件和身份確認(rèn)。否送貨等,并可從數(shù)據(jù)庫內(nèi)查看撥打者的信用狀況,由此可以Voice discrimination and its applicationHoU Zun-zeStaff office, The Academy, Lang Fang 065000, China)Abstract] Voice print is a frequency map of a mans voice. Because of the character of person, the discrepancyof any two mens voice and the speaker can be determined with their voice print. Voice discrimination has widely ap-plications in many domains. In this paper, the concept, history and actuality of voice print and its application wereintroduced and the methods, principle, discriminating steps and application to person identification, penal recon-naissance, military affairs, communications, defending false, etc are studiedI Key words] voice print; identifying the voice; speaker recognition; filter; pick up the character; matching the中國煤化工(本欄責(zé)任編輯、校對CNMHG89
-
C4烯烴制丙烯催化劑 2020-06-12
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-06-12
-
生物質(zhì)能的應(yīng)用工程 2020-06-12
-
我國甲醇工業(yè)現(xiàn)狀 2020-06-12
-
石油化工設(shè)備腐蝕與防護(hù)參考書十本免費(fèi)下載,絕版珍藏 2020-06-12
-
四噴嘴水煤漿氣化爐工業(yè)應(yīng)用情況簡介 2020-06-12
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-06-12
-
甲醇制芳烴研究進(jìn)展 2020-06-12
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進(jìn)展 2020-06-12
