在挖掘人工智能技術(shù)應(yīng)用過程中,計算機視覺作為人工智能的一大核心技術(shù)分支一直以來都備受關(guān)注,并且隨著人工智能技術(shù)紅利的興起,行業(yè)內(nèi)誕生了一大波計算機視覺技術(shù)研發(fā)型企業(yè),從視覺AI算法、專用AI芯片等技術(shù)領(lǐng)域著手,探索視覺AI技術(shù)在各行業(yè)領(lǐng)域應(yīng)用的落地。
在視覺AI技術(shù)及應(yīng)用迅猛發(fā)展之際,機器聽覺和自然語義理解作為人工智能的另外兩大分支這幾年來也隨著政策、市場、人才等條件的日趨成熟取得了一些突破性的進展。這里,我們具體討論一下以聲紋識別為代表的機器聽覺技術(shù)的發(fā)展情況。
早在2014年,公安部下屬全國安防標(biāo)委會人體生物特征識別應(yīng)用分技術(shù)委員會便正式發(fā)出公告稱《GA/T 1179-2014 安防聲紋確認(rèn)應(yīng)用算法技術(shù)要求和測試方法》標(biāo)準(zhǔn)已通過審核,并于2014年10月1日開始實施。
這項標(biāo)準(zhǔn)可以說為國內(nèi)聲紋識別技術(shù)研究奠定了堅實的基礎(chǔ),因為它對聲紋識別系統(tǒng)的技術(shù)指標(biāo),包括測試庫建庫規(guī)則、測試集、測試環(huán)境的技術(shù)指標(biāo)、聲紋識別系統(tǒng)的評測標(biāo)準(zhǔn)、測試流程、測試報告內(nèi)容等都做出了詳細(xì)規(guī)定,且要求所有受測企業(yè),必須經(jīng)過嚴(yán)格的測試,方可批準(zhǔn)通過。
有了這項行業(yè)技術(shù)標(biāo)準(zhǔn)的加持,也讓聲紋識別技術(shù)在大面積商用開啟之前即能在標(biāo)準(zhǔn)規(guī)范之下展開專項技術(shù)的研究和測試,從而避免了由于標(biāo)準(zhǔn)缺失可能帶來的技術(shù)濫用及市場認(rèn)知參差不齊的亂象。
AI的B面,聲紋識別補齊身份認(rèn)證聽覺技術(shù)輔助
眾所周知,人臉識別核心應(yīng)用主要聚焦在個人身份認(rèn)證方面,由此衍生出在金融支付、人臉門禁、公安稽查布控、人臉識別尋親等諸多場景下的應(yīng)用,但從技術(shù)維度上看,這些都是基于計算機視覺層面,聲紋識別技術(shù)則剛好可以從聽覺技術(shù)的層面補齊身份認(rèn)證視聽技術(shù)手段的完整性。
并且由于技術(shù)原理的差異,據(jù)澎思科技表示,相比于人臉識別和指紋識別,聲紋的采集只需要麥克風(fēng)模塊,成本相比于攝像頭或者指紋識別模塊而言要低,采集的方便性和安全性則要高,在一些特殊領(lǐng)域,聲紋識別更是具有獨一無二的優(yōu)勢。
平安科技也曾發(fā)出觀點認(rèn)為,相比人臉、虹膜、指紋等生物識別方式,聲音作為人類最自然的溝通方式,具有日常使用廣泛、數(shù)據(jù)傳輸量小等天然優(yōu)勢,這為聲紋識別算法的提升優(yōu)化提供了數(shù)據(jù)基礎(chǔ)。
聲紋識別因其獨特的識別方式以及在安全性/防偽、成本、便捷性等方面的應(yīng)用優(yōu)勢,被認(rèn)為可以很好的填補人臉識別身份認(rèn)證之外的應(yīng)用市場,尤其在公安、金融、社保、交互型機器人等領(lǐng)域蘊含著廣泛的應(yīng)用場景。
聲紋識別技術(shù)主要應(yīng)用場景
縱觀現(xiàn)階段的聲紋識別技術(shù)應(yīng)用,其中最典型的一個應(yīng)用場景聚焦在金融領(lǐng)域的身份驗證環(huán)節(jié)。早在2018年,《關(guān)于發(fā)布金融行業(yè)標(biāo)準(zhǔn)規(guī)范聲紋識別技術(shù)金融應(yīng)用的通知(文件編號:0001-2018-S-000-005057)》便已隨《移動金融基于聲紋識別的安全應(yīng)用技術(shù)規(guī)范(標(biāo)準(zhǔn)編號:JR/T 0164-2018)》的印刷版一同下發(fā)給了全國各大銀行及各類金融機構(gòu)。
聲紋識別之所以能成為金融領(lǐng)域反欺詐的核心技術(shù),還在于它的獨特技術(shù)優(yōu)勢:1)聲紋作為一種行為特征,具有唯一性和獨特性;2)聲紋不易纂改,綜合利用聲音中蘊含的豐富信息可以具備較高的安全特性;3)由于特殊設(shè)計的聲音一般不涉及用戶隱私問題,往往用戶接受程度較高。
據(jù)相關(guān)數(shù)據(jù)顯示,在金融、信貸等強調(diào)高安全性和防偽措施的個人身份認(rèn)證環(huán)節(jié),聲紋識別的準(zhǔn)確率可達99%,可以用于輔助核實身份、聲紋鎖登陸等場景。聲紋作為綜合身份核驗方式的有效補充,在金融領(lǐng)域的電話客服身份核驗、遠程面簽身份核驗、金融防欺詐等場景中,對用戶身份核驗識別發(fā)揮了重要作用。
比如在信貸申請環(huán)節(jié),一般需要用戶親自閱讀一段固定的文字存于聲紋庫,并且同時提取其聲紋特征。在信審過程中,系統(tǒng)自動將該聲紋與黑名單庫中的聲紋做對比,同時也能夠跟最近的或者同區(qū)域的訂單聲紋做交叉對比,如果命中黑名單,則可以調(diào)低信用級別乃至直接拒絕,而通過交叉比對,還能發(fā)現(xiàn)重復(fù)的聯(lián)系人信息,提示重大欺詐嫌疑。
聲紋識別的另一大應(yīng)用場景是聲紋鎖登陸,最為大眾所熟悉的應(yīng)用應(yīng)該要數(shù)微信和支付寶的聲紋鎖登陸。聲紋鎖一般采用1v1的聲紋比對模式,將用戶注冊時的聲紋信息存于聲紋庫,每次登陸時用戶只需對著手機念出屏幕上的隨機數(shù)字或文字即可輕松登陸。用聲紋密碼代替或輔助傳統(tǒng)的字符密碼或手勢密碼,可以有效解決用戶忘記密碼的困擾,相比于字符信息,聲紋密碼更能降低了信息泄露的風(fēng)險。
在公檢法領(lǐng)域,聲紋識別作為視覺線索的補充也逐漸受到越來越多的關(guān)注,在司法訴訟、反電信詐騙、治安防控、偵查破案、執(zhí)法監(jiān)督、網(wǎng)絡(luò)安全等諸多環(huán)節(jié)發(fā)揮著重要作用。以公安的應(yīng)用為例,聲紋識別技術(shù)能夠為公安部門帶來以往戰(zhàn)法戰(zhàn)術(shù)上的突破,為案件偵破過程提供新的線索和證據(jù)。國內(nèi)聲紋識別技術(shù)廠商快商通就曾表示,在車站、機場、碼頭、酒店等公共安檢點和關(guān)鍵卡口,或在通信系統(tǒng)或安全監(jiān)測系統(tǒng)中嵌入快商通聲紋識別技術(shù),通過聲紋生物特征與語音內(nèi)容的雙因子識別,可以有效對涉暴、涉恐、涉毒等重點人員進行鑒別和提示警報,通過通訊跟蹤和聲紋辨別技術(shù)進行預(yù)防和偵查追捕。