聲紋識(shí)別最權(quán)威評(píng)測(cè) NIST SRE18結(jié)果公布:快商通排名全球前三!
在由美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)署(NIST)主辦的說(shuō)話人識(shí)別技術(shù)評(píng)測(cè)(Speaker Recognition Evaluation, SRE)公布的最新評(píng)測(cè)結(jié)果中,由快商通首席科學(xué)家李海洲教授及快商通聲紋研究院領(lǐng)銜的I4U團(tuán)隊(duì)獲得綜合成績(jī)第三名的好成績(jī),在大中華區(qū)參賽團(tuán)隊(duì)中排名第一。
NIST SRE:國(guó)際最權(quán)威、標(biāo)準(zhǔn)最嚴(yán)、影響力最大的聲紋識(shí)別技術(shù)評(píng)測(cè)
SRE 2018 是由NIST(National Institute of Standards and Technology,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院,直屬美國(guó)商務(wù)部)承辦的國(guó)際上規(guī)模最大、標(biāo)準(zhǔn)最嚴(yán)、最權(quán)威的聲紋識(shí)別技術(shù)評(píng)測(cè),為全球參賽研究機(jī)構(gòu)提供了一個(gè)公平的統(tǒng)一測(cè)試平臺(tái),旨在關(guān)注聲紋識(shí)別領(lǐng)域的核心技術(shù)問(wèn)題。從1996年開(kāi)始舉辦至今,參加 NIST SRE 評(píng)測(cè)的隊(duì)伍逐年增加,今年有包括麻省理工、清華大學(xué)、聲揚(yáng)科技等在內(nèi)的25個(gè)國(guó)家、78支隊(duì)伍參賽。
近年來(lái),NIST SRE 的重點(diǎn)任務(wù)是對(duì)于現(xiàn)階段實(shí)用領(lǐng)域中,口語(yǔ)對(duì)話電話語(yǔ)音(CTS)的說(shuō)話人檢測(cè)。
今年,除了在各種手機(jī)上錄制的CTS 之外,SRE18中的開(kāi)發(fā)和測(cè)試材料還加入了IP語(yǔ)音(VOIP)數(shù)據(jù),以及視頻音頻(AfV)數(shù)據(jù)。數(shù)據(jù)庫(kù)環(huán)境的復(fù)雜程度更高、干擾因素更多,已遠(yuǎn)遠(yuǎn)超過(guò)一般的實(shí)際應(yīng)用場(chǎng)景,意味著對(duì)參評(píng)機(jī)構(gòu)的算法性能和系統(tǒng)魯棒性等提出更高的要求。
另外,由于現(xiàn)實(shí)應(yīng)用中,系統(tǒng)往往要根據(jù)不同的需求來(lái)決定閾值的選取。今年,為綜合考核參評(píng)系統(tǒng)的靈活度、實(shí)用度以及綜合實(shí)力,NIST 將C_primary(或稱(chēng)為actDCF)作為首要核心指標(biāo),用于描述說(shuō)話人識(shí)別系統(tǒng)的整體辨別能力,評(píng)判標(biāo)準(zhǔn)不再僅看在某個(gè)閾值點(diǎn)的FAR/FRR或DCF,進(jìn)一步提升了競(jìng)賽的難度。
因此,NIST SRE 測(cè)評(píng)結(jié)果不僅為當(dāng)前說(shuō)話人識(shí)別的最新技術(shù)進(jìn)步水平,也代表著該技術(shù)在目前實(shí)戰(zhàn)場(chǎng)景應(yīng)用中能夠具備的最佳表現(xiàn)。
聲紋識(shí)別技術(shù)排名全球前三,快商通憑什么?
在眾多多場(chǎng)景測(cè)評(píng)中,快商通聲紋識(shí)別系統(tǒng)在十萬(wàn)分之一的誤報(bào)率下識(shí)別準(zhǔn)確率超過(guò)99%。是國(guó)內(nèi)聲紋識(shí)別領(lǐng)域企業(yè)中在該指標(biāo)下的最好水平,也體現(xiàn)了我國(guó)說(shuō)話人識(shí)別技術(shù)已達(dá)到世界領(lǐng)先水平。
“NIST SRE 評(píng)測(cè)挑戰(zhàn)最大的是單信道多說(shuō)話人識(shí)別。”快商通AI事業(yè)部研究員葉志堅(jiān)表示,“測(cè)試數(shù)據(jù)中,每段語(yǔ)音使用麥克風(fēng)陣列錄制用來(lái)混合測(cè)試,比如電話信道涵蓋了移動(dòng)電話,固定電話等。麥克風(fēng)類(lèi)型也幾乎覆蓋實(shí)際應(yīng)用中所有類(lèi)型。其次,環(huán)境噪聲也更‘廣義化’,包括環(huán)境噪聲、人聲非語(yǔ)言、彩鈴炫鈴等各種背景噪聲情況。我們的系統(tǒng)采用了經(jīng)典的DNN-ivector系統(tǒng)和基于端到端深度神經(jīng)網(wǎng)絡(luò)(DNN)的說(shuō)話人特征提取系統(tǒng),在不同語(yǔ)種中使用的結(jié)果都不錯(cuò)。”
今年,快商通聲紋研究院在單信道多說(shuō)話人識(shí)別方面取得了重大的進(jìn)展,提出“單耳語(yǔ)音分離技術(shù)”,實(shí)現(xiàn)單音頻定向人聲分離,開(kāi)創(chuàng)性解決聲紋識(shí)別中“雞尾酒會(huì)問(wèn)題”難題。經(jīng)實(shí)測(cè)、在嘈雜的環(huán)境中能夠準(zhǔn)確分辨多說(shuō)話人聲音。
這套強(qiáng)大聲紋識(shí)別系統(tǒng)出色的完成了 NIST SRE 的說(shuō)話人檢測(cè)任務(wù),特別是在降低環(huán)境“噪聲”干擾,以及同一段語(yǔ)音中多聲紋特征提取方面表現(xiàn)優(yōu)異,系統(tǒng)將語(yǔ)音樣本分割聚類(lèi)成獨(dú)立的片段,準(zhǔn)確標(biāo)注出“誰(shuí)”從“什么時(shí)候”到“什么時(shí)候”在說(shuō)話。
美國(guó)“最嚴(yán)技術(shù)封鎖”,國(guó)產(chǎn)AI能力崛起
美國(guó)商務(wù)部工業(yè)安全署(BIS)根據(jù)出口行政規(guī)定(ExportAdministration Regulations, EAR)對(duì)軍民兩用和較為不敏感的軍品出口進(jìn)行監(jiān)管,主要甄別涉及國(guó)家安全和高技術(shù)范疇的出口。根據(jù)美國(guó)商務(wù)部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),從美國(guó)公布的清單中甄別篩選出的代表性產(chǎn)業(yè)類(lèi)別來(lái)看,可謂條條針對(duì)中國(guó)最新計(jì)劃發(fā)展的高科技產(chǎn)業(yè)。
近年來(lái),中國(guó)人工智能高速發(fā)展。無(wú)人超市,無(wú)人物流,無(wú)人加油站,無(wú)人駕駛,無(wú)人酒店……再加上各種功能健全的機(jī)器人!在我們毫無(wú)察覺(jué)中,人工智能正在日夜不息地自我迭代進(jìn)化,沖擊著我們生活的方方面面。
在人臉識(shí)別技術(shù)的研發(fā)和應(yīng)用上,中國(guó)在其上投入巨大,在各項(xiàng)國(guó)際人臉領(lǐng)域的評(píng)測(cè)中中國(guó)的企業(yè)穩(wěn)拿第一,如依圖科技,曠世科技,商湯科技(SenseTime)、云從科技、百度等企業(yè)。
在聲紋領(lǐng)域,快商通已將自主研發(fā)的聲紋識(shí)別技術(shù)落地應(yīng)用在金融、安防、社保、智能家居、物聯(lián)網(wǎng)等領(lǐng)域,推出“金融信貸身份反欺詐”、“社保異地生存驗(yàn)證”等行業(yè)解決方案。 在豐富項(xiàng)目經(jīng)驗(yàn)積累下,快商通在國(guó)內(nèi)銀行、保險(xiǎn)等領(lǐng)域商業(yè)測(cè)試中均取得聲紋技術(shù)排名第一,目前,快商通已為平安集團(tuán)、上海華瑞銀行,國(guó)家電網(wǎng)、常州司法局等用戶(hù)落地聲紋行業(yè)解決方案。
在推動(dòng)人工智能落地應(yīng)用的同時(shí),快商通也在持續(xù)加大對(duì)前沿技術(shù)投入。在成立快商通新加坡研究院之后,還與福建本土高校廈門(mén)大學(xué)、華僑大學(xué)建立聯(lián)合建立人工智能研究院,推進(jìn)產(chǎn)學(xué)研用結(jié)合,為廈門(mén)市乃至福建省的人工智能產(chǎn)業(yè)規(guī)模化發(fā)展增光添彩,為提升我國(guó)科技創(chuàng)新實(shí)力、為我國(guó)高科技產(chǎn)業(yè)的核心技術(shù)發(fā)展做積極貢獻(xiàn)。
2018年,快商通首席科學(xué)家李海洲教授帶領(lǐng)的新加坡國(guó)立大學(xué)團(tuán)隊(duì)榮獲2018年第二屆國(guó)際大學(xué)生類(lèi)腦計(jì)算大賽一等獎(jiǎng);
2017年,快商通聲紋團(tuán)隊(duì)在Interspeech2017的ASVspoof2017自動(dòng)說(shuō)話人驗(yàn)證欺騙和對(duì)策挑戰(zhàn)賽(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,獲得全球第一。
