聲紋識別專利技術(shù)分析
聲紋識別(Voiceprint Recognition,VPR),就是把未知說話人的語音數(shù)據(jù)與已知的說話人的語音數(shù)據(jù)(樣本)進行匹配,通過一定的方法得到匹配的結(jié)果,以判定“兩個人”實際上是否為同一個人。本文利用專利文獻庫,統(tǒng)計和分析國內(nèi)外有關(guān)聲紋識別技術(shù)的專利申請,梳理了聲紋識別的發(fā)展脈絡(luò),對主要技術(shù)分支的申請量進行統(tǒng)計,同時對聲紋識別技術(shù)的核心專利和重要申請人進行分析。
專利申請量年度分布
本文通過對檢索所獲得該領(lǐng)域的專利申請進行統(tǒng)計和分析研究,最終確定的涉及聲紋識別的全球?qū)@暾埞?1080 件,總體發(fā)展趨勢呈現(xiàn)增長狀態(tài)。
聲紋識別專利申請量逐步增長
從全球申請整體趨勢來看,該技術(shù)的專利申請量基本上是不斷增長的,具體來看,在 2005 年之前有了初步的發(fā)展,這算是聲紋識別技術(shù)發(fā)展的第一發(fā)展階段,這一階段專利申請的增長趨勢較為緩慢,所申請的專利主要是一些基礎(chǔ)性專利。
聲紋識別技術(shù)歷年發(fā)展趨勢
2006 年至2009 年是技術(shù)發(fā)展的平穩(wěn)期,不管是申請量還是增長率較之前都沒有亮點,這主要是因為全球經(jīng)濟的發(fā)展狀況和互聯(lián)網(wǎng)的發(fā)展并沒有進入活躍期,聲紋識別技術(shù)并沒有找到廣泛應用的場景;而從 2010 年開始,隨著全球經(jīng)濟的復蘇,以及移動通信技術(shù)、物聯(lián)網(wǎng)領(lǐng)域的發(fā)展,聲紋識別技術(shù)找到了更多更適合的應用場景,因此,這一階段的專利申請量逐年遞增。
聲紋技術(shù)專利申請國分布情況
該領(lǐng)域的申請主要分布于中國、日本、美國、韓國以及歐洲專利局,其中來自中國的專利申請占到 66%, 可見在該領(lǐng)域中雖然中國技術(shù)發(fā)展較晚,但是后期申請量不同小覷。

聲紋識別領(lǐng)域全球?qū)@暾埖膰壹暗貐^(qū)分布圖
聲紋識別應用場景分析
從目前市面上的聲紋識別應用場景來看,聲紋鎖控、金融交易以及網(wǎng)絡(luò)支付等重要應用場景的申請量占到了一半以上,在近 5 年的申請量是顯著遞增的,這主要是由于物聯(lián)網(wǎng)技術(shù)以及人工智能領(lǐng)域的快速發(fā)展, 從而創(chuàng)造了一些適于聲紋識別技術(shù)大范圍應用的特定場景。舉例來說,2000 年的申請 US09624300 中公開了使用聲紋識別技術(shù)驗證車主的身份,以控制“解鎖并打開車門”。

聲紋識別應用占比

聲紋識別的專利申請趨勢
在金融交易和網(wǎng)絡(luò)支付中,2002 年的申請 US10213486 公開了一種基于對話的聲紋安全商務(wù)交易系統(tǒng),具體為用戶通過電話辦理業(yè)務(wù)時,通過提取電話交談中的聲紋信息進行比對,判斷是否是用戶本人,然后確定是否提供相應業(yè)務(wù),CN200710041252.9 公開了一種基于聲紋認證的網(wǎng)絡(luò)支付方法,具體為用戶通過網(wǎng)絡(luò)進行支付操作時,提示用戶輸入一段語音,然后確定身份是否合法。
聲紋識別專利重要申請人分布情況
通過對申請人申請量進行分析,得到全球在聲紋識別領(lǐng)域前 10 位申請人的申請量排名。從中看以看出,前十位均被中國、日本、美國企業(yè)占領(lǐng),其中我國占據(jù)多數(shù),這主要是近年來中國在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等方面的快速發(fā)展催生出一批互聯(lián)網(wǎng)巨頭,如 BAT,華為等。
聲紋技術(shù)研究企業(yè)的優(yōu)勢
這些企業(yè)有著后發(fā)先至的優(yōu)勢,借助中國廣闊的市場迅速成長,這些企業(yè)的研發(fā)投入占比也較高,在智能家居、人工智能等方面的研發(fā)獨占鰲頭,使得人們在多領(lǐng)域多方面對信息安全的要求越來越高,因此,這些企業(yè)的專利申請量在近幾年迅速積累,具體涉及到算法及產(chǎn)品應用,但是從目前來看,這些企業(yè)的大部分專利先進性一般,并沒有真的實現(xiàn)核心專利自主擁有,主要的突破來自應用場景的多元;雖然日本和美國企業(yè)在申請總量上排名并不靠前,但是在該領(lǐng)域?qū)@季州^早,先進性較好,比如美國申請US20030037004A1 早在 2002 年就申請了在移動支付中使用聲紋識別技術(shù),而中國的部分企業(yè)在近幾年還在申請類似的專利,由此可見,中國企業(yè)想要在該領(lǐng)域有所作為,不應止步于數(shù)量上的進步,還應加大原創(chuàng)性專利的開發(fā)和布局,提高專利質(zhì)量。

聲紋專利申請量排名分布
接下來通過選取聲紋識別領(lǐng)域的代表性專利來梳理該領(lǐng)域的發(fā)展路線,其中 2010 年之前可以作為聲紋識別技術(shù)發(fā)展的第一階段,2010 年至今作為聲紋識別技術(shù)發(fā)展的第二階段。
在第一階段中出現(xiàn)了一些突破性的專利:
1、生物特征驗證移動終端
2001 年的申請 US20010017584A1 公開了一種能夠通過生物特征信息進行驗證的移動終端,其中提及先將用戶進行金融交易的密碼與用戶的身份信息關(guān)聯(lián)存儲于移動終端,然后用戶可以輸入聲紋信息,在移動終端認證成功后,將用戶的相關(guān)密碼顯示出來,以方便用戶使用該密碼進行金融支付。
2、商務(wù)交易聲紋安全系統(tǒng)
2002 年的申請 US20030037004A1 公開了一種針對商務(wù)交易,基于對話框的聲紋安全系統(tǒng),用戶通過客戶端進行交易操作,在完成付費之前向客戶端發(fā)送一串隨機字符, 用戶讀取相關(guān)字符,然后通過語音識別軟件和聲紋識別軟件對語音信息進行判斷,如果兩個置信度都在閾值以上,那么用戶身份通過,可以進行付費操作。
3、汽車聲紋解鎖方案
同年的美國申請US20030122652A1 公開了一種語音控制汽車解鎖和開門的方法。這兩種應用場景發(fā)展至今已成為聲紋確認領(lǐng)域重要的一環(huán):網(wǎng)絡(luò)支付與聲紋鎖控。同樣的情況也出現(xiàn)在聲紋辨認領(lǐng)域中,美國申請 US20080091425A1 在 2008 年就將該技術(shù)用于防恐。
聲紋識別的發(fā)展方向
1、人工智能領(lǐng)域
在 2010 年至今,聲紋識別技術(shù)憑借其固有的優(yōu)勢得到越來越多企業(yè)的重視,其發(fā)展主要在兩個方面,一是將已有的技術(shù)鋪展在各種應用場景中,這類專利的申請量較大,如智能家居設(shè)備和人工智能領(lǐng)域,但是申請突破性并不大,技術(shù)原創(chuàng)度不高
2、基礎(chǔ)算法專利方向
另一類則是在基礎(chǔ)專利上做文章,如百度、騰訊、芋頭科技等公司申請的專利一部分來自于算法研究, 目的是從聲紋識別的準確率、魯棒性等方面提高聲紋識別技術(shù)的可靠性。因此,在這一階段可以看出大企業(yè)的專利布局開始從量向質(zhì)的方向轉(zhuǎn)變,這為聲紋識別技術(shù)的可持續(xù)健康發(fā)展也打下基礎(chǔ)。
總結(jié):
基于對專利申請的統(tǒng)計分析,本文對聲紋識別技術(shù)的相關(guān)專利進行了國內(nèi)外專利申請趨勢、主要申請人以及技術(shù)發(fā)展歷程進行分析,梳理了主要技術(shù)分支下的專利技術(shù)。有助于審查員全面了解聲紋識別技術(shù)的發(fā)展狀況,對相關(guān)領(lǐng)域的審查工作有一定的幫助。
