聲紋識別專利技術分析
摘要
聲紋識別(Voiceprint Recognition,VPR),就是把未知說話人的語音數(shù)據(jù)與已知的說話人的語音數(shù)據(jù)(樣本)進行匹配,通過一定的方法得到匹配的結(jié)果,以判定“兩個人”實際上是否為同一個人。本文利用專利文獻庫,統(tǒng)計和分析國內(nèi)外有關聲紋識別技術的專利申請,梳理了聲紋識別的發(fā)展脈絡,對主要技術分支的申請量進行統(tǒng)計,同時對聲紋識別技術的核心專利和重要申請人進行分析。
專利申請量年度分布
本文通過對檢索所獲得該領域的專利申請進行統(tǒng)計和分析研究,最終確定的涉及聲紋識別的全球?qū)@暾埞?1080 件,總體發(fā)展趨勢呈現(xiàn)增長狀態(tài)。
聲紋識別專利申請量逐步增長
從全球申請整體趨勢來看,該技術的專利申請量基本上是不斷增長的,具體來看,在 2005 年之前有了初步的發(fā)展,這算是聲紋識別技術發(fā)展的第一發(fā)展階段,這一階段專利申請的增長趨勢較為緩慢,所申請的專利主要是一些基礎性專利。
聲紋識別技術歷年發(fā)展趨勢
聲紋識別技術發(fā)展趨勢
2006 年至2009 年是技術發(fā)展的平穩(wěn)期,不管是申請量還是增長率較之前都沒有亮點,這主要是因為全球經(jīng)濟的發(fā)展狀況和互聯(lián)網(wǎng)的發(fā)展并沒有進入活躍期,聲紋識別技術并沒有找到廣泛應用的場景;而從 2010 年開始,隨著全球經(jīng)濟的復蘇,以及移動通信技術、物聯(lián)網(wǎng)領域的發(fā)展,聲紋識別技術找到了更多更適合的應用場景,因此,這一階段的專利申請量逐年遞增。
聲紋技術專利申請國分布情況
該領域的申請主要分布于中國、日本、美國、韓國以及歐洲專利局,其中來自中國的專利申請占到 66%, 可見在該領域中雖然中國技術發(fā)展較晚,但是后期申請量不同小覷。

聲紋識別領域全球?qū)@暾埖膰壹暗貐^(qū)分布圖
而美國和日本兩個國家在該領域發(fā)展最早,前期儲備了一些突破性的技術專利,率先將聲紋識別技術應用于移動支付和聲紋鎖控中,可見,雖然其他國家在申請量上低于我國,但是在專利含金量上是領先中國的。
聲紋識別應用場景分析
從目前市面上的聲紋識別應用場景來看,聲紋鎖控、金融交易以及網(wǎng)絡支付等重要應用場景的申請量占到了一半以上,在近 5 年的申請量是顯著遞增的,這主要是由于物聯(lián)網(wǎng)技術以及人工智能領域的快速發(fā)展, 從而創(chuàng)造了一些適于聲紋識別技術大范圍應用的特定場景。舉例來說,2000 年的申請 US09624300 中公開了使用聲紋識別技術驗證車主的身份,以控制“解鎖并打開車門”。

聲紋識別應用占比
2007 年的申請 CN200710177819.5 中公開了使用此技術控制終端(臺式計算機、筆記本電腦、移動電話)的開機, 而在近幾年,聲紋鎖控除了應用在汽車、移動終端中,也應用于智能家居設備、可穿戴設備、手機應用的喚醒、重要文件的加密等場景。

聲紋識別的專利申請趨勢
金融交易場景中的聲紋識別應用
在金融交易和網(wǎng)絡支付中,2002 年的申請 US10213486 公開了一種基于對話的聲紋安全商務交易系統(tǒng),具體為用戶通過電話辦理業(yè)務時,通過提取電話交談中的聲紋信息進行比對,判斷是否是用戶本人,然后確定是否提供相應業(yè)務,CN200710041252.9 公開了一種基于聲紋認證的網(wǎng)絡支付方法,具體為用戶通過網(wǎng)絡進行支付操作時,提示用戶輸入一段語音,然后確定身份是否合法。
聲紋識別專利重要申請人分布情況
通過對申請人申請量進行分析,得到全球在聲紋識別領域前 10 位申請人的申請量排名。從中看以看出,前十位均被中國、日本、美國企業(yè)占領,其中我國占據(jù)多數(shù),這主要是近年來中國在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等方面的快速發(fā)展催生出一批互聯(lián)網(wǎng)巨頭,如 BAT,華為等。
聲紋技術研究企業(yè)的優(yōu)勢
這些企業(yè)有著后發(fā)先至的優(yōu)勢,借助中國廣闊的市場迅速成長,這些企業(yè)的研發(fā)投入占比也較高,在智能家居、人工智能等方面的研發(fā)獨占鰲頭,使得人們在多領域多方面對信息安全的要求越來越高,因此,這些企業(yè)的專利申請量在近幾年迅速積累,具體涉及到算法及產(chǎn)品應用,但是從目前來看,這些企業(yè)的大部分專利先進性一般,并沒有真的實現(xiàn)核心專利自主擁有,主要的突破來自應用場景的多元;雖然日本和美國企業(yè)在申請總量上排名并不靠前,但是在該領域?qū)@季州^早,先進性較好,比如美國申請US20030037004A1 早在 2002 年就申請了在移動支付中使用聲紋識別技術,而中國的部分企業(yè)在近幾年還在申請類似的專利,由此可見,中國企業(yè)想要在該領域有所作為,不應止步于數(shù)量上的進步,還應加大原創(chuàng)性專利的開發(fā)和布局,提高專利質(zhì)量。

聲紋專利申請量排名分布
重點專利分析
接下來通過選取聲紋識別領域的代表性專利來梳理該領域的發(fā)展路線,其中 2010 年之前可以作為聲紋識別技術發(fā)展的第一階段,2010 年至今作為聲紋識別技術發(fā)展的第二階段。
在第一階段中出現(xiàn)了一些突破性的專利:
1、生物特征驗證移動終端
2001 年的申請 US20010017584A1 公開了一種能夠通過生物特征信息進行驗證的移動終端,其中提及先將用戶進行金融交易的密碼與用戶的身份信息關聯(lián)存儲于移動終端,然后用戶可以輸入聲紋信息,在移動終端認證成功后,將用戶的相關密碼顯示出來,以方便用戶使用該密碼進行金融支付。
2、商務交易聲紋安全系統(tǒng)
2002 年的申請 US20030037004A1 公開了一種針對商務交易,基于對話框的聲紋安全系統(tǒng),用戶通過客戶端進行交易操作,在完成付費之前向客戶端發(fā)送一串隨機字符, 用戶讀取相關字符,然后通過語音識別軟件和聲紋識別軟件對語音信息進行判斷,如果兩個置信度都在閾值以上,那么用戶身份通過,可以進行付費操作。
3、汽車聲紋解鎖方案
同年的美國申請US20030122652A1 公開了一種語音控制汽車解鎖和開門的方法。這兩種應用場景發(fā)展至今已成為聲紋確認領域重要的一環(huán):網(wǎng)絡支付與聲紋鎖控。同樣的情況也出現(xiàn)在聲紋辨認領域中,美國申請 US20080091425A1 在 2008 年就將該技術用于防恐。
聲紋識別的發(fā)展方向
1、人工智能領域
在 2010 年至今,聲紋識別技術憑借其固有的優(yōu)勢得到越來越多企業(yè)的重視,其發(fā)展主要在兩個方面,一是將已有的技術鋪展在各種應用場景中,這類專利的申請量較大,如智能家居設備和人工智能領域,但是申請突破性并不大,技術原創(chuàng)度不高
2、基礎算法專利方向
另一類則是在基礎專利上做文章,如百度、騰訊、芋頭科技等公司申請的專利一部分來自于算法研究, 目的是從聲紋識別的準確率、魯棒性等方面提高聲紋識別技術的可靠性。因此,在這一階段可以看出大企業(yè)的專利布局開始從量向質(zhì)的方向轉(zhuǎn)變,這為聲紋識別技術的可持續(xù)健康發(fā)展也打下基礎。
總結(jié):
基于對專利申請的統(tǒng)計分析,本文對聲紋識別技術的相關專利進行了國內(nèi)外專利申請趨勢、主要申請人以及技術發(fā)展歷程進行分析,梳理了主要技術分支下的專利技術。有助于審查員全面了解聲紋識別技術的發(fā)展狀況,對相關領域的審查工作有一定的幫助。
聲紋識別(Voiceprint Recognition,VPR),就是把未知說話人的語音數(shù)據(jù)與已知的說話人的語音數(shù)據(jù)(樣本)進行匹配,通過一定的方法得到匹配的結(jié)果,以判定“兩個人”實際上是否為同一個人。本文利用專利文獻庫,統(tǒng)計和分析國內(nèi)外有關聲紋識別技術的專利申請,梳理了聲紋識別的發(fā)展脈絡,對主要技術分支的申請量進行統(tǒng)計,同時對聲紋識別技術的核心專利和重要申請人進行分析。
專利申請量年度分布
本文通過對檢索所獲得該領域的專利申請進行統(tǒng)計和分析研究,最終確定的涉及聲紋識別的全球?qū)@暾埞?1080 件,總體發(fā)展趨勢呈現(xiàn)增長狀態(tài)。
聲紋識別專利申請量逐步增長
從全球申請整體趨勢來看,該技術的專利申請量基本上是不斷增長的,具體來看,在 2005 年之前有了初步的發(fā)展,這算是聲紋識別技術發(fā)展的第一發(fā)展階段,這一階段專利申請的增長趨勢較為緩慢,所申請的專利主要是一些基礎性專利。
聲紋識別技術歷年發(fā)展趨勢
2006 年至2009 年是技術發(fā)展的平穩(wěn)期,不管是申請量還是增長率較之前都沒有亮點,這主要是因為全球經(jīng)濟的發(fā)展狀況和互聯(lián)網(wǎng)的發(fā)展并沒有進入活躍期,聲紋識別技術并沒有找到廣泛應用的場景;而從 2010 年開始,隨著全球經(jīng)濟的復蘇,以及移動通信技術、物聯(lián)網(wǎng)領域的發(fā)展,聲紋識別技術找到了更多更適合的應用場景,因此,這一階段的專利申請量逐年遞增。
聲紋技術專利申請國分布情況
該領域的申請主要分布于中國、日本、美國、韓國以及歐洲專利局,其中來自中國的專利申請占到 66%, 可見在該領域中雖然中國技術發(fā)展較晚,但是后期申請量不同小覷。

聲紋識別領域全球?qū)@暾埖膰壹暗貐^(qū)分布圖
聲紋識別應用場景分析
從目前市面上的聲紋識別應用場景來看,聲紋鎖控、金融交易以及網(wǎng)絡支付等重要應用場景的申請量占到了一半以上,在近 5 年的申請量是顯著遞增的,這主要是由于物聯(lián)網(wǎng)技術以及人工智能領域的快速發(fā)展, 從而創(chuàng)造了一些適于聲紋識別技術大范圍應用的特定場景。舉例來說,2000 年的申請 US09624300 中公開了使用聲紋識別技術驗證車主的身份,以控制“解鎖并打開車門”。

聲紋識別應用占比

聲紋識別的專利申請趨勢
在金融交易和網(wǎng)絡支付中,2002 年的申請 US10213486 公開了一種基于對話的聲紋安全商務交易系統(tǒng),具體為用戶通過電話辦理業(yè)務時,通過提取電話交談中的聲紋信息進行比對,判斷是否是用戶本人,然后確定是否提供相應業(yè)務,CN200710041252.9 公開了一種基于聲紋認證的網(wǎng)絡支付方法,具體為用戶通過網(wǎng)絡進行支付操作時,提示用戶輸入一段語音,然后確定身份是否合法。
聲紋識別專利重要申請人分布情況
通過對申請人申請量進行分析,得到全球在聲紋識別領域前 10 位申請人的申請量排名。從中看以看出,前十位均被中國、日本、美國企業(yè)占領,其中我國占據(jù)多數(shù),這主要是近年來中國在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等方面的快速發(fā)展催生出一批互聯(lián)網(wǎng)巨頭,如 BAT,華為等。
聲紋技術研究企業(yè)的優(yōu)勢
這些企業(yè)有著后發(fā)先至的優(yōu)勢,借助中國廣闊的市場迅速成長,這些企業(yè)的研發(fā)投入占比也較高,在智能家居、人工智能等方面的研發(fā)獨占鰲頭,使得人們在多領域多方面對信息安全的要求越來越高,因此,這些企業(yè)的專利申請量在近幾年迅速積累,具體涉及到算法及產(chǎn)品應用,但是從目前來看,這些企業(yè)的大部分專利先進性一般,并沒有真的實現(xiàn)核心專利自主擁有,主要的突破來自應用場景的多元;雖然日本和美國企業(yè)在申請總量上排名并不靠前,但是在該領域?qū)@季州^早,先進性較好,比如美國申請US20030037004A1 早在 2002 年就申請了在移動支付中使用聲紋識別技術,而中國的部分企業(yè)在近幾年還在申請類似的專利,由此可見,中國企業(yè)想要在該領域有所作為,不應止步于數(shù)量上的進步,還應加大原創(chuàng)性專利的開發(fā)和布局,提高專利質(zhì)量。

聲紋專利申請量排名分布
接下來通過選取聲紋識別領域的代表性專利來梳理該領域的發(fā)展路線,其中 2010 年之前可以作為聲紋識別技術發(fā)展的第一階段,2010 年至今作為聲紋識別技術發(fā)展的第二階段。
在第一階段中出現(xiàn)了一些突破性的專利:
1、生物特征驗證移動終端
2001 年的申請 US20010017584A1 公開了一種能夠通過生物特征信息進行驗證的移動終端,其中提及先將用戶進行金融交易的密碼與用戶的身份信息關聯(lián)存儲于移動終端,然后用戶可以輸入聲紋信息,在移動終端認證成功后,將用戶的相關密碼顯示出來,以方便用戶使用該密碼進行金融支付。
2、商務交易聲紋安全系統(tǒng)
2002 年的申請 US20030037004A1 公開了一種針對商務交易,基于對話框的聲紋安全系統(tǒng),用戶通過客戶端進行交易操作,在完成付費之前向客戶端發(fā)送一串隨機字符, 用戶讀取相關字符,然后通過語音識別軟件和聲紋識別軟件對語音信息進行判斷,如果兩個置信度都在閾值以上,那么用戶身份通過,可以進行付費操作。
3、汽車聲紋解鎖方案
同年的美國申請US20030122652A1 公開了一種語音控制汽車解鎖和開門的方法。這兩種應用場景發(fā)展至今已成為聲紋確認領域重要的一環(huán):網(wǎng)絡支付與聲紋鎖控。同樣的情況也出現(xiàn)在聲紋辨認領域中,美國申請 US20080091425A1 在 2008 年就將該技術用于防恐。
聲紋識別的發(fā)展方向
1、人工智能領域
在 2010 年至今,聲紋識別技術憑借其固有的優(yōu)勢得到越來越多企業(yè)的重視,其發(fā)展主要在兩個方面,一是將已有的技術鋪展在各種應用場景中,這類專利的申請量較大,如智能家居設備和人工智能領域,但是申請突破性并不大,技術原創(chuàng)度不高
2、基礎算法專利方向
另一類則是在基礎專利上做文章,如百度、騰訊、芋頭科技等公司申請的專利一部分來自于算法研究, 目的是從聲紋識別的準確率、魯棒性等方面提高聲紋識別技術的可靠性。因此,在這一階段可以看出大企業(yè)的專利布局開始從量向質(zhì)的方向轉(zhuǎn)變,這為聲紋識別技術的可持續(xù)健康發(fā)展也打下基礎。
總結(jié):
基于對專利申請的統(tǒng)計分析,本文對聲紋識別技術的相關專利進行了國內(nèi)外專利申請趨勢、主要申請人以及技術發(fā)展歷程進行分析,梳理了主要技術分支下的專利技術。有助于審查員全面了解聲紋識別技術的發(fā)展狀況,對相關領域的審查工作有一定的幫助。


