多語(yǔ)種切換語(yǔ)音識(shí)別首次突破!快商通&新加坡國(guó)立大學(xué)聯(lián)合論文入選ACL 2020

ACL是計(jì)算語(yǔ)言學(xué)和自然語(yǔ)言處理領(lǐng)域最重要的頂級(jí)會(huì)議,被CCF與清華共同列為頂級(jí)A類(lèi)會(huì)議。今年,ACL共接收到超過(guò)3000篇投稿,雖未公布錄取率,但依照歷史平均錄取率23.7%來(lái)看,被收錄的論文代表了人工智能領(lǐng)域的世界領(lǐng)先水平。
多語(yǔ)種切換語(yǔ)音識(shí)別現(xiàn)狀:需求火熱,技術(shù)難突破
隨著全球化的演進(jìn),多語(yǔ)言通信成為越來(lái)越普遍的現(xiàn)象。例如在新加坡等東南亞地區(qū),英語(yǔ)作為大部分人的第一外語(yǔ),會(huì)被自然而然地穿插在以中文為主的日常交流中。相對(duì)應(yīng)地,對(duì)多語(yǔ)種切換語(yǔ)音識(shí)別也成為當(dāng)下火熱的需求。
然而,多語(yǔ)種切換語(yǔ)音識(shí)別一直是語(yǔ)音領(lǐng)域面臨的重要挑戰(zhàn)之一,最主要的原因,是因?yàn)?strong>多語(yǔ)種切換數(shù)據(jù)的缺失。
語(yǔ)音識(shí)別系統(tǒng)訓(xùn)練,需要語(yǔ)音和文本兩方面的數(shù)據(jù)。通常,多語(yǔ)種切換的表達(dá)多在口語(yǔ)交流中出現(xiàn),因此,文本形式的多語(yǔ)種切換表達(dá)資源匱乏。
使用平行語(yǔ)料為中英文語(yǔ)碼轉(zhuǎn)換建模
快商通Kriston AI Lab瞄準(zhǔn)海外痛點(diǎn)需求,提出了一種基于注意力機(jī)制的雙語(yǔ)語(yǔ)言建模算法(BLAM),該算法綜合考慮兩種語(yǔ)言的詞序列上下文關(guān)系以及兩種語(yǔ)言間的語(yǔ)法差異。具體地,文章定義了兩種損失函數(shù),分別用于對(duì)單一語(yǔ)言的語(yǔ)法進(jìn)行約束以及對(duì)多語(yǔ)種切換表達(dá)的語(yǔ)法進(jìn)行約束。然后將兩種約束用于訓(xùn)練基于注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)模型。
這種方法,是現(xiàn)階段語(yǔ)音識(shí)別領(lǐng)域?qū)Χ嗾Z(yǔ)種切換的首次突破,其算法具有以下優(yōu)點(diǎn):
1、兩種語(yǔ)言均可以作為主語(yǔ)語(yǔ)言,語(yǔ)碼轉(zhuǎn)換時(shí)兩種語(yǔ)言的比例不影響語(yǔ)音識(shí)別的性能;
2、語(yǔ)言模型混淆度(PPL)相對(duì)目前最好的多語(yǔ)種切換語(yǔ)言模型建模算法能降低20%以上,語(yǔ)音識(shí)別詞錯(cuò)率相對(duì)目前最好的多語(yǔ)種切換語(yǔ)音識(shí)別算法能降低25%以上;
3、該算法可用于多語(yǔ)種切換的規(guī)范化,即,將兩個(gè)語(yǔ)種混雜的文本規(guī)范化為統(tǒng)一的語(yǔ)種表達(dá);
該算法可進(jìn)一步擴(kuò)展,用于句子生成以及機(jī)器翻譯。
技術(shù)全球化布局,構(gòu)建中國(guó)AI影響力
快商通Kriston AI Lab研究多語(yǔ)種切換的核心目的,是希望構(gòu)建更加便利、更加人性化的語(yǔ)音技術(shù)能力,進(jìn)而破除全球化發(fā)展難題,為用戶(hù)創(chuàng)造更大的價(jià)值。這一思想,與公司積極推動(dòng)技術(shù)出海的戰(zhàn)略相吻合。
專(zhuān)注人工智能技術(shù)近10年,快商通Kriston AI Lab在算法原創(chuàng)和技術(shù)開(kāi)發(fā)上都已形成深厚的積累,恰逢全球化背景,公司積極響應(yīng)海外市場(chǎng)需求,將語(yǔ)音識(shí)別、自然語(yǔ)言處理、聲紋識(shí)別、大數(shù)據(jù)等方面的核心技術(shù)逐漸向外延伸,自2017年以來(lái),先后在新加坡、美國(guó)硅谷、俄羅斯莫斯科建立人工智能海外研究院,與俄羅斯科學(xué)院達(dá)成技術(shù)與人才方面的戰(zhàn)略合作。
未來(lái),快商通還將持續(xù)保持合作共贏(yíng)的態(tài)度,以AI為核心賦能海外市場(chǎng),探索中國(guó)技術(shù)國(guó)際化路徑,在世界范圍內(nèi)構(gòu)建中國(guó)人工智能的影響力。
注:快商通旗下Kriston AI Lab于2012年創(chuàng)建,專(zhuān)注語(yǔ)音識(shí)別、自然語(yǔ)言處理、聲紋識(shí)別大數(shù)據(jù)分析等人工智能技術(shù)的研究和應(yīng)用,現(xiàn)由IEEE Fellow李海洲教授領(lǐng)導(dǎo)。截至2020年初,Kriston AI Lab團(tuán)隊(duì)共申請(qǐng)發(fā)明專(zhuān)利400余項(xiàng),榮獲國(guó)際算法權(quán)威大賽NIST SRE 2018全球前三、中國(guó)AI最高獎(jiǎng)——吳文俊人工智能科技進(jìn)步獎(jiǎng)。
