欧美,日韩中文字幕在线,男女性杂交内射妇女bbwxz,久久99久久9国产精品免费看,久久久久无码精品国产app,免费无码成人片

a&s專業(yè)的自動化&安全生態(tài)服務平臺
公眾號
安全自動化

安全自動化

安防知識網

安防知識網

手機站
手機站

手機站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

語音識別突破!快商通&新加坡國立大學聯(lián)合論文入選ACL 2020

近日,快商通Kriston AI Lab和新加坡國立大學聯(lián)合發(fā)表的論文《Modeling Code-Switch Languages Using Bilingual Parallel Corpus(使用平行語料為中英文語碼轉換建模)》被第58屆計算語言學年會 ACL 2020 錄用,論文介紹了一種通過機器學習算法建立語言模型的方法,主要用于解決中英混合文本數據缺失問題,是語音識別領域對多語種切換語音識別的首次突破。

  近日,快商通Kriston AI Lab和新加坡國立大學聯(lián)合發(fā)表的論文《Modeling Code-Switch Languages Using Bilingual Parallel Corpus(使用平行語料為中英文語碼轉換建模)》被第58屆計算語言學年會 ACL 2020 錄用,論文介紹了一種通過機器學習算法建立語言模型的方法,主要用于解決中英混合文本數據缺失問題,是語音識別領域對多語種切換語音識別的首次突破。

  ACL是計算語言學和自然語言處理領域最重要的頂級會議,被CCF與清華共同列為頂級A類會議。今年,ACL共接收到超過3000篇投稿,雖未公布錄取率,但依照歷史平均錄取率23.7%來看,被收錄的論文代表了人工智能領域的世界領先水平。

  多語種切換語音識別現狀:需求火熱,技術難突破

  隨著全球化的演進,多語言通信成為越來越普遍的現象。例如在新加坡等東南亞地區(qū),英語作為大部分人的第一外語,會被自然而然地穿插在以中文為主的日常交流中。相對應地,對多語種切換語音識別也成為當下火熱的需求。

  然而,多語種切換語音識別一直是語音領域面臨的重要挑戰(zhàn)之一,最主要的原因,是因為多語種切換數據的缺失。

  語音識別系統(tǒng)訓練,需要語音和文本兩方面的數據。通常,多語種切換的表達多在口語交流中出現,因此,文本形式的多語種切換表達資源匱乏。

  使用平行語料為中英文語碼轉換建模

  快商通Kriston AI Lab瞄準海外痛點需求,提出了一種基于注意力機制的雙語語言建模算法(BLAM),該算法綜合考慮兩種語言的詞序列上下文關系以及兩種語言間的語法差異。具體地,文章定義了兩種損失函數,分別用于對單一語言的語法進行約束以及對多語種切換表達的語法進行約束。然后將兩種約束用于訓練基于注意力機制的深度神經網絡模型。

  這種方法,是現階段語音識別領域對多語種切換的首次突破,其算法具有以下優(yōu)點:

  1、兩種語言均可以作為主語語言,語碼轉換時兩種語言的比例不影響語音識別的性能;

  2、語言模型混淆度(PPL)相對目前最好的多語種切換語言模型建模算法能降低20%以上,語音識別詞錯率相對目前最好的多語種切換語音識別算法能降低25%以上;

  3、該算法可用于多語種切換的規(guī)范化,即,將兩個語種混雜的文本規(guī)范化為統(tǒng)一的語種表達;

  該算法可進一步擴展,用于句子生成以及機器翻譯。


參與評論
回復:
0/300
文明上網理性發(fā)言,評論區(qū)僅供其表達個人看法,并不表明a&s觀點。
0
關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產業(yè)前沿產品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產業(yè)數字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經驗,提供媒體、活動、展會等整合營銷服務。

免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網絡碰瓷及敲詐勒索,將不予任何的法律和經濟賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權所有 粵ICP備12072668號 粵公網安備 44030402000264號
用戶
反饋