百度表示將為開發(fā)者提供百度大腦的聲學模型和語音模型,基礎(chǔ)服務免費,可永久使用。
百度語音喚醒技術(shù)目前主要應用于百度小度機器人和百度車聯(lián)網(wǎng)CarLife/Codriver,喚醒率達95%,支持自定義喚醒詞和連續(xù)表達。用戶可以通過語音說出“小度你好,請播放一首古典音樂”的指令,或者“小度你好,今天百度的股價怎么樣?”的請求,都能得到響應。除了小度機器人和車聯(lián)網(wǎng),該語音喚醒技術(shù)還可以應用于手機和電視等不同的終端,于是百度希望開放該技術(shù)以加快普及和應用。
自定義語義技術(shù)則主要開放了語義和語音的映射能力,幫助開發(fā)者和第三方廠商更快更準確地提高語音識別率,比如地區(qū)方言、口音等識別。
目前,語音技術(shù)是百度主要專注的人工智能研究方向之一。此前在接受新浪科技采訪時,百度首席科學家吳恩達曾表示,關(guān)于人工智能的研究方向很多,但百度優(yōu)先專注于語音識別相關(guān)的技術(shù)和無人車等領(lǐng)域。
2015年11月,吳恩達領(lǐng)導的百度硅谷實驗室還推出了新一代語音識別技術(shù)Deep Speech2,被美國權(quán)威雜志《麻省理工評論》列為2016年十大突破性技術(shù)之一。
據(jù)百度語音相關(guān)負責人透露,Deep Speech2下一步將會被應用在百度地圖產(chǎn)品中。