智能對(duì)話機(jī)器人系統(tǒng)由三部分構(gòu)成:ASR、NLP、TTS
文章摘要:一個(gè)完整的智能語(yǔ)音對(duì)話機(jī)器人系統(tǒng)主要由自動(dòng)語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言處理(NLP)、語(yǔ)音合成(TTS)三部分構(gòu)成,這三部分技術(shù)保障了語(yǔ)音系統(tǒng)的精準(zhǔn)、高效、穩(wěn)定運(yùn)行,被稱之為語(yǔ)音交互的“三駕馬車(chē)”。
本文目錄
一個(gè)完整的智能語(yǔ)音對(duì)話機(jī)器人系統(tǒng)主要由自動(dòng)語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言處理(NLP)、語(yǔ)音合成(TTS)三部分構(gòu)成,這三部分技術(shù)保障了語(yǔ)音系統(tǒng)的精準(zhǔn)、高效、穩(wěn)定運(yùn)行,被稱之為語(yǔ)音交互的“三駕馬車(chē)”。
1)語(yǔ)音識(shí)別(ASR)
語(yǔ)音識(shí)別能夠?qū)⒂脩舻恼Z(yǔ)音轉(zhuǎn)換成文字。針對(duì)語(yǔ)音識(shí)別應(yīng)用中面臨的方言口音、背景噪聲等問(wèn)題,在實(shí)際業(yè)務(wù)系統(tǒng)中所收集的涵蓋不同方言和不同類(lèi)型背景噪聲的海量語(yǔ)音數(shù)據(jù)的基礎(chǔ)上通過(guò)先進(jìn)的區(qū)分訓(xùn)練方法進(jìn)行語(yǔ)音建模,能夠使語(yǔ)音識(shí)別在復(fù)雜應(yīng)用場(chǎng)景下均有良好的效果表現(xiàn)。在檢測(cè)語(yǔ)音過(guò)程中,語(yǔ)音活性檢測(cè) (VAD)語(yǔ)音端點(diǎn)檢查,使用音頻特征等進(jìn)行分析,確定人聲的開(kāi)始和結(jié)束時(shí)間點(diǎn)。
2)自然語(yǔ)言處理(NLP)
自然語(yǔ)言處理狹義上講包括自然語(yǔ)義理解(NLU)和自然語(yǔ)言生成(NLG)兩個(gè)方面,前者是指將人類(lèi)語(yǔ)言轉(zhuǎn)化為標(biāo)注的機(jī)器語(yǔ)言,后者則是指將機(jī)器語(yǔ)言轉(zhuǎn)化為人類(lèi)語(yǔ)言。在龐大復(fù)雜的漢語(yǔ)體系里,NLP幫助產(chǎn)品正確理解人們想要表達(dá)的意思,并給出合理的反饋。NLP是語(yǔ)音產(chǎn)品的關(guān)鍵,也是主要難點(diǎn)。
3)語(yǔ)音合成(TTS)
語(yǔ)音合成能夠?qū)⑤斎胛谋緦?shí)時(shí)轉(zhuǎn)換成流暢、清晰、自然、具有表現(xiàn)力的語(yǔ)音數(shù)據(jù),輸出高質(zhì)量的語(yǔ)音。
智能對(duì)話機(jī)器人根據(jù)客戶的意圖進(jìn)行智能應(yīng)答,語(yǔ)音識(shí)別迅速,能夠準(zhǔn)確判斷出是否為意向客戶,將客服人員從重復(fù)、機(jī)械的初步篩選、意向識(shí)別中解放出來(lái),投入到更有價(jià)值的客戶中。傳統(tǒng)外呼的人力成本和管理成本高,業(yè)務(wù)質(zhì)量無(wú)法保證,管理復(fù)雜,因此機(jī)械、重復(fù)、枯燥的電話撥打任務(wù)都可以交給智能語(yǔ)音機(jī)器人輔助完成。
》》點(diǎn)擊免費(fèi)試用智能語(yǔ)音機(jī)器人,優(yōu)勢(shì)一試便知
相關(guān)詞條推薦:AI外呼語(yǔ)音機(jī)器人 | ASR語(yǔ)音識(shí)別 | 在線聊天客服機(jī)器人
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來(lái)源:http://www.gototw.com.cn/ucm/faq/38035
人工智能對(duì)話機(jī)器人智能對(duì)話機(jī)器人智能對(duì)話系統(tǒng)
