
客戶案例|優(yōu)惠活動大廳助力新能源車企高效迭代智能座艙語音交互功能
發(fā)布時間 : 2023-02-23 閱讀量 : 1329
作為時下最熱的賽道之一,新能源汽車制造業(yè)的“內(nèi)卷”程度有目共睹。而電動化、智能化、網(wǎng)聯(lián)化、自動化的“新四化”發(fā)展趨勢,也正重新定位汽車行業(yè)的價值鏈。
本期客戶就是國內(nèi)高端智能電動汽車領(lǐng)航者之一,其愿景是將智能汽車打造為數(shù)智化第三空間。
客戶需求背景
一直以來,智能駕艙都是客戶公司“智行”戰(zhàn)略重點(diǎn)方向之一,是客戶產(chǎn)品的重要賣點(diǎn)。在接觸前,客戶已有部分基礎(chǔ)智能模型,秉承著更好服務(wù)車主的想法,客戶希望借助全鏈條數(shù)據(jù)服務(wù),優(yōu)惠活動大廳通過迭代當(dāng)前基礎(chǔ)模型和不斷增加新功能,實現(xiàn)產(chǎn)品智能座艙差異化優(yōu)勢,打造市場領(lǐng)先產(chǎn)品。
其中,客戶需求重點(diǎn)是針對自然對話場景迭代人機(jī)交互模型(特別是提高噪音環(huán)境下的識別),提高智能助手的語音識別、交互理解能力以及常見使用場景下的任務(wù)完成能力(對話場景下的具體任務(wù),例如:訂餐)。
客戶痛點(diǎn)與挑戰(zhàn)
受限于數(shù)據(jù)合規(guī)、語料不足等問題,客戶座艙內(nèi)語音助手模型迭代存在一些掣肘,如:
- 缺乏可用的艙內(nèi)對話數(shù)據(jù):客戶直接使用用戶艙內(nèi)數(shù)據(jù)可能存在合規(guī)風(fēng)險,進(jìn)而導(dǎo)致模型迭代進(jìn)度滯后。
- 缺乏對話數(shù)據(jù)中具體場景、領(lǐng)域?qū)υ挃?shù)據(jù):當(dāng)前市面上,垂直領(lǐng)域?qū)υ挃?shù)據(jù)稀缺,導(dǎo)致模型多輪對話訓(xùn)練難以正常進(jìn)行。
- 個性化控制命令泛化語料匱乏:對于艙內(nèi)人機(jī)交互現(xiàn)有的,以及在使用中用戶新產(chǎn)生的個性化指令與需求,需要有基于真實場景下的個性化定制數(shù)據(jù)供模型訓(xùn)練使用。
客戶希望借助的服務(wù),使模型達(dá)到“無論用戶有什么新的想法、需求,艙內(nèi)智能助手都能夠順利識別用戶意圖并與之產(chǎn)生自然交互”的成熟狀態(tài)。
解決方案
優(yōu)惠活動大廳通過與客戶多次深入溝通,分析客戶的需求,針對客戶痛點(diǎn)提供了成品數(shù)據(jù)集為主、定制化采標(biāo)為輔助的整體解決方案:
- 針對艙內(nèi)人機(jī)交互不自然問題,提供了大量基于模擬真實場景下的自然對話成品數(shù)據(jù)集,包括無噪音及帶噪音模擬艙內(nèi)對話數(shù)據(jù),包含人們自然說話狀態(tài)下可能包含的猶豫、遲疑等發(fā)音特點(diǎn),幫助提升機(jī)器在自然對話場景下的語音識別準(zhǔn)確率。
- 針對智能助手完成功能型任務(wù)需求,提供了各類領(lǐng)域相關(guān)對話數(shù)據(jù),如旅游度假、數(shù)碼產(chǎn)品、休閑娛樂、商業(yè)經(jīng)濟(jì)、家庭生活等領(lǐng)域的豐富多樣的主題語料,幫助提高機(jī)器完成特定領(lǐng)域具體任務(wù)能力。
- 針對命令控制的泛化需求,在提供成品泛化庫同時,提供了定制命令泛化服務(wù)。針對單個功能點(diǎn),最多泛化語料高達(dá)400條,以覆蓋用戶可能使用的每個潛在短語,幫助機(jī)器準(zhǔn)確捕捉用戶意圖。
(為了確保數(shù)據(jù)的高質(zhì)量合規(guī)交付,提供的成品數(shù)據(jù)集及定制采標(biāo)數(shù)據(jù)都經(jīng)由智能標(biāo)注平臺Annotator和文本泛化平臺處理。)
方案中使用的部分成品數(shù)據(jù)集
(點(diǎn)擊可直接跳轉(zhuǎn))
ASR:
MDT-ASR-C001中文普通話朗讀音頻數(shù)據(jù)集–人機(jī)交互、命令控制
MDT-ASR-E056中文普通話對話音頻數(shù)據(jù)集–自由對話
MDT-ASR-G022實驗室級語音數(shù)據(jù)集–自由對話
NLP:
MDT-NLP-B002中文命名實體識別語料庫–中文新聞命名實體
MDT-NLP-G030中文車載命令控制文本語料庫–空調(diào)命令文本母句,含有槽位及槽值
MDT-NLP-G031中文車載命令控制文本語料庫–座椅命令文本為母句數(shù)據(jù),涉及到動詞及句式的泛化,對功能(實體),連詞及介詞充分設(shè)計成槽位及槽值
TTS:
MDT-TTS-D003中文女聲情感TTS數(shù)據(jù)集–親切女生(中文、英文、中英混)
MDT-TTS-G005中文男聲TTS多情感庫–男中音(中文)
客戶反饋
優(yōu)惠活動大廳通過采用整體數(shù)據(jù)解決方案,客戶高效完成了其智能座艙人機(jī)交互系統(tǒng)迭代,智能語音識別模型性能有顯著提升,特別是在自然對話交互中,字識別錯誤率下降了大約30%。對此,客戶表示:”的專業(yè)團(tuán)隊反饋高效,可以在最短時間內(nèi)明確我們的需求并提供相應(yīng)的整體解決方案,對于我們這類時間緊迫的項目有相當(dāng)大的幫助”。