
行業(yè)洞察 | 愛(ài)聊天的虛擬人
發(fā)布時(shí)間 : 2022-11-03 閱讀量 : 1268
現(xiàn)如今,越來(lái)越多的年輕人在電商平臺(tái)購(gòu)買“陪聊服務(wù)”,嘗鮮“虛擬陪伴”,向“陪聊師”傾訴交流、吐露心聲。從幾十元的“陪聊盲盒”,到上千元的定制“虛擬戀人”。近年來(lái),“虛擬陪伴”服務(wù)已成為年輕人在網(wǎng)絡(luò)上尋求心靈慰藉、吐露心聲的時(shí)尚自愈!皽厝峥蓯(ài)小甜心”、“霸道獨(dú)裁總裁”,只要付費(fèi)都能找到自己喜歡的“人設(shè)”。
虛擬人發(fā)展的勢(shì)頭如同雨后春筍一般層出不窮。根據(jù)億歐數(shù)據(jù)庫(kù)顯示,截至2022年9月,我國(guó)虛擬數(shù)字人賽道投融資金額已超去年,達(dá)24.9億元。而在2015年,這一數(shù)字僅為0.33億元,年復(fù)合增長(zhǎng)率達(dá)到97.71%。如此巨大的市場(chǎng)份額,到底是什么原因讓虛擬人如此令人著迷?
市場(chǎng)需求
虛擬角色所帶來(lái)的世界是未來(lái)的、無(wú)邊界的、技術(shù)感的藝術(shù)視野。人們可以與虛擬人建立良好的互動(dòng)關(guān)系,與虛擬人之間的愛(ài)戴是相互、平等的,優(yōu)惠活動(dòng)大廳通過(guò)彼此之間的互動(dòng)而產(chǎn)生新的想象。人們?cè)谔摂M角色身上完成了他們作為觀眾與自我之間的不停轉(zhuǎn)換。那么虛擬人強(qiáng)大的交互能力到底是如何實(shí)現(xiàn)的?
交互能力
虛擬人與人類的交互需要優(yōu)惠活動(dòng)大廳通過(guò)文字、語(yǔ)音、視覺(jué)的理解和生成,結(jié)合動(dòng)作識(shí)別和驅(qū)動(dòng)、環(huán)境感知等多種方式,多模態(tài)人機(jī)交互能夠充分模擬人與人之間的交互方式。其中語(yǔ)音識(shí)別和語(yǔ)音合成是虛擬人交互的核心功能之一。語(yǔ)音識(shí)別的簡(jiǎn)單定義是使計(jì)算機(jī)能夠識(shí)別、理解并將人類語(yǔ)音翻譯成文本的技術(shù)。也就是讓計(jì)算機(jī)模仿人的聽(tīng)覺(jué)系統(tǒng),能夠接收理解輸入的語(yǔ)音信號(hào),并輸出對(duì)應(yīng)的文字信號(hào)。虛擬人的語(yǔ)音識(shí)別流程圖如下所示:
虛擬人迷人的聲線則來(lái)自對(duì)聲優(yōu)聲音的合成,語(yǔ)音合成是將人類語(yǔ)音用人工的方式所產(chǎn)生。若是將電腦系統(tǒng)用在語(yǔ)音合成上,則稱為語(yǔ)音合成器,而語(yǔ)音合成器可以用軟/硬體所實(shí)現(xiàn)。文字轉(zhuǎn)語(yǔ)音其流程如下所示:
無(wú)論是虛擬人的語(yǔ)音合成還是語(yǔ)音識(shí)別算法,都需要海量高質(zhì)量精標(biāo)語(yǔ)料庫(kù)來(lái)訓(xùn)練。數(shù)據(jù)的質(zhì)量和數(shù)量往往決定著深度學(xué)習(xí)算法優(yōu)化程度。數(shù)據(jù)量越大標(biāo)注越準(zhǔn)確,訓(xùn)練出來(lái)的虛擬人會(huì)越聰明。與人溝通交互會(huì)更順暢,合成的語(yǔ)音會(huì)更擬人化。
數(shù)據(jù)是一切深度學(xué)習(xí)任務(wù)的基石。 擁有海量經(jīng)由專業(yè)錄音棚錄制的高質(zhì)量數(shù)據(jù)集。涵蓋天津話、東北話、四川話、上海話、廣西話、長(zhǎng)沙話眾多方言,以及英語(yǔ)、葡萄牙語(yǔ)、韓語(yǔ)等多語(yǔ)種TTS數(shù)據(jù)。樣例如下:
中文女聲TTS多情感庫(kù):點(diǎn)擊了解更多
中文男聲TTS多情感庫(kù):點(diǎn)擊了解更多
廣式粵語(yǔ)女聲TTS數(shù)據(jù)集:點(diǎn)擊了解更多