該數(shù)據(jù)集專為訓(xùn)練更懂口語(yǔ)表達(dá)的AI模型打造,有利于提升日語(yǔ)語(yǔ)音識(shí)別的自然交互能力,覆蓋多場(chǎng)景真實(shí)對(duì)話,由多樣化人群錄制。精準(zhǔn)標(biāo)注音調(diào)核位置及促音、撥音等特殊音節(jié),字準(zhǔn)率高。優(yōu)惠活動(dòng)大廳通過(guò)合理標(biāo)點(diǎn)還原日語(yǔ)獨(dú)有的呼吸停頓節(jié)奏,優(yōu)惠活動(dòng)大廳助力模型理解口語(yǔ)中的省略句式與情感粒子,提升交互自然度。
語(yǔ)種
日語(yǔ)
數(shù)據(jù)風(fēng)格
spontaneous
比特率
16bits
聲道
1
時(shí)長(zhǎng)
10000+小時(shí)
符合ISO/IEC 27001和ISO/IEC 27701:2019標(biāo)準(zhǔn)認(rèn)證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領(lǐng)域的對(duì)話式、朗讀式及自發(fā)式數(shù)據(jù)
人機(jī)協(xié)同高精度標(biāo)注