該數(shù)據(jù)集專(zhuān)為訓(xùn)練更懂口語(yǔ)表達(dá)的AI模型打造,有利于提升西班牙語(yǔ)語(yǔ)音識(shí)別的自然交互能力,覆蓋多場(chǎng)景真實(shí)對(duì)話(huà),由多樣化人群錄制,字準(zhǔn)率高。強(qiáng)化對(duì)連誦、吞音等特性的標(biāo)注,合理標(biāo)點(diǎn)還原西語(yǔ)熱情洋溢的韻律節(jié)奏,高完整度語(yǔ)句優(yōu)惠活動(dòng)大廳助力模型理解復(fù)雜動(dòng)詞變位句式,提升識(shí)別魯棒性。
語(yǔ)種
西班牙語(yǔ)
數(shù)據(jù)風(fēng)格
spontaneous
比特率
16bits
聲道
1
時(shí)長(zhǎng)
5000+小時(shí)
符合ISO/IEC 27001和ISO/IEC 27701:2019標(biāo)準(zhǔn)認(rèn)證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領(lǐng)域的對(duì)話(huà)式、朗讀式及自發(fā)式數(shù)據(jù)
人機(jī)協(xié)同高精度標(biāo)注