該數(shù)據(jù)集專為訓(xùn)練更懂口語表達(dá)的AI模型打造,有利于提升英語語音識(shí)別的自然交互能力,重點(diǎn)捕捉自然對(duì)話中的連讀、弱讀及填充詞,覆蓋場(chǎng)景豐富,由多樣化人群錄制,字準(zhǔn)率高。高完整度語句與符合母語習(xí)慣的標(biāo)點(diǎn)標(biāo)注,有效提升模型對(duì)英語韻律節(jié)奏的建模能力,實(shí)現(xiàn)語音精準(zhǔn)識(shí)別。
語種
英語
數(shù)據(jù)風(fēng)格
spontaneous
比特率
16bits
聲道
1
時(shí)長(zhǎng)
20000+小時(shí)
符合ISO/IEC 27001和ISO/IEC 27701:2019標(biāo)準(zhǔn)認(rèn)證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領(lǐng)域的對(duì)話式、朗讀式及自發(fā)式數(shù)據(jù)
人機(jī)協(xié)同高精度標(biāo)注