晴數(shù)智慧布局對話式AI數(shù)據(jù)集多年,關(guān)注到大模型帶來了大規(guī)模的對話式場景落地在3年前開始規(guī)劃語音翻譯數(shù)據(jù)集產(chǎn)品設(shè)計(jì)。高質(zhì)量的語音翻譯數(shù)據(jù)集成為基礎(chǔ)能力制約的關(guān)鍵。晴數(shù)智慧設(shè)計(jì)生產(chǎn)了各個語言 (包括方言) 的端到端翻譯數(shù)據(jù)集:MagicData-CLAM-MT自然口語對話端到端翻譯數(shù)據(jù)。該數(shù)據(jù)集來自真實(shí)的人類自然對話,對話內(nèi)容自然、豐富、具有個人特點(diǎn)且情感表達(dá)自然,可以使機(jī)器學(xué)習(xí)到人類的自然表達(dá)。
語種
中譯英
數(shù)據(jù)風(fēng)格
對話式&朗讀式
采樣率
16kHz
比特率
16bits
符合ISO/IEC 27001和ISO/IEC 27701:2019標(biāo)準(zhǔn)認(rèn)證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領(lǐng)域的對話式、朗讀式及自發(fā)式數(shù)據(jù)
人機(jī)協(xié)同高精度標(biāo)注