該數(shù)據(jù)集專為訓練更懂口語表達的AI模型打造,有利于提升韓語語音識別的自然交互能力,覆蓋多場景真實對話,由多樣化人群錄制,字準率高。嚴格標注收音連音變化現(xiàn)象,文本與發(fā)音高度對齊。完整句子結構展現(xiàn)口語語序特點,標點設計符合韓語情感表達習慣,強化模型對終結詞尾情感意圖的捕捉能力。
語種
韓語
數(shù)據(jù)風格
spontaneous
比特率
16bits
聲道
1
時長
10000+小時
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領域的對話式、朗讀式及自發(fā)式數(shù)據(jù)
人機協(xié)同高精度標注