副語言相比情感,在對話過程中隨著不同上下文,時刻發生著不同程度的變化,也就往往更為難以描述。為了能夠更好的讓大模型學會人類的副語言信息,晴數智慧全新打造了“副語言信息高質量對話數據集”。該數據集由資深產品專家和語音合成顧問聯手打造,經過精細設計和專業生產流程,,確保標簽體系精準。數據集具備48KHz高采樣率,安靜環境采集,涵蓋不同地區、年齡、性別的人員,實現語音多樣化。采集領域多樣,覆蓋20個領域主題,包括但不限于衣食住行、休閑娛樂、教育培訓、健康醫療等。
語種
中文
數據風格
對話式
音頻格式
PCM
采樣率
48kHz
比特率
16bits
副語言
咳嗽、打哈欠、笑聲、吞咽等近40類
人數
5000
時長
2000h
副語言相比情感,在對話過程中隨著不同上下文,時刻發生著不同程度的變化,也就往往更為難以描述。為了能夠更好的讓大模型學會人類的副語言信息,晴數智慧全新打造了“副語言信息高質量對話數據集”。該數據集由公司的產品資深專家和語音合成資深顧問強強聯合,歷經精心設計與打磨其標簽體系并經過專業數據pipeline生產而成。此數據集具備48KHz高采樣率,安靜環境采集,篩選來自不同地區、年齡、性別人員錄制以確保語音多樣化。采集領域多樣,覆蓋20個領域主題,包括但不限于衣食住行、休閑娛樂、教育培訓、健康醫療等。
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注