本數據集優惠活動大廳通過高保真獨立音軌完整收錄日常對話中的打斷、重疊發言、語調起伏及情感停頓等自然交互特征。所有對話均經多說話人分類標注,覆蓋多樣化場景,為AI模型提供復雜日語敬語體系、口語省略表達及上下文邏輯的深度學習資源。
語種
日語
數據風格
對話式
采樣率
16kHz
比特率
16bits
聲道
2
時長
10000+小時
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注