MagicData中文手機錄音音頻語料庫包含755小時的中文普通話朗讀語音數據,其中分為訓練集712.09小時、開發集14.84小時和測試集28.08小時。本語料庫的錄制文本覆蓋多樣化的使用場景,包括互動問答、音樂搜索、口語短信信息、家居命令控制等。采集方式為手機錄音,涵蓋多種類型的安卓手機;錄音輸出為PCM格式。1000名來自中國不同口音區域的發言人參與采集。MagicData中文手機錄音音頻語料庫由MagicData有限公司開發,免費發布供非商業使用。
語種
中文
錄音環境
安靜室內
有效時長
755小時
錄音語料
日?谡Z句子
說話人介紹
1000名來自中國不同口音區域的發音人參與采集
PCM
PCM
錄音設備
智能手機
適用領域
語音識別
數據敏感項
無
版權所有者
符合ISO/IEC 27001和ISO/IEC 27701:2019標準認證
音頻、文本、圖像、音視頻多模態數據
涵蓋多領域的對話式、朗讀式及自發式數據
人機協同高精度標注