MagicData擁有1500小時日語語料庫,本次開源30小時數(shù)據(jù)集作為測試集。本語料庫的錄制文本為日常用語。采集方式為手機(jī)錄音;錄音輸出為PCM格式。37名來自日本不同區(qū)域(如東京、大阪、北海道等)的發(fā)言人參與采集。MagicData日語手機(jī)朗讀數(shù)據(jù)庫(30小時)由MagicData有限公司開發(fā),免費發(fā)布供非商業(yè)使用。 研發(fā)制作了朗讀、面對面對話、電話對話等多場景下的中文、英文、日語、韓語等數(shù)十種語言的語音數(shù)據(jù)庫。該數(shù)據(jù)庫得到了行業(yè)的廣泛認(rèn)可。如您想了解更多愛數(shù)數(shù)據(jù)庫信息,歡迎您聯(lián)系我們。
語種
日語
錄音環(huán)境
安靜室內(nèi)
有效時長
30 小時
錄音語料
日常口語句子
標(biāo)注準(zhǔn)確率
95%
發(fā)音人介紹
37名來自日本不同區(qū)域(如東京、大阪、北海道等)的發(fā)音人參與采集。
適用領(lǐng)域
語音識別
數(shù)據(jù)敏感項
無
版權(quán)所有者
符合ISO/IEC 27001和ISO/IEC 27701:2019標(biāo)準(zhǔn)認(rèn)證
音頻、文本、圖像、音視頻多模態(tài)數(shù)據(jù)
涵蓋多領(lǐng)域的對話式、朗讀式及自發(fā)式數(shù)據(jù)
人機(jī)協(xié)同高精度標(biāo)注