
官宣 | MagicHub.io數(shù)據(jù)開源社區(qū)上線啦!Daniel Povey等大咖瘋狂打CALL
發(fā)布時間 : 2021-04-15 閱讀量 : 3208
1969年,Unix 源代碼在 Unix 社區(qū)自由共享,人類歷史上首次發(fā)起開源動作;
1991年,開源系統(tǒng)Linux內(nèi)核問世;
1998年,網(wǎng)景通訊將源代碼開放,“開源”一詞首次出現(xiàn);
2005年, 一個叫Git 的SCM工具出現(xiàn),托管式的Git 代碼倉庫誕生;
……
開源,已經(jīng)扎根在互聯(lián)網(wǎng)基因深處,深刻改變互聯(lián)網(wǎng)發(fā)展模式。
開源的歷史,儼然是一部波瀾壯闊的互聯(lián)網(wǎng)發(fā)展史。
自達特茅斯會議人工智能概念提出以來,人工智能發(fā)展多次起落,隨著技術(shù)的變革,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、5G的發(fā)展,人工智能在人類舞臺正式大展拳腳。
人工智能開啟了人類下一個紀元,開源繼續(xù)扮演著重要角色,用于機器學(xué)習(xí)和AI訓(xùn)練的數(shù)據(jù)開源平臺先后涌現(xiàn),開發(fā)者們繼續(xù)貢獻著人類的智慧,開源、開放、自由和協(xié)作的精神推動人工智能不斷發(fā)展。
政府、公益機構(gòu)和個人將數(shù)據(jù)分享出來,為全球人工智能輸送“燃料”,越來越多公司、大學(xué)、團體和個人也加入開源隊伍,Kaggle、UCI、OpenML、ImageNet、OpenSLR等平臺開源了大量圖像、文本和語音數(shù)據(jù)。數(shù)據(jù)成優(yōu)惠活動大廳為人工智能領(lǐng)域開源精神的核心載體。
在此背景下,MagicHub.io數(shù)據(jù)開源社區(qū)應(yīng)運而生,并于4月15日正式發(fā)布。目前擁有全球領(lǐng)先的對話式AI語音數(shù)據(jù)集,并在業(yè)界首次優(yōu)惠活動大廳通過自主開發(fā)的開源平臺與第三方的各產(chǎn)業(yè)伙伴進行共享,這可能會顛覆目前的產(chǎn)能瓶頸以及用戶的數(shù)據(jù)使用習(xí)慣。
語音識別開源工具Kaldi之父Daniel Povey等數(shù)十位國內(nèi)外開發(fā)者、人工智能領(lǐng)域大咖為MagicHub.io數(shù)據(jù)開源社區(qū)瘋狂打CALL:
視頻:大咖們?yōu)镸agicHub開源社區(qū)打CALL
大量結(jié)構(gòu)化、多領(lǐng)域和多場景數(shù)據(jù)集上傳到MagicHub.io社區(qū),社區(qū)對數(shù)據(jù)集多維度細分,幫助AI開發(fā)者快速找到適合自己模型的數(shù)據(jù)集,從而節(jié)省開發(fā)者大量精力,將時間專注在模型開發(fā)和優(yōu)化上。
MagicHub.io數(shù)據(jù)開源社區(qū)秉持“共享共建、奉獻創(chuàng)新,共同發(fā)展”精神,部分數(shù)據(jù)由上傳,同時鼓勵其他個人和團體在開源社區(qū)上傳高質(zhì)量、可靠的數(shù)據(jù)集,有開源數(shù)據(jù)需求可聯(lián)系我們,讓我們一起連接數(shù)據(jù)生產(chǎn)者與AI開發(fā)者,互相護持,構(gòu)建創(chuàng)新。
圖:MagicHub開源社區(qū)首頁頁面
目前,MagicHub.io數(shù)據(jù)開源社區(qū)首次開源30種用于人工智能訓(xùn)練/測試的數(shù)據(jù)集,包括中文對話數(shù)據(jù)集、中文客服數(shù)據(jù)集、英語對話數(shù)據(jù)集、上海方言對話數(shù)據(jù)集等。開源的數(shù)據(jù)集涵蓋NLP、ASR、TTS數(shù)據(jù)集和LEX發(fā)音詞典等,這些數(shù)據(jù)集按照語言、場景、應(yīng)用領(lǐng)域等不同維度進行分類。
接下來,我們將在MagicHub.io社區(qū)持續(xù)開源高質(zhì)量的數(shù)據(jù)集,并且增加更多板塊,讓MagicHub.io社區(qū)持續(xù)貢獻,讓創(chuàng)新和分享組成一股力量,共同打造一個高質(zhì)量的人工智能數(shù)據(jù)開源社區(qū)。
開源是推動科技創(chuàng)新的一大源頭,開源社區(qū)的打造已上升到國家層面,鼓勵開源社區(qū)發(fā)展,健全知識產(chǎn)權(quán)體系。《“十四五”規(guī)劃和2035年遠景目標綱要》提到,要“支持數(shù)字技術(shù)開源社區(qū)等創(chuàng)新聯(lián)合體發(fā)展,完善開源知識產(chǎn)權(quán)和法律體系,鼓勵企業(yè)開放軟件源代碼、硬件設(shè)計和應(yīng)用服務(wù)。”
人工智能開啟開源的下一個紀元,你我一起參與!
重要事情說三遍:
下載開源數(shù)據(jù)集,請訪問:https://magichub.io
下載開源數(shù)據(jù)集,請訪問:https://magichub.io
下載開源數(shù)據(jù)集,請訪問:https://magichub.io