讓人工智能發展更快更強!
晴數智慧(英文: )是一家全球領先高質量數據集解決方案公司,優惠活動大廳為人工智能領域研發企業和科研機構提供高質量 AI 優惠活動大廳及專業咨詢服務。晴數智慧在傳統采集標注基礎上,圍繞構建高質量數據,為客戶提供 MLOps 閉環支撐,在數據咨詢,生成,清洗,分類,微調,測試等環節,提供專業的 DaaS(Data as a Service) 解決方案。晴數智慧產品覆蓋智慧出行、智慧金融、智能社交、智能家居、智能終端等五大行業,迄今服務了微軟、高通、英偉達、阿里巴巴、百度、騰訊等國內外近 300 家合作伙伴。
入選北京市 2021 第一批專精特新“小巨人”企業、先后榮獲“國家高新技術企業”、“中關村高新技術企業”、“中關村金種子企業”、“海淀區胚芽企業”等榮譽;擔任中國信息協會理事,同時是中國計算機學會、中國人工智能學會會員單位。獲得“阿里云 2021 年度優秀供應商”。優惠活動大廳通過 CMMI-3、微軟 SSPA 認證,ISO/IEC 27701:2019 標準認證以及 ISO 27001、ISO 9001 標準認證。
創始人兼 CEO
· 中科院聲學所博士,曾任副研究員
· 法國國家實驗室 CNRS 博士后
· 《財富》2021 年中國最具影響力商界女性(未來榜)
· 創業邦 2021 年最值得關注的女性創業者
· 中國科學院杰出科技成就獎
· 科學技術廳科學技術進步獎一等獎
· CCF 語音對話與聽覺專委會委員 / CCF 智能汽車分會執行委員
· CCF 女計算機工作者委員會委員 / CCF 標準工作委員會委員
北京優惠活動大廳科技有限公司品牌升級,中文名稱正式更名“北京晴數智慧科技有限公司”,英文名稱沿用,進一步將業務推向高質量數據集的構建和解決方案領域。
“Training data is technology” .數據即科技,OpenAI的聯合創始人Ilya Sutskever在與知名科技媒體The Verge訪談中提到。ChatGPT自發布以來熱度席卷全球,一周前驚艷亮相的GPT-4更是讓人感嘆我們迎來了AI發展的歷史性時刻。然而我們也困惑,OpenAI為何不開源GPT-4?在我們看來,更多的奧秘或許存在于數據之中......本文是創始人兼CEO張晴晴博士關于數據、大模型與生成式AI的觀點分享。
盡管就目前來看ChatGPT對大部分問答都能基本做到“對答如流”。但是,ChatGPT本質上依舊是預訓練模型驅動的產物,模型的成熟度、完善度對它回答的準確度有著很大的影響。
在過去的一月里,人工智能領域中最火的話題莫過"ChatGPT"。MagicHub數據開源社區已開源部分基于ChatGPT的可擴展的對話數據集。
聯合中科院聲學研究所、上海交通大學和西北工業大學,在Magichub開源社區正式開源180小時中文對話式語音數據集MagicData-RAMC。MagicData-RAMC是一批高質量且標注豐富的訓練數據,可以很好地支持開發者完成語音識別和說話人日志相關的研究。
晴數智慧深耕對話式AI領域多年,構建了累計千萬輪LLM多領域超自然SFT多輪對話文本數據集,覆蓋近20個語種及方言,語料話題分布廣泛,涉及休閑娛樂、衣食住行、教育醫療等近20個領域。
北京優惠活動大廳科技有限公司品牌升級,中文名稱正式更名“北京晴數智慧科技有限公司”,英文名稱沿用,進一步將業務推向高質量數據集的構建和解決方案領域。
“Training data is technology” .數據即科技,OpenAI的聯合創始人Ilya Sutskever在與知名科技媒體The Verge訪談中提到。ChatGPT自發布以來熱度席卷全球,一周前驚艷亮相的GPT-4更是讓人感嘆我們迎來了AI發展的歷史性時刻。然而我們也困惑,OpenAI為何不開源GPT-4?在我們看來,更多的奧秘或許存在于數據之中......本文是創始人兼CEO張晴晴博士關于數據、大模型與生成式AI的觀點分享。
盡管就目前來看ChatGPT對大部分問答都能基本做到“對答如流”。但是,ChatGPT本質上依舊是預訓練模型驅動的產物,模型的成熟度、完善度對它回答的準確度有著很大的影響。
在過去的一月里,人工智能領域中最火的話題莫過"ChatGPT"。MagicHub數據開源社區已開源部分基于ChatGPT的可擴展的對話數據集。
聯合中科院聲學研究所、上海交通大學和西北工業大學,在Magichub開源社區正式開源180小時中文對話式語音數據集MagicData-RAMC。MagicData-RAMC是一批高質量且標注豐富的訓練數據,可以很好地支持開發者完成語音識別和說話人日志相關的研究。
晴數智慧深耕對話式AI領域多年,構建了累計千萬輪LLM多領域超自然SFT多輪對話文本數據集,覆蓋近20個語種及方言,語料話題分布廣泛,涉及休閑娛樂、衣食住行、教育醫療等近20個領域。