您現在的位置是:首頁 >互聯網 > 2020-11-06 11:36:37 來源:
微軟啟動在線研究中心以共享AI和科學數據集
為了促進科學合作,Microsoft Corp.今天啟動了一個在線中心,該中心將為研究人員提供共享他們作為工作一部分而生成的數據集的場所。
該公司以身作則。在啟動時,Microsoft Research Open Data門戶將包含數十個由其自己的員工作為已發布的研究報告的一部分而產生的數據集。該信息庫涵蓋了從計算機科學到生物學的各個領域。
微軟首席研究員約翰·克魯姆(John Krumm)評論說:“經常有人要求我分享研究數據,而過去所做的公開分享很受歡迎。” “與Azure一起在一個地方對這些數據集進行協調和分類將對內部和外部研究人員都有幫助,使他們易于訪問,鼓勵協作,并提供基于云的便捷訪問方式,以訪問Microsoft Research共享數據。”
Microsoft Research Open Data具有強大的計算機科學傾向,尤其側重于人工智能領域,例如自然語言處理。考慮到該公司的研究部門近年來將大部分工作投入這些領域,這不足為奇。微軟正在大力投資以增強 其AI功能,而Alphabet Inc.等競爭對手也是如此。
新數據中心的專用于其他領域(例如物理學)的部分目前僅包含少量項目。但是隨著微軟努力從其外部吸引研究人員,這種情況可能會隨著時間而改變。添加更多特定領域數據集的另一個強烈動機是,此類信息在AI項目中可能非常有用,主要是在訓練模型方面。
微軟希望該中心將補充現有的現有研究數據存儲庫。 微軟數據科學推廣總監瓦尼·曼達瓦(Vani Mandava)在博客中寫道:“目標是為微軟研究人員和合作者提供一個簡單的平臺,以共享數據集以及相關的研究技術和工具。”
“ Microsoft Research Open Data旨在簡化對這些數據集的訪問,使用基于云的資源促進研究人員之間的協作,并實現研究的可重復性,” Mandava補充說。
為了幫助研究人員使用數據集,該中心提供了與Microsoft Azure云平臺的集成。用戶可以將信息下載到具有流行數據科學和開發工具的預配置虛擬機上。
微軟并不是唯一公開內部AI數據集以推進研究的科技巨頭。字母在這方面也很豐富,對計算機視覺,自然語言處理和地理空間分析等領域做出了貢獻。