您現在的位置是:首頁 >要聞 > 2020-12-09 08:41:45 來源:
研究人員設計出減少計算機視覺數據集中偏差的方法
導讀 為了解決人工智能中的偏見問題,普林斯頓大學和斯坦福大學的計算機科學家已經開發出方法來獲取包含人的圖像的更公平的數據集。研究人員提出
為了解決人工智能中的偏見問題,普林斯頓大學和斯坦福大學的計算機科學家已經開發出方法來獲取包含人的圖像的更公平的數據集。研究人員提出了對ImageNet的改進,ImageNet是一個包含1400萬張圖像的數據庫,在過去十年中,它在推進計算機視覺方面發揮了關鍵作用。
ImageNet包含對象,風景以及人物的圖像,可作為培訓數據的來源,供研究人員創建機器學習算法以對圖像進行分類或識別其中的元素。ImageNet規模空前,需要自動圖像收集和眾包圖像注釋。盡管研究團體很少使用數據庫的人員類別,但是ImageNet團隊一直在努力解決偏見和其他有關圖像的擔憂,這些圖像所包含的圖像是ImageNet構造的意外結果。
普林斯頓大學計算機科學助理教授Olga Russakovsky說:“計算機視覺現在真的很好用,這意味著它已在各種環境中遍及整個地方。” “這意味著現在是時候談論它對世界產生什么樣的影響并思考這些公平問題了。”
在一篇新論文中,ImageNet團隊系統地識別了ImageNet的人員類別中的非視覺概念和令人討厭的類別,例如種族和性別特征,并建議將其從數據庫中刪除。研究人員還設計了一種工具,該工具允許用戶指定和檢索按年齡,性別表達或膚色平衡的人的圖像集,其目的是促進更公平地對人的臉部和活動進行圖像分類的算法。研究人員于1月30日在西班牙巴塞羅那舉行的計算機協會關于公平性,問責制和透明度的會議上介紹了他們的工作。
Russakovsky說:“非常需要具有核心技術專長的研究人員和實驗室來進行此類對話。” “鑒于現實,我們需要大規模收集數據,因為這將是最有效,最完善的管道,因此需要通過眾包來完成,我們該如何以更公平的方式做到這一點呢?會陷入這些先驗陷阱嗎?本文的核心信息是關于建設性的解決方案。”