您現在的位置是:首頁 >互聯網 > 2020-10-28 11:12:33 來源:
人工智能的人員問題專業人士解決數據科學中的道德和偏見
數據分析的黃金時代迎來了兩項發展。一種是龐大的,不斷擴展的可用數據量。另一個是先進的新型機器學習和人工智能技術。
有人可能會認為這兩只狗可以自己比賽到終點。但是,當今的數據科學中還需要另一個要素。沒有它,不正確的輸入和輸出以及普遍的偏見可能會破壞最佳的分析工作。
BrightHive Inc.聯合創始人兼戰略計劃負責人Natalie Evans Harris(如圖)說:“人才是未來數據科學面臨的最大挑戰 。” 分析軟件的消費者可能會輕易忘記這些算法并非自己創造的;人們創造了它們。這些人頭腦中的東西很可能會進入算法。任何可能信任他們做出決定的人都應該對此予以關注。
先進的新型AI和ML軟件降低了企業,政府機構和其他機構的準入門檻。對于他們來說,將數據科學應用于特定的問題從來沒有像現在這樣容易。“但我們還需要認識到,無論人工智能如何獲得出色的表現,仍然需要人類參與其中,因為算法的強大程度僅與開發它們的人一樣強大,”埃文斯·哈里斯(Evans Harris)說。
我們如何確保我們開發強大的,相對公正的算法?根據埃文斯·哈里斯(Evans Harris)的說法,通過讓具有不同經驗和教育程度的各種人員來完成任務。
埃文斯·哈里斯(Evans Harris) 在斯坦福大學的斯坦福女性數據科學活動中與SiliconANGLE Media的移動直播工作室CUBE主持人麗莎·馬丁(Lisa Martin)進行了交談。他們討論了數據科學的人員問題以及可以幫助限制算法偏差的行為。
本周,CUBE在其“每周啟動”功能中聚焦了Natalie Evans Harris和BrightHive。
訓練數據中的魔鬼
準確的數據分析(回答問題或預測結果的那種方法)絕非易事。算法訓練的數據最終將通知算法。從大量可用數據中選擇合適的數據進行分析可能是一個挑戰。
IBM公司研究阿爾瑪登研究中心副總裁兼實驗室主任杰夫·韋爾斯(Jeff Welser)表示:“如果您有非常龐大的數據集,您甚至可能甚至沒有意識到數據在性別或您正在分析的內容上會略有偏見。”圣何塞 在12月告訴SiliconANGLE。“這可能是您對這些特征的訓練過度。”
說一種算法是為了預測普通人群的駕駛行為。如果酗酒者和帶有假肢的人在數據集中被過多代表怎么辦?根據該數據訓練的算法可能沒有最大的預測能力。人們需要問數據問題,以避免這種情況。根據埃文斯·哈里斯(Evans Harris)的說法,處理數據的任何人都必須學習這項技能。
這位企業家以前曾在國家安全局工作,以幫助建立其數據科學計劃。在那里,她發現了熟練的問題提問對數據科學至關重要。它實際上已成為那里的數據科學家的官方課程。
埃文斯·哈里斯(Evans Harris)表示:“我們讓他們每個人都上了一堂問問題的課,這與我們情報分析員上的課一樣。” “因此,歷史和外語專家需要學習如何提出數據問題的方式,我們也需要數據科學家也要學習。”
不同類型的人會問不同的數據問題。從許多不同的角度提出更多問題,可以得出有趣的見解,激發新的分析項目,并審查數據是否存在偏見。
無偏差AI是一種幻想嗎?
根據Gartner Inc.研究副總裁Alexander Linden的說法,絕對無偏差的AI可能是一個幻想。事實上,Gartner預測,到2022年,由于數據,算法或技術的偏差,會有85%的AI項目交付錯誤的結果。負責管理他們的團隊。
“今天,沒有辦法完全消除偏見,”林登說。“但是,我們必須嘗試將其減少到最小。除了諸如多種數據集之類的技術解決方案外,確保與AI合作的團隊的多樣性并讓團隊成員互相評審工作也至關重要。這個簡單的過程可以大大減少選擇和確認偏差。”
其他專家也回應林登的觀點。
人工智能初創公司顧問史蒂夫·阿迪爾( Steve Ardire)對IBM大數據和分析中心說: “大多數人認為算法是客觀的-但在很大程度上,它們是嵌入在代碼中的觀點,其中還包含偏差 。” “我們必須在算法中開發有效的機制,以過濾偏見并將倫理學納入AI中,并能夠在各行之間閱讀以接近常識推理。”
數據科學家希波克拉底誓言
良好的數據實踐超越了精確的算法。關于數據分析和AI中的隱私和道德規范的問題越來越多。諸如歐盟《通用數據保護條例》之類的立法 正在迫使公司對客戶的數據承擔更大的責任。
BrightHive幫助組織建立所謂的數據信任。BrightHive數據信任允許組織網絡安全,負責地和合乎道德地共享數據,進行協作并產生新見解。
BrightHive同時提供數據信任開發和管理。它使信任的個人網絡可以就數據的正確使用進行溝通和協作。數據信任關系的所有成員都參與數據的管理和控制。一個學習社區有助于在成員組織之間發展“數據能力”。數據信任已嵌入了社區開發的數據使用道德原則。
埃文斯·哈里斯(Evans Harris)表示:“我們需要認識到隱私不僅僅是病毒防護,還需要在使用此數據的個人,社區和公司之間建立信任。” “答案是我們仍在尋找的答案。我認為其中很大一部分只是人力資本。”
BrightHive,彭博社(Bloomberg LP)和 民主數據 合作開展了一項名為“道德數據共享社區原則”的計劃。它旨在為數據科學家開發“希波克拉底誓言”。