您現在的位置是:首頁 >互聯網 > 2021-01-19 11:34:53 來源:
大數據公司努力在負責任的數據使用中扮演角色
Looker Inc.的商業智能軟件可用于在市中心地區更有效地部署教育資源,識別暴力的熱點并查明勞動力中的收入不平等狀況。它也可以用于種族特征,政治手段和確定恐怖襲擊的目標。Looker的工作是選擇嗎?
首席執行官弗蘭克·比恩(Frank Bien)認為,至少在某種程度上是這樣。他正在提倡一個議程,稱其為“善事而不是邪惡的數據”,他愿意劃清界限。Looker不會與任何會使用其軟件來區分受保護的階級或操縱選舉結果的公司開展業務。
該公司還與員工進行持續的對話,以更好地為其軟件定義適當和不適當的用例。比恩在接受采訪時說:“可能會有艱難的決定和銷售,我們可能需要屈服。” “員工想要這種清晰度,我認為我們的首要義務在那里。”
Bien鼓勵大數據業務的同事也這樣做。他說:“我們堅信,數據科學專業人士和行業團體需要定義這個問題。” “技術供應商將就其產品的使用方式做出一些艱難的決定。”
并非只有CEO呼吁大數據公司在數據責任中扮演更積極的角色。在Salesforce.com Inc.與分析師的最新財報電話會議上,首席執行官Marc Benioff呼吁政府對分析公司和工具制造商對私人數據的使用制定更嚴格的法規。他指的是新的《歐洲通用數據隱私條例》,他說:“我們需要在制定類似于GDPR的國家隱私法。”
大數據公司Cloudera Inc.的首席Hadoop架構師,存儲和處理大量數據的重要Hadoop軟件的創建者Doug Cutting多年來一直在敦促他的同時代人,在他稱為“ Pax Data ”的演示文稿中,他提出了更多建議。維權人士對數據使用的立場。
他說,在引起爭議的劍橋Analytica丑聞 和谷歌公司員工最近 抗議該公司向五角大樓出售可用于識別監視視頻中的個人的技術的抗議之后,人們對該話題的興趣重新燃起 。谷歌周四感到被迫發布八點指導方針,其中包括 本周承諾不要在這種情況下武器化使用人工智能的承諾。
人們放棄自己的數據越多,被濫用的可能性就越大。“如果你看大多數科幻小說,收集數據的人就是壞人,”切特說。“我不希望這種反烏托邦式的未來成為現實。”
兩難的角
大多數人可能會同意,自越南戰爭以來,他們的國家并未在政治上出現兩極分化,但大數據為這一方程式注入了一個新的且可能具有致命性的因素。可以使用檢測種族歧視等濫用行為的相同軟件來啟用這些功能。這就使大數據公司陷入了困境:它們是否應在拒絕公眾輿論操縱者和仇恨販子接觸方面發揮積極作用?還是應該將自己視為謙虛而沉默寡言的工具制造商?
如果他們是工具制造商,那么這些工具的功能是否更接近槍支或錘子?
SiliconANGLE聯系了一些最大的大數據軟件提供商以及專門收集和分析數據的組織,以收集意見。毫不奇怪,許多人拒絕接受采訪。在那些愿意記錄在案的人中,除了專利違法的產品以外,目前沒有人制定任何嚴格的政策來規范其產品的使用。但是,幾乎所有人都承認,社會責任已成為內部討論的一個越來越普遍的話題,而且有政治頭腦的員工的壓力促使他們更加仔細地監視其產品的使用。
Gartner Inc.數據和分析小組研究主管Lydia Clougherty-J??ones說:“大數據移動正處于道德十字路口。您如何從道德上利用數據獲取價值-例如提高效率和檢測欺詐–在某種程度上也要注意道德責任?”
走一條線
Neo4j Inc.的經驗說明了這些公司必須走的一條線。該公司的同名圖形數據庫技術使用戶能夠發現表面上不明顯的數據元素之間的關系。這使它成為調查性記者的最愛,他們使用圖形技術探究隱藏的聯系的拜占庭式網絡,這些網絡具有競選融資和洗錢等領域的特征。
Neo4j將其技術捐贈給了國際調查記者協會(International Consortium of Investigative Journalists),用于研究《天堂文件》(Paradise Papers)。《天堂文件》是2017年的一系列報告,介紹了公司和富人利用離岸避稅港避免繳納稅款的方式。它還參與了一個項目,以探討影響2016年大選的因素,并贊助了新聞實習。它還 指派了開發人員關系團隊的一些成員來協助記者將其技術應用于他們的手工藝品。
Neo4j產品副總裁Philip Rathle說:“當我們看到產品被永久使用時,我們都會非常有動力。”
但是,該公司的客戶還包括有爭議的農業化學巨頭孟山都公司(Monsanto Co.),一些未具名的政府機構和用于監視的無人機制造商。Rathle承認:“我們沒有對它們進行太多宣傳。”但該公司認為,其政府關系帶來的好處超過了任何可能被濫用的可能性。
像許多接受采訪的公司一樣,Neo4j由員工決定自己的舒適度,并且不會因選擇退出項目或與冒犯他們的客戶而受到懲罰。拉特爾說:“任何人都不應被迫與一個使他們感到不舒服的組織接觸。”
灰色區域
但是,與大多數同行一樣,Neo4j拒絕制定正式政策。問題不是白人至上主義團體和恐怖組織這樣的明顯案件,而是中間的廣闊灰色地區。Talend SA首席執行官Mike Tuchen表示:“我喜歡這樣一個概念,我們要確保工具能永遠使用,但我不想站在屋頂上,而是說有一種神奇的方法來做到這一點。”
例如,除非有法院裁定特別的安排,否則就不宜采用擺渡服務(重新劃分邊界和選舉區以偏向某個政黨的候選人的做法),這是非法的,但很多人對此表示反感。盡管高管們的政治觀點可能會使他們偏向某些自由派或保守派利益集團,但這并不是與他們不做生意的理由。
Gartner的Clougherty-J??ones說:“適當的定義太模糊了,很難執行。” “數據并不像商標那樣專有,因此創建限制下游使用的合同具有挑戰性。”
不過,Looker的Bien認為,數據責任的責任制過于滑坡,以至于難以理big大數據公司需要回答的難題。他說:“這可能是無所事事的理由。” “我們想遠離一些問題,但這并不意味著我們無事可做。”
目前,非正式政策占主導地位。“我個人使用的測試是,如果我們的客戶審查了任何用例,我們會為他們的所作所為感到驕傲嗎?” MapR Technologies Inc.數據和應用程序高級副總裁Jack Norris說:“我們沒有政策,但這是我們的時代精神。”
而且一些軟件公司對其產品的了解甚少,幾乎不可能監視客戶的行為。例如,Talend通過多個渠道分發其集成軟件,還提供了可免費下載的開源版本。Tuchen說:“在通過渠道銷售產品時,試圖在全球范圍內做出價值判斷是不切實際的。”
數據集成初創公司 Dremio Corp.還根據開放源代碼許可證分發其分析平臺的版本。首席營銷官Kelly Stirman表示:“您可能在您不想與之開展業務的國家/地區擁有用戶,但是在開源環境中,您對這些事情沒有了解。”
另一個極端是諸如Looker和Hortonworks Inc.的公司,它們具有廣泛的專業服務運營,應該允許他們了解如何詳細使用其軟件。旁觀者沒有適當的數據使用的書面政策,但它采用了合規團隊定期進行評估,以確保“使用任何數據是透明的,安全的和相互尊重的,”根據其網站。Hortonworks沒有回應采訪請求。
如果沒有嚴格的指導方針,信任和透明度可能就足夠了。Cuting說:“我一直在鼓勵收集數據的行業建立與客戶的更多信任。” “他們可以通過定期提供審核以證明自己在做自己所說的那樣來做到這一點。”
聘請數據科學家
工具供應商的高管們也將矛頭指向數據分析公司,因為它們是規范數據使用的更合適的人選。例如,IBM公司沒有關于如何使用其廣泛的數據庫和分析工具產品線的政策,但表示希望客戶做正確的事。該公司有關于如何期望其客戶對待個人信息的準則,但最終將決定權交給了客戶。
正如Facebook在Cambridge Analytica違反社交網絡的使用條款時所發現的那樣,說出客戶應該負責任的行為,并檢查以確保他們做的是不同的事情。在迅速發展的專業數據分析服務世界中,基本上沒有規則。
MariaDB Corp.首席執行官Michael Howard說:“沒人知道Palantir在做什么。” Palantir Technologies Inc.是一家秘密公司,為許多政府機構和公司開展復雜的大數據項目。
數據科學家的嚴重短缺迫使許多組織在不了解(或可能不關心)如何使用與承包商共享的數據的情況下,向精品公司尋求機器學習和人工智能專業知識。霍華德稱這些公司為“不受控制的數據雇傭軍。他們不賣槍支。他們是,排和海豹突擊隊的行動,”他說。
可以理解的是,數據分析公司不愿談論此問題,并且與之接觸的六家SiliconANGLE都不會發表講話。但是,Cambridge Analytica案說明了這個問題。該公司通過第三方獲得了Facebook數據的訪問權,然后未經許可將其出售,盡管Facebook已發布禁止這樣做的信息。
公司如 段公司和澤塔互動公司 收集數以億計的消費者的數據,并代表客戶進行定制化分析在產品開發和市場營銷使用。沒有人指責這些公司中的任何一個做錯了事。但是他們運營的領域幾乎沒有規則,兩家公司的隱私政策都將保護他們收集給個人和客戶公司的數據的責任。
留給立法者嗎?
GDPR可能是一個轉折點。該法律對如何收集,使用和維護有關歐盟公民的數據施加了嚴格的規定,并對違反者處以嚴厲的懲罰。澳大利亞已經采用了類似的規定,加拿大正在考慮這些規定。盡管沒有人期望在當前的政治環境中采用類似的法規,但是每一次重大的數據泄露事件對政府采取行動的壓力都在增加。
大數據主管在這是否是一件好事上存在分歧。“ GDPR可能會改變游戲規則,” Looker的Bien說。“例如,關于選舉之類的事情,我們必須更加清楚數據的適當使用和不適當使用。GDPR是一個巨大的機會。”
但是,很少有高管想考慮大規模的政府監管。大多數人寧愿看到金融業自己進行監管,就像 金融業監管局(Financial Industry Regulatory Authority Inc.)為投資專業人士所做的那樣,還是律師協會(American Bar Association)為律師所做的那樣。
Cuting說,自我監管“從長遠來看符合我們的商業利益,因為它將使整個行業蓬勃發展。” “如果消費者拒絕(或政府取締)某些類型的數據收集,那么您將禁用進度。”
在沒有自我施加的規則的情況下,透明性很可能是即時替代,但這并不一定是一件壞事。實際上,IBM在GDPR實施前夕進行的研究發現,合規管理人員對法規持積極態度,認為加強問責制和對數據管理的關注會改善客戶關系。
MapR的Norris表示:“如果個人信任組織,他們更有可能共享其數據。” “信任帶來了做一些有趣的事情的能力。”
有了企業和消費者之間的信任,大數據工具看起來像槍支還是錘子就無關緊要了。最后,兩者都可以打成犁。