• 您現在的位置是:首頁 >生活 > 2021-04-20 17:50:13 來源:

    Google和OpenAI的新工具讓我們更好地了解人工智能

    導讀 人工智能的世界是什么樣的?幾十年來,研究人員一直對此感到困惑,但近年來,這個問題變得更加緊迫。機器視覺系統正在越來越多的生活領域得

    人工智能的世界是什么樣的?幾十年來,研究人員一直對此感到困惑,但近年來,這個問題變得更加緊迫。機器視覺系統正在越來越多的生活領域得到應用,從醫療保健到自動駕駛汽車,但是通過機器的眼睛“看到” - 理解為什么它將那個人歸類為行人但將其作為路標 -仍然是一個挑戰。我們無法這樣做可能會產生嚴重甚至致命的后果。有人會說,由于涉及自動駕駛汽車的死亡,它已經有了。

    Google和OpenAI的新工具讓我們更好地了解人工智能

    谷歌和非營利實驗室OpenAI的新研究希望通過繪制這些系統用于理解世界的視覺數據來進一步開放人工智能視覺的黑匣子。這種被稱為“ 激活地圖集 ”的方法讓研究人員可以分析各種算法的工作原理,不僅揭示了他們識別的抽象形狀,顏色和圖案,還揭示了他們如何將這些元素結合起來識別特定的物體,動物和場景。

    谷歌的Shan Carter是這項工作的首席研究員,他告訴The Verge,如果先前的研究就像在算法的視覺字母表中顯示單個字母一樣,激活地圖集提供了更接近整個字典的東西,顯示字母是如何組合在一起制作實際字詞的。“因此,在像'鯊魚'這樣的圖像類別中,會有很多激活因素,比如'牙齒'和'水',”卡特說。

    這項工作不一定是一個巨大的突破,但它在更廣泛的研究領域中向前邁出了一步,稱為“特征可視化”。佐治亞理工學院的博士生Ramprasaath Selvaraju沒有參與這項工作,他說這項研究“非常令人著迷的“并結合了許多現有的想法來創造一個新的”非常有用“的工具。

    Selvaraju告訴The Verge,在未來,這樣的工作將有很多用途,幫助我們建立更高效和先進的算法,并通過讓研究人員進入內部來提高他們的安全性和消除偏見。“由于[神經網絡]固有的復雜性,它們缺乏可解釋性,”Selvaraju說。但他表示,未來,當這種網絡經常用于駕駛汽車和引導機器人時,這將是必要的。

    OpenAI的Chris Olah也參與了這個項目,他說:“感覺有點像創造一個顯微鏡。至少,這就是我們所追求的目標。“

    激活神經元

    要了解激活地圖集和其他功能可視化工具的工作原理,首先需要了解一下AI系統如何識別對象。

    實現這一目標的基本方法是使用神經網絡:一種與人類大腦大致相似的計算結構(雖然它在復雜性方面落后了數年)。在每個神經網絡內部是像網狀物一樣連接的人造神經元層。像大腦中的細胞一樣,這些細胞會響應刺激,這一過程稱為激活。重要的是,它們不僅可以開啟或關閉; 它們在光譜上注冊,為每次激活賦予特定值或“重量”。

    要將神經網絡變為有用的東西,您必須提供大量的訓練數據。在視覺算法的情況下,這將意味著數十萬甚至數百萬的圖像,每個圖像都標記有特定的類別。在谷歌和OpenAI的研究人員為這項工作測試的神經網絡的情況下,這些類別是廣泛的:從羊毛到溫莎的所有東西,從安全帶到太空加熱器。

    當它提供這些數據時,神經網絡中的不同神經元會響應每個圖像而亮起。此模式連接到圖像的標簽,這種關聯允許網絡“學習”事物的樣子。一旦經過訓練,您就可以向網絡顯示以前從未見過的圖片,并且神經元將激活,將輸入與特定類別相匹配。恭喜!您剛剛訓練了機器學習視覺算法。

    如果所有這些聽起來都令人不安,那就是因為,在很多方面,它都是如此。像許多機器學習程序一樣,視覺算法本質上只是模式匹配機器。這給了他們一定的優勢(例如,只要你擁有必要的數據和計算能力,他們就可以直接進行訓練)。但它也給了他們某些弱點(就像他們很容易被他們之前從未見過的輸入混淆的事實)。

    由于研究人員在2010年初發現了神經網絡在視覺任務方面的潛力,他們一直在修補自己的力學,試圖弄清楚他們是如何做的。

    早期的一項實驗是DeepDream,這是2015年發布的計算機視覺計劃,將任何圖片變成了自身的幻覺版本。DeepDream的視覺效果肯定是有趣的(在某些方面,它們成為了人工智能的定義美學),但該程序也是一個像算法一樣的早期嘗試。“在某些方面,這一切都始于DeepDream,”奧拉說。

    DeepDream所做的是將圖像調整為盡可能有趣的算法。看起來軟件似乎是在圖像中發現“隱藏”的圖案,但它更像是有人在著色書中涂鴉:用眼睛,莖,螺紋和鼻子填充每一寸,盡可能地激發算法。

    后來的研究采用了同樣的基本方法并對其進行了微調:首先針對網絡中的單個神經元,看看是什么激發了它們,然后是神經元群,然后是網絡不同層中神經元的組合。如果早期的實驗是專注但偶然的,就像Isaac Newton 用鈍針在眼睛里捅自己來理解視力一樣,最近的工作就像Newton用棱鏡分裂一縷光線。它更有針對性。通過繪制神經網絡的每個部分中激活的視覺元素,一次又一次,最終,你得到圖集:它的大腦的視覺索引。

    機器視圖

    但是,激活地圖集實際上向我們展示了算法的內部運作方式?嗯,你可以就在谷歌和OpenAI的例子導航開始在這里建退繞稱為GoogLeNet或InceptionV1一個眾所周知的神經網絡的內部結構。

    滾動,您可以看到網絡的不同部分如何響應不同的概念,以及這些概念如何聚集在一起。(例如,狗只在一個地方,而鳥類在另一個地方。)你還可以看到網絡的不同層代表不同類型的信息。較低級別更抽象,響應基本幾何形狀,而較高級別將這些解析為可識別的概念。

    當你深入研究個別分類時,這真的很有趣。谷歌和OpenAI給出的一個例子是“浮潛”和“潛水員”類別之間的區別。

    在下圖中,您可以看到神經網絡用于識別這些標簽的各種激活。左邊是與“潛水呼吸”密切相關的激活,右邊是與“潛水員”密切相關的激活。中間的激活是在兩個類之間共享,而條紋上的那些是更多差異化。

    一目了然,你可以看出一些明顯的顏色和圖案。在頂部,你看起來像鮮艷的魚的斑點和條紋,而在底部,有看起來像面具的形狀。但右側突出顯示的是一種不尋常的激活 - 一種與機車密切相關的激活。當研究人員發現這一點時,他們感到困惑。為什么這些關于機車的視覺信息對識別水肺潛水員很重要?

    “所以我們測試了它,”卡特說。“我們想,'好吧,如果我們把一輛蒸汽機車的圖片從一個潛水員或一個潛水員那里翻過來?” 它確實如此。“

    該團隊最終找到了原因:這是因為機車的光滑金屬曲線在視覺上類似于潛水員的空氣罐。因此,對于神經網絡來說,這是潛水員和潛水員之間的一個明顯區別。為了節省區分這兩個類別的時間,它只是從其他地方借用了所需的識別視覺數據。

    這種例子令人難以置信地揭示了神經網絡的運作方式。對于懷疑論者,它顯示了這些系統的局限性。他們說,視覺算法可能是有效的,但他們學到的信息實際上與人類如何理解世界無關。這使他們容易受到某些詭計的影響。例如,如果您只將一些精心挑選的像素投射到圖像中,則可能足以使算法對其進行錯誤分類。

    但對于卡特,奧拉和其他類似的人來說,激活地圖集和類似工具所揭示的信息顯示了這些算法的驚人深度和靈活性。例如,Carter指出,為了使算法區分潛水員和潛水員,它還將不同類型的動物與每個類別聯系起來。

    “[動物]發生在深水中,像海龜一樣,被水肺覆蓋,表面上出現的像鳥類一樣,被浮潛所覆蓋,”他說。他指出,這是系統從未指導學習的信息。相反,它只是自己拾起它。“這有點像對世界更深刻的理解。這對我來說真的很令人興奮。“

    奧拉同意。“我發現在高分辨率下透過這些地圖冊看起來幾乎令人敬畏,只看到這些網絡可以代表的巨大空間。”

    他們希望通過開發這樣的工具,他們將有助于推動人工智能的整個領域。通過了解機器視覺系統如何看待世界,理論上我們可以更有效地構建它們并更徹底地檢查它們的準確性。

    “我們現在有一個有限的工具箱,”奧拉說。他說我們可以在系統上拋出測試數據來試圖欺騙他們,但這種方法總是受到我們所知道的錯誤的限制。“但這給了我們 - 如果我們想投入精力 - 這是一種表現未知未知問題的新工具,”他說。“感覺就像每一代這些工具讓我們更接近能夠真正理解這些網絡中正在發生的事情。”

  • 成人app