• 您現在的位置是:首頁 >綜合 > 2020-12-09 08:51:01 來源:

    彌合人機視覺之間的鴻溝

    導讀 假設您從幾英尺遠的地方短暫看過一個從未見過的人。退后幾步,再看一次。你能認出她的臉嗎?當然可以。您可能在想。如果這是真的,那么這意

    假設您從幾英尺遠的地方短暫看過一個從未見過的人。退后幾步,再看一次。你能認出她的臉嗎?“當然可以。”您可能在想。如果這是真的,那么這意味著我們的視覺系統已經看到了一個物體(例如特定面部)的單個圖像,例如,盡管該物體的位置和比例發生了變化,但仍能可靠地識別它。另一方面,我們知道最先進的分類器(例如香草深層網絡)將無法通過此簡單測試。

    為了識別一系列變換下的特定人臉,需要使用在不同條件下的許多人臉示例來訓練神經網絡。換句話說,它們可以通過記憶實現不,但是如果只有一張圖像可用則無法做到這一點。因此,了解人類視覺如何實現這一非凡的成就與旨在改進其現有分類器的工程師相關。對于神經科學家用深度網絡對靈長類動物視覺系統進行建模也很重要。特別是,生物視覺所展現的一鍵式學習的不可能需要與深度網絡相比完全不同的計算策略。

    麻省理工學院博士學位論文 電氣工程和計算機科學專業的候選人Yena Han及其同事在《自然科學報告》上題為“人類視覺中新對象的尺度和平移不”,討論了他們如何更仔細地研究這種現象以創建新的受生物啟發的網絡。

    腦中心研究中心主任Tomaso Poggio說:“與深??度網絡不同,人類可以從很少的例子中學到東西。這是巨大的差異,對視覺系統的工程設計和理解人類視覺的真正工作意義重大。”頭腦與機器(CBMM)和麻省理工學院的尤金·麥克德莫特(Eugene McDermott)腦與認知科學教授。“造成這種差異的一個關鍵原因是靈長類動物視覺系統在縮放,移動和其他變換方面的相對不。奇怪的是,在AI社區中,這一點大多被忽略了,部分原因是心理物理數據遠不及清晰的數據-漢的工作現在已經建立了對人類視覺基本不的可靠測量。”

    為了區分固有計算中的不與經驗和記憶中的不,這項新研究測量了一次學習中不的范圍。通過向不熟悉該語言的人類受試者呈現韓語字母刺激來執行一次學習任務。這些字母最初是在一種特定條件下一次出現的,并在與原始條件不同的比例或位置上進行了測試。第一個實驗結果是-正如您所猜測的那樣,人類僅接觸這些新穎的物體就顯示出顯著的尺度不變識別。第二個結果是位置不變的范圍受到限制,這取決于對象的大小和位置。

    接下來,Han和她的同事們在深度神經網絡中進行了可比的實驗,旨在重現這種人類行為。結果表明,為了解釋人類對物體的不變識別,神經網絡模型應該明確地包含內置的尺度不。此外,通過使模型神經元的感受野越遠離視場中心,它們的視野就越能在網絡中得到更好的復制。該體系結構與常用的神經網絡模型不同,后者使用相同的共享濾鏡以統一的分辨率處理圖像。

    CBMM研究人員和負責人Han表示:“我們的工作提供了對不同視角下對象的大腦表示的新理解。它對AI也有影響,因為結果為深入了解什么是深度神經網絡的良好架構設計提供了新見解。”該研究的作者。

  • 成人app