您現在的位置是:首頁 >要聞 > 2020-12-04 08:19:29 來源:
神經科學家找到一種使對象識別模型表現更好的方法
可以訓練稱為卷積神經網絡的計算機視覺模型來識別與人類幾乎一樣準確的物體。但是,這些模型有一個重大缺陷:圖像的很小變化幾乎不會被人類觀看者察覺,會誘使他們做出嚴重錯誤,例如將貓分類為樹。
麻省理工學院,哈佛大學和IBM的神經科學家團隊開發了一種緩解此漏洞的方法,方法是在這些模型中添加一個新層,該層旨在模擬大腦視覺處理系統的最早階段。在一項新的研究中,他們表明,該層大大提高了模型針對此類錯誤的魯棒性。
麻省理工學院的博士后,一位科學家該研究的主要作者。
卷積神經網絡通常用于人工智能應用中,例如自動駕駛汽車,自動裝配線和醫療診斷。哈佛大學研究生喬爾·達佩羅(Joel Dapello)也是該研究的主要作者,并補充說:“實施我們的新方法可能使這些系統更不容易出錯,更符合人類視覺。”
詹姆士·迪卡洛(James DiCarlo)說:“根據定義,關于大腦視覺系統如何運作的良好科學假設應該使大腦在內部神經模式和非凡的健壯性方面都與大腦相匹配。這項研究表明,獲得這些科學收益直接導致了工程和應用收益。” ,麻省理工學院腦與認知科學系主任,大腦,思維與機器中心和麥戈文腦科學研究所的研究員,以及該研究的高級作者。
這項研究將在本月的NeurIPS會議上進行介紹,它也是由MIT研究生Martin Schrimpf,MIT來訪學生Franziska Geiger和MIT-IBM Watson AI實驗室主任David Cox共同撰寫的。
識別對象是視覺系統的主要功能之一。在短短一秒鐘的時間內,視覺信息就通過腹側視覺流流到大腦下顳葉皮層,在此大腦神經元包含對物體進行分類所需的信息。在腹側流的每個階段,大腦執行不同類型的處理。腹側流的第一個階段V1是大腦中最有特色的部分之一,其中包含對簡單的視覺特征(例如邊緣)做出反應的神經元。