您現在的位置是:首頁 >要聞 > 2020-11-13 16:19:17 來源:
新的數據處理模塊使深度神經網絡更智能
北卡羅萊納州立大學的人工智能研究人員通過將特征歸一化和特征關注模塊合并到一個稱為注意力歸一化(AN)的模塊中,提高了深度神經網絡的性能。混合模塊可顯著提高系統的精度,同時使用可忽略的額外計算能力。
“特征規范化是訓練深度神經網絡的關鍵要素,特征關注對于幫助網絡強調從原始數據中學到的哪些特征對于完成給定任務最重要,也同樣重要,”該論文的相應作者吳天福說。他是北卡羅來納州立大學的電氣和計算機工程副教授。“但是大多數情況下,它們已被單獨對待。我們發現將它們結合起來可以使它們更加有效。”
為了測試他們的AN模塊,研究人員將其插入了四種最廣泛使用的神經網絡體系結構:ResNets,DenseNets,MobileNetsV2和AOGNets。然后,他們針對兩個行業標準基準測試了網絡:ImageNet-1000分類基準和MS-COCO 2017對象檢測和實例分割基準。
Wu說:“我們發現在兩個基準測試中,AN都改善了所有四種架構的性能。” “例如,ImageNet-1000的top-1精度提高了0.5%到2.7%。MS-COCO中,包圍盒的平均精度(AP)精度提高了1.8%,語義蒙版的精度提高了2.2%。
Wu說:“ AN的另一個優勢是,它可以促進不同領域之間更好的轉移學習。” “例如,從ImageNet中的圖像分類到MS-COCO中的對象檢測和語義分割。這可以通過對MS-COCO基準進行性能改進來說明,這是通過在MS-COCO中微調ImageNet預訓練的深度神經網絡而獲得的。 COCO,最先進的計算機視覺中的常見工作流程。
“我們已經發布了源代碼,希望我們的AN能夠帶來更好的深度神經網絡集成設計。”
在8月23日至28日在線召開的歐洲計算機視覺會議(ECCV)上,發表了論文“ Attentive Normalization ”。該論文是由最近的博士學位的李錫來合著的。畢業于北卡羅來納州立大學;由博士學位的孫偉 北卡羅來納州立大學的學生。