• 您現在的位置是:首頁 >要聞 > 2020-12-02 17:11:10 來源:

    基于大規模數據集的圖像識別新方法

    導讀 中國科學院深圳先進技術研究院(SIAT)的研究人員提出了一種具有指導性學習和噪聲監控功能的產品圖像識別方法。該研究發表在《計算機視覺與圖

    中國科學院深圳先進技術研究院(SIAT)的研究人員提出了一種具有指導性學習和噪聲監控功能的產品圖像識別方法。該研究發表在《計算機視覺與圖像理解》上。

    該團隊沒有通過費力且費時的圖像捕獲來收集產品圖像,而是引入了一個稱為Product-90的新型大規模數據集。該數據集包含超過90萬個類別的140K圖像,與Clothing1M(旨在在人為監督下從嘈雜數據中學習的大規模公共數據集)相關,但包含更多類別。圖片是從電子商務網站上的評論中收集的。

    為了避免產生不相關的圖像,研究人員進一步開發了一種簡單而有效的指導學習(GL)方法,用于在嘈雜的監督下訓練卷積神經網絡(CNN)。

    他們使用此建議的指導學習方法對Product-90和四個公共數據集(即Food101,Food-101N,Cression1M和合成噪聲CIFAR-10)進行了綜合評估。

    在第一階段,他們在完整的Product-90數據集(沒有干凈的測試集)上訓練了基線CNN模型(教師模型)。在第二階段,他們通過多任務學習在大型噪聲集和小型干凈訓練集上訓練了目標網絡(學生網絡)。

    結果表明,該建議的指導學習方法更有效,更簡單,并且在這些數據集上取得了優于最新方法的性能。

  • 成人app