• 您現在的位置是:首頁 >要聞 > 2020-12-02 08:29:22 來源:

    訓練AI在照片中生成各種姿勢和顏色的物體和動物

    導讀 大多數的救火車都是紅色的,但是用藍色描繪一個并不難。電腦幾乎沒有創造力。他們對世界的理解通常會從字面上被他們所訓練的數據所著色。如

    大多數的救火車都是紅色的,但是用藍色描繪一個并不難。電腦幾乎沒有創造力。他們對世界的理解通常會從字面上被他們所訓練的數據所著色。如果他們所看到的只是紅色消防車的照片,他們將無法繪制其他任何東西。

    為了給計算機視覺模型一個更完整,更富想象力的世界視圖,研究人員嘗試為它們提供更多不同的圖像。有些人嘗試從奇特的角度和不尋常的位置拍攝物體,以更好地傳達其真實世界的復雜性。其他人則要求模型使用稱為GAN或生成對抗網絡的人工智能形式生成自己的圖片。在這兩種情況下,目的都是為了填補圖像數據集的空白,以更好地反映三維世界,并使面部和對象識別模型的偏向性降低。

    在國際學習表示會議上的一項新研究中,麻省理工學院的研究人員提出了一種創造力測試,以查看GAN可以對給定圖像進行細化處理。他們將模型“引導”到照片的主體中,并要求其在明亮的光線下,在空間中旋轉或以不同的顏色繪制特寫的物體和動物。

    該模型的創建方式有些微妙,有時甚至令人驚訝。事實證明,這些變化密切跟蹤了人類攝影師在鏡頭前構圖時的創造力。這些偏差被烘焙到基礎數據集中,該研究中提出的控制方法旨在使這些限制可見。

    麻省理工學院的研究科學家阿里·賈哈尼安說:“潛伏空間是圖像的DNA所在。” “我們證明,您可以直接進入這個抽象空間,并控制您希望GAN表現出的特性,直到某一點。我們發現GAN的創造力受到其學習圖像的多樣性的限制。” 賈哈尼(Jahanian)被合著者露西·柴(Lucy Chai)博士加入研究。麻省理工學院的學生,高級作者Phillip Isola,Bonnie and Marty(1964)Tenenbaum CD電氣工程和計算機科學助理教授。

    研究人員將他們的方法應用于已經接受ImageNet 1400萬張照片訓練的GAN。然后,他們測量了模型在變換不同類別的動物,物體和場景方面可以走多遠。他們發現,藝術冒險的程度因GAN試圖操縱的主題類型而有很大差異。

    例如,一個上升的熱氣球比旋轉的比薩餅產生更多的醒目的姿勢。縮小波斯貓而不是知更鳥時,情況也是如此,貓離觀察者越遠,融化成一堆毛皮,而鳥幾乎保持不變。他們發現,模特高興地把汽車變成了藍色,將水母變成了紅色,但是它拒絕用標準顏色以外的任何顏色畫金翅雀或救火車。

  • 成人app