• 您現在的位置是:首頁 >生活 > 2021-04-09 19:19:20 來源:

    一名研究人員訓練人工智能生成非洲面具

    導讀 人工智能(AI)可以產生令人毛骨悚然的逼真面孔,但部落藝術品呢?這就是人類計算機互動研究員兼卡內基梅隆大學畢業生維克多·迪比亞(Victor

    人工智能(AI)可以產生令人毛骨悚然的逼真面孔,但部落藝術品呢?這就是人類計算機互動研究員兼卡內基梅隆大學畢業生維克多·迪比亞(Victor Dibia)試圖用非洲面具數據集培訓的人工智能系統回答的問題。

    正如Dibia在一篇博客文章中所解釋的那樣,這項 工作的靈感來自于去年9月在南非斯泰倫博斯大學舉辦的2018年深度學習Indaba之旅。與會者可以使用第二代Tensor Processing Units(TPU) - 谷歌設計的芯片專門用于快速培訓或推斷AI模型--Dibia用于培訓。

    一名研究人員訓練人工智能生成非洲面具

    他利用谷歌的TensorFlow機器學習框架來獲得一個生成性對抗網絡(GAN) - 一個由兩部分組成的神經網絡,由 生成樣本和鑒別器的生成器組成, 這些生成樣本和 鑒別器試圖區分生成的樣本和真實樣本 - 在熱塑性聚氨酯。具體來說,他選擇了一個深度卷積GAN或DCGAN。

    GAN具有圖像生成和處理的訣竅。例如,Alphabet子公司DeepMind的數據科學家最近要求GAN生成令人信服的漢堡,狗和蝴蝶照片 ,愛丁堡大學感知研究所和天文學研究所的研究人員使用GAN創建完整的人造星系圖像。星團,星云和其他星際特征。

    并不是他們和其他人工智能架構第一次被用來創作藝術品。他們創作了令人難忘的(如果不是完全連貫的) 假日曲調 和書面 歌詞 ; 制作人性化的畫作 ; 并列舉了煙花的名稱,僅舉幾例。

    為了“教導”DCGAN如何創建新的面具設計,Dibia采購了一套手動策劃的圖像 - 總共9,300個 - 描繪了非洲面具。在訓練之前,他將每個圖像調整大小并裁剪,然后再將它們轉換為TFRecords,這是一種存儲二進制記錄序列的格式。

    對兩個版本的DCGAN模型進行了訓練,分別生成64×64像素和128×128像素的圖像。

    在隨后的實驗中,與第二個系統相比,生成64×64像素圖片的模型提供了“更好的多樣性”,而128×128像素的圖像具有更高的質量。但是后者遭遇了模式崩潰 - 一個失敗的情況,即GAN的發電機開始生產品種極少的樣品。(Dibia將其歸結為數據集“不足以訓練這么大的模型。”)

    兩個AI模型中更成功的是設法提出了具有側向方向,頭發或“毛發狀突起”或長方形特征的新型面具。

    “我們的目標不是生成一個完美逼真的面具......而是更多地觀察由此產生的GAN中編碼的任何創意或藝術元素,”Dibia寫道。

    “在這種情況下,雖然一些生成的圖像不是完整的面具,但它們擅長捕捉非洲藝術的 紋理或 感覺,”Dibia寫道。“例如,我展示了一位同事,他們提到生成的圖像具有'部落感覺'。”

    他留待未來的工作擴展非洲面具數據集,使用條件化GAN進行實驗,以及其他機器學習架構,以實現逼真和更高分辨率的圖像生成。

  • 成人app