• 您現在的位置是:首頁 >互聯網 > 2020-10-20 11:35:20 來源:

    Facebook在AI推理和機器翻譯方面取得了長足進步

    導讀 Facebook Inc 今天使用其@Scale會議來提供其人工智能研究進展的最新信息。這家社交媒體公司正在開源新的 AI推理平臺,并提供有關機器翻

    Facebook Inc. 今天使用其@Scale會議來提供其人工智能研究進展的最新信息。

    這家社交媒體公司正在開源新的“ AI推理”平臺,并提供有關機器翻譯研究的一些最新信息。

    Facebook應用人工智能研究負責人Srinivas Narayanan(如圖)今天上午在圣何塞會議上說,這是大規模擴展人工智能工作量的一部分,鑒于訓練人工智能模型需要大量數據,這是一項艱巨的任務。 ,加利福尼亞。

    納拉亞南說:“沒有人工智能,今天的Facebook就不會存在。” “它與我們所做的一切緊密結合。” 但是,隨著每天有超過10,000種AI模型做出數萬億的決策,尋找更有效地完成所有這些工作的方法至關重要。他說:“伴隨著如此巨大的增長,隨之而來的是巨大的規模挑戰。”

    AI推理是指能夠從大量結構化和非結構化數據中提取關鍵信息并基于該信息得出邏輯結論的計算機系統。Facebook說,推理模型在許多推薦引擎中使用了AI的“極其重要”的方面,展示了在線購物者可能感興趣的新產品,或者推薦了用戶接下來可能想看的電視節目。

    AI推理模型使用強化學習進行訓練,強化學習是一種使用獎勵和懲罰系統來訓練算法的編程方法。強化學習算法或代理通過與環境交互來學習。代理在正確執行時會收到獎勵,在錯誤執行時會受到處罰。通過這種方式,代理可以通過最大化其獎勵并最小化其懲罰而在無需人工干預的情況下“學習”。

    強化學習的唯一問題是,設置過程非常困難且耗時,幾乎沒有組織擁有以這種方式訓練其AI模型所需的資源。因此,Facebook決定開放其ReAgent平臺的源代碼,以使其更輕松地構建AI推理模型,以克服這些挑戰。

    ReAgent現在可以在GitHub上下載,它帶有預先構建的模型,這些模型已經可以根據所饋送的數據做出決策,并且還可以提供有關這些決策的反饋。此外,還有一個“離線評估器模塊”,可以評估新模型在生產中部署之前的性能,以及一個用于大規模部署模型的服務平臺。

    Facebook代理

    Facebook的AI研究團隊在博客中寫道:“它是用于創建基于AI的推理系統的最全面,模塊化的開源平臺,并且是第一個包含策略評估的策略,該策略結合了離線反饋以改進模型。” “通過使構建實時,大規模決策的模型變得更加容易,ReAgent使研究項目以及生產應用中策略的創建和評估民主化。”

    Facebook說,Facebook已經在內部使用ReAgent來支持其社交媒體平臺做出的許多個性化決定,例如決定向用戶顯示哪些通知。Facebook表示,它通過新文檔使組織更易于使用ReAgent,這些文檔解釋了如何將ReAgent部署到Microsoft Azure等公共云計算服務。

    Facebook研究人員說:“這種擴展的兼容性將使RL在生產中的使用進一步民主化,并擴大AI社區對模型如何提高其制定和評估決策的能力(包括實時)的理解。”

    機器翻譯的進步

    Facebook在機器翻譯方面也取得了一些進步。它的研究人員說,他們已經為教學系統提出了一種新技術,該系統如何將口語轉換成更晦澀的語言,沒有成千上萬的示例可以用作培訓數據。

    機器翻譯是自然語言處理的一種應用程序,它以源語言和目標語言的相應翻譯來訓練大量句子模型。對于涉及大量數據的廣泛使用的語言(例如英語到西班牙語的翻譯),此類模型非常準確。但是,例如在老撾,哈薩克斯坦,海地語,老撾語,奧羅莫語和緬甸語等“資源匱乏的語言”方面,他們的表現就不太好。

    Facebook克服這一問題的新技術涉及將“迭代反向翻譯”和“自我訓練”與嘈雜的頻道解碼相結合,盡管研究對象只有有限的數據,但它仍使Facebook的研究人員能夠創建新的英語到緬甸機器翻譯系統語言。

    反向翻譯是一種訓練方法,它假定目標語言中必須有大量的單語數據,并且源語言(例如英語)和目標語言(例如緬甸語)的句子主題應具有可比性。但是這種方法在資源不足的語言中無效,因為沒有足夠的單語數據。Facebook的新技術提供了解決該問題的方法。

    研究人員寫道:“首先,利用可用的有限并行數據,我們訓練了反向MT系統,該系統將從目標語言轉換為源語言。” “然后,我們使用該系統在目標側翻譯單語數據,從而生成由反向MT系統的反向翻譯和相應的目標句子組成的合成數據集。”

    下一步涉及基于此新創建的合成數據集運行自訓練算法,以將單語數據從源語言轉換為目標語言。這將產生第二個綜合數據集,該綜合數據集由原始單語數據及其相應的機器翻譯中的句子組成。

    “在使用反向翻譯和自我訓練分別生成帶有反向翻譯和正向翻譯句子的合成數據集之后,我們將所有這些數據集結合在一起,并重新訓練了(可能更大的)正向模型和反向模型,” Facebook的研究人員寫道。“由于通過重新訓練提高了這些模型的翻譯質量,因此我們重復使用它們來重新翻譯源和目標單語數據集。”

    星座研究公司(Constellation Research Inc.)分析師Holger Mueller告訴SiliconANGLE,這項新研究表明Facebook處于機器翻譯研究的最前沿。

    Mueller說:“鑒于其在全球社交網絡市場的份額,Facebook認為它需要推動基于AI的翻譯,而不是任何供應商。” “而Facebook正是這樣做的,現在支持非主流語言進行翻譯。”

  • 成人app