• 您現在的位置是:首頁 >互聯網 > 2020-11-06 11:37:09 來源:

    Salesforce在自然語言處理方面取得了重大進展

    導讀 就在幾年前,問電話一個問題來在Internet上查找信息幾乎是不可能的,因為計算機并不能很好地理解少數幾個短語。現在,由于機器學習的進步,

    就在幾年前,問電話一個問題來在Internet上查找信息幾乎是不可能的,因為計算機并不能很好地理解少數幾個短語。

    現在,由于機器學習的進步,我們認為Google或Siri都無法很好地回答我們的查詢。但是,這一進展是艱苦的,需要對非常具體的自然語言處理任務進行深入的培訓,例如將文本翻譯成語音,分析情感或理解代詞引用。

    這就是Salesforce.com Inc.研究人員認為他們已經開始解決的問題。今天,他們發布了一篇論文,概述了一種使用單一模型的方法,該模型可以一次處理10個單獨的NLP任務。該論文本質上是一個挑戰,簡稱自然語言十項全能(decathlon)或decaNLP,與“多任務問題回答網絡”或MQAN模型結合使用,可以同時學習所有10個任務。

    Salesforce首席科學家Richard Socher(如圖)在采訪中說:“我們的模型就像NLP的瑞士軍刀。” 換句話說,研究人員和開發人員實質上可以使用一種工具,而不必為每個任務都使用一個工具,因為這些工具需要超定制化模型,而該模型無法用于任何其他任務。

    最終,結果可能是功能更強大的聊天機器人,例如,可以更自然地與人交談。

    索赫(Socher)類似于ImageNet,這是他幫助開發的帶標簽圖像數據庫,被廣泛認為是引發了深度學習的革命,該革命導致了圖像識別方面的突破。 但是,沒有一項任務可以類似地定義自然語言處理,其中包括諸如機器翻譯,自然語言推理,面向目標的對話和代詞解析之類的事情。Socher說:“在NLP中,實際上并沒有一個單一的任務,所有研究人員都認為,如果您在此方面取得進展,它將整體上改善NLP。”

    Salesforce研究人員(包括Bryan McCann,Nitish Shirish Keskar和Caiming Xiong)的方法是將這些任務中的每一個都作為問題解答。Socher解釋說:“問題的答案是如此廣泛-您可以問任何問題-它使您可以用一個模型來完成多個任務。”

    MQAN允許進行所謂的“零鏡頭”學習,這意味著該模型可以處理以前從未見過的或經過培訓可以完成的任務。麥肯說:“您正在將它應用于一項全新的任務,這是以前從未完成的。” “大多數模型對措辭或含義的細微變化都不夠魯棒。是我們的。即使從未見過這樣的事情,它也可以做到。”他補充說,要使它扎根于世,聊天機器人可以使用并非完全已經學到的短語來做得更好,更像是人們如何交流。

    McCann說,Salesforce正在開放該模型的采購,因此“人們可以在我們離開的地方接貨。”

    Salesforce提供了來自著名AI研究人員Yoshua Bengio的觀點,該研究人員是蒙特利爾大學計算機科學與運籌學系教授,他曾與Socher在緊密的機器學習社區中合作。

    他說:“自從大約二十年前我開始從事代表自然語言的詞嵌入工作以來,我的目標是所有自然語言任務都應使用相同的表現形式。” “本文中將所有這些任務都表示為問題解答的想法至關重要,但這還不夠。作者提出了十項自然語言十項全能法,以定義該目標的基準,并介紹了建筑創新,最終使這一夢想成為可能。”

  • 成人app