• 您現在的位置是:首頁 >要聞 > 2020-12-09 08:41:41 來源:

    自動化系統可以重寫Wikipedia文章中的過時句子

    導讀 麻省理工學院研究人員創建的系統可用于自動更新Wikipedia文章中的事實不一致之處,從而減少了人工編輯人員的工作時間和精力。Wikipedia包含

    麻省理工學院研究人員創建的系統可用于自動更新Wikipedia文章中的事實不一致之處,從而減少了人工編輯人員的工作時間和精力。

    Wikipedia包含數百萬條文章,需要不斷進行編輯以反映新信息。這可能涉及文章擴展,重大重寫或更多例行修改,例如更新編號,日期,名稱和位置。目前,全球各地的人們都自愿花時間進行這些編輯。

    在AAAI人工智能大會上發表的一篇論文中,研究人員描述了一種文本生成系統,該系統可精確定位和替換相關Wikipedia句子中的特定信息,同時保持類似于人類書寫和編輯方式的語言。

    這樣的想法是,人們可以在界面中輸入具有更新信息的非結構化句子,而無需擔心樣式或語法。然后,系統將搜索Wikipedia,找到適當的頁面和過時的句子,然后以類似于人的方式將其重寫。研究人員說,將來有可能構建一個完全自動化的系統,該系統可以識別和使用來自網絡的最新信息,從而在相應的Wikipedia文章中生成重寫的句子,以反映更新的信息。

    “維基百科的文章經常需要進行大量更新。自動修改文章的確切部分將是有益的,幾乎不需要人工干預,”博士Darsh Shah說。是計算機科學和人工智能實驗室(CSAIL)的學生,也是主要作者之一。“您無需再花費數百人來修改每篇Wikipedia文章,因為該模型是自動幫助或自動完成的,因此您只需要幾個。這大大提高了效率。”

    存在許多其他可以自動進行Wikipedia編輯的機器人。Shah說,通常,這些工具可以減輕惡意破壞或將一些狹窄定義的信息放入預定義的模板中。他說,研究人員的模型解決了一個更棘手的人工智能問題:給定了一條新的非結構化信息,該模型會以人性化的方式自動修改句子。他說:“其他[機器人]任務更多地是基于規則的,而這是一項需要對兩個句子中相互矛盾的部分進行推理并生成連貫的文本的任務。”

    共同主要作者和CSAIL研究生Tal Schuster說,該系統也可以用于其他文本生成應用程序。在他們的論文中,研究人員還使用它來自動合成流行的事實檢查數據集中的句子,這有助于減少偏見,而無需手動收集其他數據。Schuster說:“通過這種方式,針對數據集進行訓練的自動事實驗證模型的性能得到了提高,例如假新聞檢測。”

    Shah和Schuster與他們的學術顧問Regina Barzilay,三角洲電子工程學和計算機科學教授以及CSAIL教授一起研究了這篇論文。

  • 成人app