• 您現在的位置是:首頁 >要聞 > 2020-11-25 08:42:42 來源:

    AI工具在句子中總結冗長的論文

    導讀 學者們有一種巧妙的方法來提醒同事注意冗長的論文,因為他們發現這些論文根本不值得花時間閱讀。他們將此類文檔標記為 tl; dr,時間太長

    學者們有一種巧妙的方法來提醒同事注意冗長的論文,因為他們發現這些論文根本不值得花時間閱讀。他們將此類文檔標記為“ tl; dr”,時間太長,沒有閱讀。這是一種具有420年歷史的莎士比亞的《波洛紐斯(Palonius)》在21世紀的轉折,在《哈姆雷特》(Hamlet)中傳達給國王和王后:他建議,“簡潔是機智的靈魂”。

    西雅圖的艾倫人工智能研究所對此深有感觸,本周推出了一種系統,該系統可以將冗長的計算機科學報告進行極端匯總,以節省審查此類文獻的時間。

    語義學者是一種研究工具,搭載AI和用于科學研究。利用其新的摘要功能,它可以對大量科學研究論文進行調查,并將其簡化為一句話摘要。每月有超過700萬用戶訪問語義學者。

    目前,語義學者數據庫中有1000萬篇計算機科學論文。根據監督數據庫的Dan Weld的說法,其他學科的論文將逐漸添加。

    該系統為研究人員提供了巨大的優勢,這些研究人員迄今不得不依靠掃描大量的書名和通常冗長的摘要,這是在移動設備上特別需要嘗試的任務。經過早期測試,反應一直是積極的。韋爾德說:“人們似乎很喜歡它。”

    這些年來,已經開發了各種自然語言處理程序來匯總文檔。他們通常使用以下兩種方法之一:提取方法著重于選擇代表性文本并在摘要中逐字使用。例如,2018年開發的Paper Digest似乎是在提取關鍵句子,而不是用自己的話來重寫發現。

    另一種方法是抽象的。它使用自然語言生成算法來創建具有原始措辭的摘要。近年來,人工智能自然語言生成的改進使這種方法成為程序員中的首選。

    語義學者以在所有匯總工具中獲得最大壓縮率而著稱。科學論文平均5,000字,語義學者的摘要約為21字。這平均為報告大小的1/238。最接近語義學者的競爭對手將文檔壓縮到報告大小的1/36。

    西雅圖華盛頓大學的信息科學家Jevin West對該新程序進行了測試,他說:“我預計,這種工具將在不久的將來成為學術搜索的標準功能。實際上,鑒于需要,驚訝地花了這么長時間才能在實踐中看到它。”

    他指出,這還不是完美的,“但這絕對是朝正確方向邁出的一步,”他說。

    艾倫研究所的團隊正在免費提供其代碼。他們還建立了一個向所有人開放的示范站點。scitldr.apps.allenai.org/

    目前,僅接受以英文撰寫的論文。但是該程序的作者希望最終能包含其他語言的文檔。

  • 成人app