您現在的位置是:首頁 >要聞 > 2020-11-30 16:22:50 來源:
自然語言生成的認知狀態統計模型
為了使機器人能夠使用各種各樣的設置,它們需要能夠與人類進行無縫通信。因此,近年來,研究人員一直在開發越來越先進的計算模型,該模型可以使機器人處理人類語言并制定適當的響應。
機器應掌握的人類語言的一個重要方面是在句子中使用代詞。根據一種被稱為“ Givenness Hierarchy”(GH)的語言理論,人類根據對對象在聽眾心中的“認知狀態”的隱含假設,選擇要使用的代詞。例如,如果講話者假設他們的目標對象在當前對話中處于“焦點對準”(這是一種認知狀態),則他們可以選擇使用代詞“它”。
科羅拉多礦業大學MIRRORLab的研究人員最近在arXiv上預先發表的一篇論文中提出了兩種認知狀態模型。第一個模型是直接從GH文獻中得知的基于理論規則的有限狀態機模型,而第二個模型是預測不確定性下對象的認知狀態的統計概率模型(認知狀態過濾器)。
“我的顧問Tom Williams博士和他的同伴已經開始使用認知狀態的概念來幫助機器人自然語言理解(NLU),在這種情況下,聽眾必須根據目標的認知狀態/引用形式信息來識別目標對象”,進行這項研究的研究人員之一Poulomi Pal告訴TechXplore。“我們最近論文的主要思想/目的是基于紀律層次結構(GH)的語言理論創建用于認知狀態過濾的計算模型,以達到自然語言生成(NLG)的目的,更具體地說,是提高機器的使用率代詞(例如,它,這個,那個等)。”
Pal和她的同事們提出的第一個模型是有限狀態機(FSM)模型,該模型根據GH文獻列出的規則生成物體的認知狀態。本文介紹的第二個模型是認知狀態過濾器(CSF),它可以從文本數據中自動學習這些規則。然后,研究人員根據通過在線Amazon Mechanical Turk平臺收集的數據訓練和評估了他們的CSF模型。
在他們的CSF模型的實驗設計過程中,研究人員使用了OFAI多模式任務描述語料庫的銀標準英語翻譯的子集,該庫是人與人,人與機器人多模式交互作用的集合。他們發現CSF處理不確定性要比FSM模型更好,因為CSF不遵循預先建立的規則,而是直接從所分析的數據中獲取規則。
帕爾說:“我們的結果表明,腦脊液模型在預測物體認知狀態方面的準確性比理論上的FSM模型稍好。” “與基于規則的理論模型相比,CSF模型在嘗試評估對象的認知狀態時(尤其是在數據較大時)可能是更可取的,因為它可以自動從數據中學習規則。”
帕爾和她的同事設計的CSF模型最終可以通過提高人與機器人在對話中使用代詞的能力來最終幫助增強人與機器人之間的自然語言互動。將來,這些發現可能會激發其他團隊開發類似的機器人應用模型,以及基于其他研究領域的類似技術,例如計算語言學或認知心理學。
帕爾說:“我們相信,開發像CSF這樣的計算模型將有助于促進認知知識的方法對自然語言的產生和理解的發展。” “我的進一步研究計劃包括開發和實施GH信息回指生成模型,該模型考慮了在選擇NLG的不同引用形式時利用CSF模型對物體的認知狀態。”