您現在的位置是:首頁 >生活 > 2021-04-14 09:55:42 來源:
谷歌將通過開源Parsey McParseface永久改變AI
Google已開源其語言解析模型SyntaxNet,調用英文版Parsey McParseface。該系統以令人難以置信的精確度理解人類語言,但注意力集中在其名稱的選擇上,這是在人們投票命名科學研究船Boaty McBoatface之后 - 事實上它是以David Attenborough爵士的名字命名的。
谷歌解析模型的開源意味著更廣泛的社區可以使用該工具來開展人工智能(AI)游戲。這意味著機器可以理解英語新聞標準數據庫中的句子,這是他們接管世界的第一步。“在谷歌,我們花了很多時間思考計算機系統如何閱讀和理解人類語言,以便以智能方式處理它,” 谷歌高級職員研究科學家斯拉夫彼得羅夫解釋道。
“今天,我們很高興通過發布SyntaxNet,與TensorFlow實施的開源神經網絡框架,為自然語言理解系統提供基礎,與更廣泛的社區分享我們的研究成果。”SyntaxNet建立在強大的機器學習算法之上,學習分析語言的語言結構,并且可以解釋每個單詞在給定句子中的功能作用。
但它是如何工作的?系統基本上識別句子的主語和賓語,并通過確定句子中單詞之間的句法關系來理解它們的含義,在依賴句法樹中表示。為了直觀地解釋這一點,這里是單詞組的簡單樹形圖:“Alice看到Bob”。
該結構編碼Alice和Bob是名詞,而saw是動詞。主要動詞'saw'是句子的根,Alice是saw的主語(nsubj),而Bob是它的直接對象(dobj)。這個圖結構幫助Parsey McParseface基本上理解了句子的含義,正確地分析了它。
“我們的發布包括在您自己的數據上訓練新的SyntaxNet模型所需的所有代碼,以及Parsey McParseface,”Petrov補充道。“SyntaxNet將神經網絡應用于模糊問題。從左到右處理輸入句子,當句子中的每個單詞被考慮時,逐漸增加單詞之間的依賴關系。“
根據谷歌的說法,Parsey McParseface在新聞文本上獲得了94%%的準確率,相比之下,人類語言學家的準確度達到了96%%或97%%,但是對于網絡上的隨機句子來說,它的表現并不是很好。準確率為90%%。