您現在的位置是：首頁 >要聞 > 2020-11-27 16:25:43 來源：

數據挖掘連字標題改善命名實體的識別

導讀數據挖掘和從不同來源提取知識是大數據，大業務。但是，搜索軟件如何處理提到的僅使用其一部分名稱或通常不使用名稱連字符的實體?發表在《

數據挖掘和從不同來源提取知識是大數據，大業務。但是，搜索軟件如何處理提到的僅使用其一部分名稱或通常不使用名稱連字符的實體?發表在《國際智能信息與數據庫系統雜志》上的研究揭示了一種新方法的細節，該方法可改善新聞標題中的命名實體識別和歧義消除。

印度技術學院計算機科學與工程系的Jayendra Barua和Rajdeep Niyogi位于印度北阿坎德邦羅爾市的Roorkee，他們解釋說，他們對當前新聞頭條進行這種分析的方法是基于經過訓練的算法，該算法被教導刪除連字符，并填寫不完整的名稱以消除歧義。

團隊對其新穎方法的評估表明，該方法的工作精度比傳統系統高出約10%，因此可以改善與特定公司，組織，事件，公眾人物以及這些數據挖掘感興趣的其他實體相關的新聞的自動檢索。新聞。該系統與新聞源(例如由定期更新的網站生成的RSS類型的新聞源)配合得很好。來自此類消息來源的標題通常可能比傳統報紙的標題更長，但仍然簡潔，通常只有十個或更少的單詞。這樣，每個單詞在數據挖掘上下文中可能都很重要，因此消除歧義至關重要。

免責聲明：本文由用戶上傳，如有侵權請聯系刪除！

標簽：數據挖掘連字標題

上一篇:是時候我們要了解數字經濟了

下一篇:研究表明效果取決于所使用的平臺

猜你喜歡

定州城墻（關于定州城墻介紹）

定州四方誠信畜牧科技有限公司（關于定州四方誠信畜牧科技有限公司介紹）

定州詠古（關于定州詠古介紹）

定州南城門（關于定州南城門介紹）

定州北疃烈士陵園（關于定州北疃烈士陵園介紹）

定州冠農農業科技有限公司（關于定州冠農農業科技有限公司介紹）

定州八景（關于定州八景介紹）

定州供銷商貿有限公司（關于定州供銷商貿有限公司介紹）

定州佰仕達塑料制品有限公司（關于定州佰仕達塑料制品有限公司介紹）

定州人物志（關于定州人物志介紹）

10分鐘被AI騙走430萬

快手2023年第一季度營收252點2億元

木倉科技宣布駕考智能模擬器發布

定州中山公園（關于定州中山公園介紹）

錨定本源柔韌生長

Meta被歐盟罰款13億美元

最新文章

崔亞君（關于崔亞君簡介）

怎樣進行工程項目合同管理（關于怎樣進行工程項目合同管理介紹）

掠奪傾國色（關于掠奪傾國色簡介）

定州城墻（關于定州城墻介紹）

建筑工程制圖習題集第五版（關于建筑工程制圖習題集第五版介紹）

怎樣進行黨性修養和黨性分析（關于怎樣進行黨性修養和黨性分析介紹）

建筑工程制圖習題集第6版（關于建筑工程制圖習題集第6版介紹）

掠奪你（關于掠奪你簡介）

崔亞軍（關于崔亞軍簡介）

步步驚心玉檀怎么死的（步步驚心簡介）

胡蘿卜須歌詞（歌手簡介）

崔亞允（關于崔亞允簡介）

掠奪之斧（關于掠奪之斧簡介）

怎樣進行黨性修養與黨性分析（關于怎樣進行黨性修養與黨性分析介紹）

建筑工程制圖習題集第3版（關于建筑工程制圖習題集第3版介紹）

什么是渣油（渣油的解釋）

點擊排行

熱門推薦

隨機推薦