• 您現在的位置是:首頁 >要聞 > 2020-12-07 16:01:35 來源:

    一種新的卷積神經網絡模型來檢測Twitter上的濫用和不活躍

    導讀 西北大學,麥吉爾大學和印度理工學院的研究人員最近開發了一種字符級卷積神經網絡(CNN)模型,該模型可以幫助檢測Twitter上的辱罵帖子。發現

    西北大學,麥吉爾大學和印度理工學院的研究人員最近開發了一種字符級卷積神經網絡(CNN)模型,該模型可以幫助檢測Twitter上的辱罵帖子。發現該模型優于幾種基線方法,達到了93.3%的準確度。

    近年來,在線平臺上的辱罵行為呈指數增長,特別是在Twitter上。因此,社交媒體公司正在尋求有效的新方法來識別此行為,以便進行干預并防止其造成嚴重傷害。

    從事這項研究的研究人員之一阿米什·穆克吉(Animesh Mukherjee)對Tech Xplore表示: “推特最初被認為是一個'電子城廣場',現在已經變成一個沼澤地。” “每天都在報道越來越多的網絡侵略,網絡欺凌和不活躍事件,其中許多嚴重影響了用戶。實際上,這是Twitter失去活躍的追隨者群體的主要原因之一。”

    在線內容可以迅速傳播并覆蓋非常廣泛的受眾,因此在線濫用案例經常拖延很長時間,產生嚴重的影響。一個或多個受害者,以及其他敏感的旁觀者,可能最終無數次閱讀了罪犯的話語,然后才從Twitter上消失。這就是為什么社交媒體平臺有效且快速地檢測此內容,及時進行干預以將其刪除的原因。

    穆克吉說:“我們的目標是開發一種機制,該機制可以在不嚴重的推文造成嚴重損害之前盡早自動檢測到這些推文。” “我們觀察到,通常情況下,受害者/目標對象在對某些具名實體表達強烈感情后遭到攻擊。這導致我們提出了利用觀點沖突來檢測不文明推文的中心思想。”

    穆克吉(Mukherjee)和他的同事意識到,濫用職權通常與者和目標對象之間的意見分歧相關,尤其是對知名公眾人物或實體的意見。因此,他們將特定于實體的情感信息整合到了他們的CNN模型中,希望這將改善其檢測濫用內容的性能。

    進行這項研究的另一位研究人員Pawan Goyal說:“ CNN試圖從不文明的推文中自動提取圖案,以區別于其他推文。” “我們還選擇使用字符級嵌入,而不是單詞級嵌入。由于推文通常很小,只包含幾個單詞,并且拼寫形式很多,因此發現字符級模型比單詞更健壯級模型。”

    此字符級別的CNN模型比最佳基線方法的性能高出4.9%,在檢測不文明推文中的準確性達到93.3%。研究人員還進行了事后分析,仔細研究了Twitter上者和受害者的行為方面,希望能更好地理解不活躍事件。

  • 成人app