您現在的位置是:首頁 >要聞 > 2020-12-02 17:11:06 來源:
研究人員訓練技術工具從書面對話中找到關系線索
社會科學家已經確定了十個維度來描述人際關系的本質,但是很少有研究集中在如何通過書面語言表達這些概念以及它們在形成社會互動中的作用。
密歇根大學和諾基亞貝爾實驗室的最新研究已使用眾包和一種技術工具來檢測這些特征如何以日常語言表達以及它們如何影響社會動態。
該團隊使用自然語言處理來預測社會維度,包括人與人之間的關系,例如沖突或支持之一,以及他們所塑造的現實世界社區的類型(例如,富人或被剝奪者)。
“我們首先演示了如何構建模型以測量給定對話中每個維度的水平。然后我們證明了我們的模型在預測對話中存在的維度以及個人之間更高層次的預測方面表現出色”,信息學院的博士生Minje Choi在諾基亞貝爾實驗室實習期間進行了這項研究。
“我們還表明,知識或社會支持等層面的水平可能與社會結果有關,例如他們的財富水平或自殺率是多少。”
該研究的第一作者崔和同事使用眾包技術首先根據以下10個特征識別消息:知識,能力,地位,信任,支持,浪漫,相似性,同一性,樂趣和沖突。
900多個眾包注釋者在Reddit帖子中標記了7,855個句子,在電影界中標記了400個,在Enron電子郵件中標記了436個,表明了這10個特征的存在。
然后,研究人員訓練了一種深度學習分類工具,以查找這些特征及其在所有Reddit和Enron消息以及電影對話中所表現的關系。
他們還使用了來自Tinghy.org的數據,這是一項游戲化的心理測驗,旨在使用10個維度來衡量Twitter用戶對其在線關系的看法。他們研究了1,406個獨特個體之間的1,772個關系。
除了確定消息中的已知維度外,研究人員還發現:
知識是教育水平和收入的最重要的重要預測指標。
支持的存在和不信任是自殺率的兩個最重要的預測指標。
受高等教育程度較高的州顯示出較低的沖突水平,這與研究發現仇恨言論是受較低的教育水平推動的研究一致。
財富與減少的表達方式相關,這些表達方式表明觀點之間的相似性,這是結構和文化上不同的社區的可能標志。
Choi說,團隊的希望是其他人將使用他們的模型來繼續探索關系維度和書面交流之間的聯系。
Choi說:“對于擁有這些對話數據并想要衡量水平或維度變化(例如,社會支持或數據沖突)的研究人員,它可以用作分析工具。” “它可以用來尋找時間變化(如我們在安然的例子中所做的那樣)或社區方面的差異(如我們在美國州級Reddit評論中所做的那樣)。