• 您現在的位置是:首頁 >互聯網 > 2020-12-30 14:00:50 來源:

    Neo4j改進了其圖數據庫的機器學習兼容性

    導讀 Graph數據庫開發人員Neo4j Inc 今天推出了適用于Graph Data Science 框架的Neo4j新版本,以增強其機器學習游戲,該框架利用深度學習和

    Graph數據庫開發人員Neo4j Inc.今天推出了適用于Graph Data Science 框架的Neo4j新版本,以增強其機器學習游戲,該框架利用深度學習和圖卷積神經網絡使圖連接的數據更易于主流數據科學算法訪問。

    具體而言,版本1.4添加了圖嵌入,該技術可為圖中的每個數據元素計算周圍網絡的形狀。圖形數據庫的獨特之處在于它們能夠使用節點,關系和鍵值對來表示復雜的關系,這些節點,關系和鍵值對使用唯一的標識符定義鏈接的數據項。可以遍歷這些連接,以找到使用關系表很難或不可能發現的相關性,因為需要大量的連接。

    但是,多維圖關系無法清晰地映射到機器學習數據集中常見的低維向量。圖形嵌入通過對圖形的拓撲和屬性進行采樣以將其復雜性降低到僅用于進一步機器學習所需的重要功能,從而使其成為可能。

    Neo4j Graph數據科學庫的產品經理Alicia Frame表示:“圖形嵌入可以學習圖形的結構,從而提高您對圖形的了解。” “它是從追蹤指針到運行真正快速的查詢的畢業。” 在不降低復雜度的情況下,一個50億節點圖的鄰接矩陣必須具有50億平方的元素。她說:“這將巨型圖提煉成圖中每個節點的計算機表示形式。”

    這些增強功能大大增加了可以對圖形運行的數據科學算法的范圍,超出了4月份引入該庫時所包含的基本集。它們是Neo4j更大目標的一部分,該目標旨在使圖形數據庫超越對原始數據的查詢,從而基于連接來預測結果。

    具體來說,該公司將添加三個新的嵌入選項。首先是Node2Vec,這是 一種流行的圖形嵌入算法,它使用神經網絡來學習節點的連續特征表示,然后可以將其用于下游機器學習任務。

    FastRP(隨機投影)是一種節點嵌入算法,Neo4j表示它以等效的精度和極高的規模比Node2Vec快75,000倍。盡管在功能上與Node2Vec等效,但Frame表示許多數據科學家可能會同時使用兩者。

    她說:“ ??FastRP快如閃電,但需要更多工作來調整嵌入內容,以了解您想要的內容。” “許多客戶將運行Node2Vec,直到獲得對他們有意義的結果,然后轉到FastRP大規模運行它們。”

    GraphSage 是用于使用圖卷積神經網絡對圖進行歸納表示學習的嵌入算法和過程。可以在圖形更新時連續應用。

    結果是“我們正在采用過去需要博士學位的技術。并使它們民主化,這樣任何人都可以下載并擁有圖形預測的功能。”擁有博士學位的Frame說道。“在此之前,我們將使用圖形來存儲數據以及Python中發生的機器學習。我們正在連接各個點。”

  • 成人app