【博士論文】圖神經網絡表達性:理論、算法與應用

數據派thu 發佈 2024-03-13T21:44:58.016777+00:00

來源:專知本文為論文介紹,建議閱讀5分鐘在機器學習技術不斷加速發展的今天,數據在構建智能模型、模擬現象、預測值、做出決策等方面起著至關重要的作用。在機器學習技術不斷加速發展的今天,數據在構建智能模型、模擬現象、預測值、做出決策等方面起著至關重要的作用。

來源:專知本文為論文介紹,建議閱讀5分鐘在機器學習技術不斷加速發展的今天,數據在構建智能模型、模擬現象、預測值、做出決策等方面起著至關重要的作用。



在機器學習技術不斷加速發展的今天,數據在構建智能模型、模擬現象、預測值、做出決策等方面起著至關重要的作用。在越來越多的應用中,數據以網絡的形式出現。網絡數據固有的圖結構推動了圖表示學習領域的發展。它的作用範圍包括為圖及其組件(即節點和邊)生成有意義的表示。隨著消息傳遞框架在圖上的成功應用,即圖神經網絡,加速了圖表示學習的研究。學習圖上的信息和表達性表示在廣泛的現實世界應用中發揮著關鍵作用,從電信和社會網絡、城市設計、化學和生物學。本文研究了圖神經網絡更具表現力的各個方面,提出了新的方法來提高它們在標準圖學習任務中的性能。本論文的主要分支包括:圖表示的普適性,圖神經網絡感受野的增加,穩定的更深層次圖學習模型的設計,以及標準消息傳遞框架的替代方案。進行了理論和實驗研究,展示了所提出的方法如何成為設計更強大的圖學習模型的有價值和有效的工具。


在論文的第一部分中,我們研究了圖表示質量作為辨別能力的函數,即,我們如何容易地區分非同構的圖。首先,我們證明了標準的消息傳遞方案是不通用的,因為簡單的聚合器無法分離具有歧義的節點(相似的屬性向量和鄰域結構)。基於發現的局限性,我們提出了一個簡單的著色方案,可以提供普遍的表示,理論保證和實驗驗證的性能優勢。其次,超越了標準的消息傳遞範式,我們提出了一種將圖語料庫作為一個整體來處理的方法,而不是檢查圖對。為此,我們學習了每個圖的軟排列矩陣,並將所有圖投影到公共向量空間中,在圖分類任務中實現了穩定的性能。


https://hal.inria.fr/tel-03666690/


在論文的第二部分中,我們主要關注的是圖神經網絡的感受野,即一個節點有多少信息來更新其表示。首先,研究了編碼鄰接信息的標準算子的譜特性,即圖移位算子。本文提出一種新的參數算子族,可以在整個訓練過程中自適應,並為依賴數據的鄰域表示提供一個靈活的框架。這種方法的合併對節點分類和圖分類任務都有很大的影響。研究了如何在節點表示中考慮k跳鄰域信息以輸出更強大的圖神經網絡模型。結果證明,該模型能夠識別結構特性,如連通性和無三角形性。在論文的第三部分,我們解決了長程交互的問題,即位於圖中較遠部分的節點可以相互影響。在這樣的問題中,我們要麼需要設計更深層次的模型,要麼需要重新表述圖中如何定義鄰近度。首先,研究了更深層次的注意力模型設計,以圖注意力為重點;通過引入一種新的歸一化來校準模型的梯度流,該歸一化可實現Lipschitz連續性。其次,提出一種基於局部熵測度的數據增強方法,利用包含結構信息的信息來豐富節點屬性;


關鍵字: