來源:專知
本文多圖,建議閱讀8分鐘
本文為你介紹目前較新的基於圖的機器學習方法。
[ 導讀 ] 圖是強大的數據結構,可以被用於建模許多真實世界的場景。圖可以建模樣本之間的關係信息,然而,許多之前的機器學習模型忽略了關係信息或沒有很好地方法來建模關係信息。《圖機器學習導論》介紹了目前較新的基於圖的機器學習方法。
圖是強大的數據結構,可以被用於建模許多真實世界的場景。目前,圖在生命科學、金融、社交網絡、用戶行為時序建模、區塊鏈等領域的機器學習應用中都得到了廣泛的引用,並取得了非常好的效果。
圖數據往往會包含大量有價值的關係數據。然而,許多之前的機器學習模型往往只關注每個樣本的特徵,而沒有考慮到樣本之間的關係數據或沒有很好的方法來利用和建模這些關係數據。
圖機器學習為我們提供了利用這些關係數據的方法,它使得我們可以同時考慮圖中每個節點的自身特徵、鄰節點以及鄰節點的特徵,以獲取更好的性能。
圖機器學習的實現一般有兩種方法:
- 將圖轉換為表格,用傳統成熟的機器學習方法實現
- 將圖建模為網絡,用目前較新的基於網絡的機器學習方法實現
DeepWalk、Node2Vec等基於Random Walk的網絡節點表示學習方法,屬於上述的第一種方法,它們利用Random Walk將網絡結構轉換為序列,用成熟的skip-gram方法進行求解。
目前較為流行的圖神經網絡屬於第二種方法,直接在網絡結構上進行機器學習:
《Introduction to graphs and machine learning》(《圖機器學習導論》)為我們介紹了圖機器學習的動機與發展,包括網絡表示學習、圖神經網絡等圖機器學習方法及其在問答、知識圖譜等領域的應用。
教程部分截圖如下所示:
參考連結:
https://conferences.oreilly.com/strata/strata-ny
2019/public/schedule/detail/76557
編輯:於騰凱
— 完 —
關注清華-青島數據科學研究院官方微信公眾平台「THU數據派」及姊妹號「數據派THU」獲取更多講座福利及優質內容。