图神经网络--图嵌入表示学习

无盐薯片

1586人浏览 · 2023-02-20 20:42:46

无盐薯片 · 2023-02-20 20:42:46 发布

图嵌入表示学习

图神经网络

图嵌入表示学习
一、图嵌入简介
二、基本框架（编码器+解码器）
- 2.1编码器
- 2.2解码器
三、基于随机游走的方法
- 3.1随机游走的概念
- 3.2随机游走的步骤
四、Node2Vec
五、矩阵分解

一、图嵌入简介

传统机器学习（特征工程）：抽取D个特征编码成D维向量，再使用机器学习算法进行训练和预测

图表示学习：

不需要特征工程，将各个模态输入转为向量，自动学习特征
将节点映射为d维向量，向量具有低维（向量维度远小于节点数）、连续（每个元素都是实数）、稠密（每个元素都不为0），与下游任务无关

嵌入d维空间：

向量相似度反映节点相似度
嵌入向量包含网络连接信息

二、基本框架（编码器+解码器）

编码器：输入一个节点，输出这个节点的D维向量
解码器：输入这个节点的d维向量，输出节点相似度，向量点乘数值反映节点的相似度（需要人为定义）
优化目标：迭代优化每个节点的d维向量，使得图中相似节点向量数量积大，不相似节点向量数量积小

2.1编码器

最简单的编码器：查表（浅编码器），采用独热编码，Z表示一个矩阵，每一列表示一个节点，行数表示向量的维度
优化Z矩阵的方法：DeepWalk、Node2Vec

2.2解码器

基于节点相似度
目标：对进行优化迭代每个节点的D维向量，使得使得图中相似节点向量数量积大，不相似节点向量数量积小
直接优化嵌入向量，使用随机游走方式，如果两个节点出现在同一个随机游走序列中，就反映了这两个节点是相似的，并与下游任务无关

三、基于随机游走的方法

3.1随机游走的概念

随机游走：可以定义具体的策略，在图中进行游走
图机器学习可以和NLP对应：

图：文章
随机游走序列：句子
节点：单词
DeepWalk：Skip-Gram
Node Embedding：Word Embedding

3.2随机游走的步骤

$P(v\vert z_u)$ 从u节点触发的随机游走序列经过v节点的概率
具体步骤:

采样得到若干随机游走序列，计算条件概率 $P(v\vert z_u)$
迭代优化每个节点的D维，使得序列中共现节点向量数量积大，不共现节点向量数量积小

优点：表示能力、计算便捷、无监督/自监督学习问题

四、Node2Vec

有偏二阶随机游走

通过两个超参数p和q控制随机游走的方向，其中概率 $\dfrac{1}{p}$ 表示退回上一个节点，概率
$\dfrac{1}{q}$
表示走向更远的节点，1表示走向上一个节点距离相等的节点

设置不同的超参数：

p大q小：DFS深度优先（探索远方），应用于同质社群（homophily community）
p小q大：BFS广度优先（探索近邻），应用于节点功能角色（中枢、桥接、边缘）（structural equivalence）

Node2Vec算法：

计算每条边的随机游走概率
以u节点为出发点，长度为l，生成r个随机游走序列
用随机梯度下降优化目标函数

五、矩阵分解

通过邻接矩阵分解，可得：

两个节点之间相连：节点向量的数量积是1，两个节点是相似的
两个节点之间不相连：节点向量的数量积是0，两个节点是不相似的

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

pry-rails源码探秘：Rails控制台增强插件的实现原理

pry-rails是一款为Rails >= 3应用提供Pry控制台支持的增强插件，它通过替换默认的IRB控制台，为开发者带来更强大的交互式编程体验。本文将深入剖析pry-rails的实现原理，帮助开发者理解其工作机制和核心功能。## Railtie：Rails集成的核心pry-rails的核心集成逻辑位于[lib/pry-rails/railtie.rb](https://link.git