2024-10-052024-10-05 随手记 8 分钟读完 (大约1172个字) 0次访问

GCN

核心思想

Non Euclidean Structure 拓扑图

为什么需要图卷积神经网络？

将 [[CNN]] 扩展到图上，如何在图上实现卷积的各个特性？

对称矩阵，可以进行特征分解
拉普拉斯矩阵只在中心顶点和一阶相连的顶点上有非 0 元素
由于卷积在傅里叶域的计算相对简单，为了在graph上做傅里叶变换，需要找到graph的连续的正交基对应于傅里叶变换的基，因此要使用拉普拉斯矩阵的特征向量。
- 为什么 Laplacian 矩阵的特征向量可以作为[[傅里叶变换]]的基？

如何把卷积推广到 Graph 上

$(f * h)_{G}=U\left(\begin{array}{lll}\hat{h}\left(\lambda_{1}\right) & & \\ & \ddots & \\ & & \hat{h}\left(\lambda_{n}\right)\end{array}\right) U^{T} f$
[[Laplacian matrix]]分解可以写成 $L=U \Lambda U^{T}$

基于空域的卷积构建 Spatial Construction
基于谱域的卷积构建 Spectral Construction
- 第一代 GCN
  - $y_{\text {output }}=\sigma\left(U g_{\theta}(\Lambda) U^{T} x\right)$
    - $g_{\theta}(\Lambda)=\left(\begin{array}{lll}\theta_{1} & & \\ & \ddots & \\ & & \theta_{n}\end{array}\right)$
- Spectral graph theory 借助于图的拉普拉斯矩阵的特征值和特征向量来研究图的性质

第二代 GCN
把 $\hat{h}\left(\lambda_{i}\right)$ 设计成 $\sum_{j=0}^{K} \alpha_{j} \lambda_{l}^{j}$
$y_{\text {output }}=\sigma\left(U g_{\theta}(\Lambda) U^{T} x\right)$
- $g_{\theta}(\Lambda)=\left(\begin{array}{llll}\sum_{j=0}^{K} \alpha_{j} \lambda_{1}^{j} & & \\ & \ddots & \\ & & \sum_{j=0}^{K} \alpha_{j} \lambda_{n}^{j}\end{array}\right) =\sum_{j=0}^{K} \alpha_{j} \Lambda^{j}$
- $U \sum_{j=0}^{K} \alpha_{j} \Lambda^{j} U^{T}=\sum_{j=0}^{K} \alpha_{j} U \Lambda^{j} U^{T}=\sum_{j=0}^{K} \alpha_{j} L^{j}$
最终
- $y_{\text {output }}=\sigma\left(\sum_{j=0}^{K-1} \alpha_{j} L^{j} x\right)$

$H^{(l+1)}=\sigma ( \tilde{D} ^ {-\frac{1}{2}} \tilde{A} \tilde{D} ^ {-\frac{1}{2}} H^{(l)} W^{(l)})$

GCN 缺点

训练时需要整个图的结构信息，因此是 transductive 的(训练阶段与预测阶段都是基于同样的图结构)。无法处理 inductive 任务(动态图问题，训练在子图上进行，测试阶段需要处理未知的顶点)
- [[GraphSAGE]]
不能处理有向图，不容易实现分配不通的学习权重给不通的 neighbor
- 拉普拉斯举证的特征分解需要拉普拉斯矩阵是对称矩阵

[[Ref]]

GCN

Ryen Xiang

2024-10-05

2024-10-05

网络回响