上一篇博客提到了在图神经网络中应用比较广泛的GCN（Graph Convolutional Networks），这篇博客就来谈谈GAT(Graph Attention Networks)。

对于Spatial approach，棘手的问题是如何处理graph data中每个顶点不同数量的邻居顶点和实现参数共享。
对于Spectral approach，该方法使用图上的傅里叶变换，将数据变换到频域进行处理之后再使用傅里叶逆变换回到时域，该方法很巧妙，但是受限于图的结构。该方法要求图的拉普拉斯矩阵是一个半正定的对称矩阵，因此Spectral domain的方法并不适合处理有向图和带权图等。

GAT

GAT则另辟蹊径，其引入注意力机制实现了图数据的特征表示（feature representation）。注意力机制可以处理变长的输入，同时通过注意力系数可以更多的关注输入中最相关的部分。

GAT有以下优点：

GAT的操作是高效的
可以应用在有任意度的图节点上
可以应用到归纳学习（Inductive Learning）问题上

GAT 架构

Graph Attention Layer

GAT网络由多层的Graph Attention Layer组成。

对于每一层，输入是节点特征集合：

其中是节点个数，是节点特征的维度。

输出是新的特征集合：

其中是新的节点特征的维度。

类似于CNN卷积层的输入是一个feature map，输出是一个新的feature map。

Attention Coefficient

对于输入的每一个节点特征，首先使用一个可学习的权重矩阵进行线性变换，。该参数对于所有节点是共享的，即每一层仅有一个矩阵。

另外还需要学习一个注意力机制,该机制负责计算各个节点对之间的注意力系数。

上式计算了节点对节点的注意力系数，表示了节点的特征对于节点的重要性。上式表示计算任意节点对之间的注意力系数，是一种global attention机制。对于图结构数据，我们更关注该节点的邻接节点的特征，而不是所有节点。因此我们可以采用一种称为masked attention机制。

，

其中表示节点的邻居节点。

之后使用 softmax 对进行归一化处理。

在GAT模型的实际处理中，是一个向量，，同时再为计算出的注意力系数添加一个激活函数，此处使用的是LeakyReLU函数。此时，注意力系数的公式可以表述为

其中是连接操作，因此连接后的的维度为，而，则的维度为 ,所以最终得到的是一个实数，即注意力系数。

Linear Combination

计算得到的注意力系数被作为节点的邻居节点对于节点的重要性权重参与到计算节点新的特征当中。节点新的特征就等于其所有邻居节点的特征的线性组合，线性组合的系数即为。

新特征的公式化表示为：

这里添加了一个非线性激活函数。

Multi-head Attention

为了学习到更多的特征，可以使用multi-head attention策略，即在每一层学习个权重矩阵，每个权重矩阵都可以从中提取到不同的特征。然后将学习到的个特征连接（concatenation）在一起。multi-head attention类似于CNN网络中的多个卷积核。

其中表示连接操作，、分别表示第个 attention 的归一化注意力系数和权重矩阵。最终的输出是一个维的向量。

特别的，如果Graph Attention Layer是最后一层，则不能使用 concatenation 操作，因为在最后一层我们希望得到的是一个实数（在分类问题中该实数可能表示的是属于某一类的概率，在回归问题中可能表示的是一个预测值），而非一个维的向量。因此最后一层应该使用 average 操作，而不是 concatentation 。

至此，GAT模型的结构介绍就完结啦。

GAT模型源码

Tensorflow实现：GAT
PyTorch实现：pyGAT

Reference

Graph Attention Networks,arxiv

图神经网络之GAT

目录

什么是GAT

GCN

GAT

GAT 架构

Graph Attention Layer

Attention Coefficient

Linear Combination

Multi-head Attention

GAT模型源码

Reference

梅雪殇

图神经网络之GAT

目录

什么是GAT

GCN

GAT

GAT 架构

Graph Attention Layer

Attention Coefficient

Linear Combination

Multi-head Attention

GAT模型源码

Reference

梅雪殇

N皇后问题

Linux Realtek网卡驱动安装

Github 多人协作

TensorBoard食用指南

Ubuntu更换登录界面壁纸

OSTU算法