GNNExplainer

foresta.yang2023-10-102024-04-27

GNNExplainer: Generating Explanations for Graph Neural Networks

1. Contribution 本文贡献

提出第一款通用，模型无关的(model-agnostic)对于GNN模型的解释器GNNEXPLAINER
形式化描述GNNEXPLAINER为最大化互信息的优化任务
抽取重要的子图结构及节点特征子集，作为模型解释。

2. Background 背景信息

对于非图结构的神经网络，解释方法主要有如下两个方向：

1.为整个网络构建简单的代替模型

常为模型无关的(model-agnostic)，在待解释样本点的局部建立可信的估计。

E.g., 线性模型如LIME，规则集合如ANN_DT

2.识别模型计算过程中的重要层面

E.g. 关注特征梯度(feature gradients)等。

对于图神经网络设计解释方法，除去节点特征外，还需要结合考虑图的结构特征。

3. Problem Formulation 问题定义

3.1 GNN回顾

抽象GNN基本操作如下：

给定GNN模型 $\Phi$ , 对于 $l$ 层节点 $v$ 的特征表达求取，共经过如下3步。

与其邻居节点进行信息传递：
聚合邻居节点信息：

$M_{i}^{l}=\operatorname{AGG} ( {m_{i j}^{l} | v_{j} \in \mathcal{N}*{v*{i}}})$

结合自身节点上层表达，生成本层节点表达

3.2 GNNEXPLAINER: Problem formulation

摘要

三段话总结 gnn-explainer 做了什么。

背景是：针对同质图的可解释性操作，和GNN模型结构无关，主要是分析 node feature 和节点信息聚合过程链路对模型预测的影响。模型支持单点解释和群体解释。
模型的输入输出：以节点预测为例，单点解释也就是输入一个node，返回预测该node任务中贡献最大的子图+子图中节点特征，也就是可解释性输出的内容。群体解释就是输入一类节点，同样还是返回可解释性输出的内容。模型优化函数：优化整个 graph 的预测结果和 subgraph 的预测差，找到预测差最大的subgraph，即是解释出来的重要子图。
评估：最终在合成数据集/真实数据集上进行评估，这里的评估方式是通过挖掘出和groundtruth类似的子图结构用于计算准确率。

举个实例，上图这个同质图分类任务，如果预测的人群类别是左图左上的篮球，那么GNN-explainer会抓出对打篮球这个预测结果贡献度最高的红色子图，也就是红色标明的球类运动，诸如排球/足球等；如果预测的人群类别是左图右下的航行，GNN-explainer会抓出对航行这个预测结果贡献度最高的绿色子图，也就是绿色标明的海边运动，诸如皮划艇/沙滩排球等。