【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

阅读量：

早期工作Fi-GNN

《Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction》CIKM’19

类似session-base RS里的SR-GNN，是GNN最早用在CTR上的模型，所以成了经典baseline。

Motivation

CTR模型的输入由以下几部分组成：用户id、用户特征、用户历史行为、物品id、物品特征。由于模型输入有特征，因此简单的 LR 模型就可以实现CTR任务，但是LR只根据一阶特征进行预测，因此大量的CTR模型都在追求有效的“特征组合”方法，以利用到“高阶特征”。

FM、FFM、Wide&Deep、DCN、xDeepFM等模型都是为了学习高阶特征而设计的，然而作者认为这些特征组合方法是“unstructured combination”的！为了利用特征之间的结构特性，作者利用GNN来建模特征交互。

因此在这篇文章中是把一个特征field当作一个节点（也可以理解为一个特征是一个节点，因为一个field最后只产出一个embedding），构成一个Feature Graph。比如一条样本：用户id、城市、性别、职业，那么Feature Graph就有这四个节点构成，图上的边表示特征交互。

Method

由Fi-GNN的模型图可以看出，需要重点理解的是红框内的模块，其余模块很好理解。

Feature Graph

Feature Graph是个全连通图，每个特征节点都和其他特征节点都有一条边相连（假设共 $m$ 种，文章数据集种分别是23和39），边的权重是由Attention计算出来的。
$w\left(n_{i}, n_{j}\right)=\frac{\exp \left(\operatorname{LeakyRelu}\left(\mathrm{W}_{w}\left[\mathrm{e}_{i} \| \mathrm{e}_{j}\right]\right)\right)}{\sum_{k} \exp \left(\operatorname{LeakyRelu}\left(\mathrm{W}_{w}\left[\mathrm{e}_{i} \| \mathrm{e}_{k}\right]\right)\right)}$

$\mathrm{A}\left[n_{i}, n_{j}\right]=\left\{\begin{array}{l} w\left(n_{i}, n_{j}\right), \text { if } i \neq j \\ 0, \text { else } \end{array}\right.$

所以对于每个样本都有一个邻接矩阵，除了对角线上之外都是有值的。

GNN layer

在GNN模块上也和SR-GNN也很似曾相识：

$\mathbf{h}_{i}^{t}=G R U\left(\mathbf{h}_{i}^{t-1}, \mathbf{a}_{i}^{t}\right)+\mathbf{h}_{i}^{1}$

对于第 $t$ 层，图上节点 $i$ 的特征 $\mathbf{h}_{i}^{t}$ 等于是GRU的输出加上节点的初始embedding $\mathbf{h}_{i}^{1}$ ——> GRU的输入是上层节点的特征 $\mathbf{h}_{i}^{t-1}$ ——> 和节点聚合的特征 $a_i^t$ ——> $a_i^t$ 是根据图结构 $A$ 聚合了上层所有节点的特征得到的 ——> $A$ 是

Prediction layer

用最后层输出作为预测层的输入， $\mathbf{h}_{i}^{p} = \mathbf{h}_{i}^{t}$
$\begin{gathered} \left.\hat{y}_{i}=M L P_{1}\left(\mathbf{h}_{i}^{p}\right)\right) \\ \left.a_{i}=M L P_{2}\left(\mathbf{h}_{i}^{p}\right)\right) \\ \hat{y}=\sum_{i=1}^{m} a_{i} \hat{y}_{i} \end{gathered}$

三点思考

从这篇文章有三点感想

Transformer适合用于CTR

这篇文章的Fi-GNN模型实际上可以看作把单头的Transform中的FeedForward模块换成了GRU：

虽然attention的计算方式不太一样，但模型结构上其实差不多，包装了一个GNN的故事
用Transformer的话还有 Multi-head Attention，岂不是还能实现“并行GNN”。

Transformer其实是个图模型

这篇文章搞了一个图结构是一个全1的邻接矩阵，虽然有些强行硬蹭的嫌疑，但是也给了我们启发，Transformer那不就是可以看作一个图模型了吗，query和key的计算结果是该节点与其余所有节点边的权重，再与value加权和就是在图上“卷积”。

end-to-end的GCN-based CTR模型不是很好办

不像LightGCN等模型，end-to-end的GCN CTR模型并不是很好设计，所以random walk、node2vec等预训练方法为CTR模型提供初始化用的更多一些。

全部评论 (0)

还没有任何评论哟~

【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

早期工作FiGNN 《FiGNN:ModelingFeatureInteractionsviaGraphNeuralNetworksforCTRPrediction》CIKM’19 类似session...

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

《DCGNN:DecoupledGraphNeuralNetworksforImprovingandAcceleratingLargeScaleEcommerceRetrieval》WWW’22 在工...

【GCN-CTR】端到端的GNN-CTR：Dual Graph enhanced Embedding Neural Network for CTR Prediction (KDD‘21)

DGENN:DualGraphenhancedEmbeddingNeuralNetworkforCTRPredictionKDD’21 性能简直无敌了，线下这个收益上线岂不是xx亿的收益？代价就是虽然...

【GCN-RS】ItemKNN+WMF=UltraGCN:(CIKM‘21)

UltraGCN:UltraSimplificationofGraphConvolutionalNetworksforRecommendationCIKM’21华为诺亚方舟 SOTA之一（文章放在草...

关于GNN、GCN、GraphSage（2）--GCN

GCN 我们首先考虑一个多层图卷积网络（GCN），其层间传播规则如下：在这里，是一个激活函数，可以说Relu（）、sigmoid（）等。以一个具体的图G为例：上述公式其实就是一个迭代的过程。但...

GNN,GCN学习整理

GNN GNN定义 GNN是GraphNeuralNetwork的简称，是用于学习包含大量连接的图的联结主义模型。当信息在图的节点之间传播时GNN会捕捉到图的独立性。与标准神经网络不同的是，GNN会保...

三.GNN之GCN，GraphSAGE，GAT

fromtorchgeometric.datasetsimportPlanetoid dataset=Planetoidroot=tmp,name=Cora 构建GCN importtorch imp...

人工神经网络的早期工作

《人工神经网络的早期工作》关键词：人工神经网络，神经网络起源，神经网络发展，神经网络架构，神经网络训练与优化，神经网络应用领域，神经网络未来趋势摘要：本文将回顾人工神经网络的早期工作，从定义、起源...

又一任务被Transformer攻陷！NVIDIA开源HORST，用Transformer解决早期动作识别和动作预期任务...

关注公众号，发现CV技术之美本文分享论文『HigherOrderRecurrentSpaceTimeTransformerforVideoActionPrediction』，由NVIDIA开源《HO...

【GCN-RS】How Powerful is Graph Convolution for Recommendation? (CIKM‘21)

HowPowerfulisGraphConvolutionforRecommendation?CIKM’21 上篇文章认为LightGCN的缺点是oversmoothing，这篇文章认为LightGC...

是否确定退出登录?

【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

早期工作Fi-GNN

Motivation

Method

Feature Graph

GNN layer

Prediction layer

三点思考

Transformer适合用于CTR

Transformer其实是个图模型

end-to-end的GCN-based CTR模型不是很好办

全部评论 (0)

相关文章推荐

【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

【GCN-CTR】端到端的GNN-CTR：Dual Graph enhanced Embedding Neural Network for CTR Prediction (KDD‘21)

【GCN-RS】ItemKNN+WMF=UltraGCN:(CIKM‘21)

关于GNN、GCN、GraphSage（2）--GCN

GNN,GCN学习整理

三.GNN之GCN，GraphSAGE，GAT

人工神经网络的早期工作

又一任务被Transformer攻陷！NVIDIA开源HORST，用Transformer解决早期动作识别和动作预期任务...

【GCN-RS】How Powerful is Graph Convolution for Recommendation? (CIKM‘21)