【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

阅读量：

《DC-GNN: Decoupled Graph Neural Networks for Improving and Accelerating Large-Scale E-commerce Retrieval》(WWW’22)

在工业场景中，数百亿节点和数千亿的边直接端到端的GNN-based CTR模型开销太大，文章把整个GNN框架解耦成三阶段：预训练、聚合、CTR。

但实际上文章是把计算开销前移，将图卷积的计算开销转换成了采样子图的计算开销。

图与数据集

用Taobao近7天的记录作为数据集，有三类节点：user、query和item，每个节点都有丰富的节点属性：设备、年龄等。

有三类边：query搜索item、用户浏览item、用户搜索query。

一共9亿节点、100亿条边。

方法

预训练

每个节点 先用RW生成三个该节点的子图，然后在子图上用GNN encoder对节点进行卷积编码，得到节点的embedding，然后两个预训练任务：

Link Prediction

$\mathcal{L}_{l i n k}=\sum_{\left(q, i_{p}\right) \in \mathcal{E}}\left(-\log \sigma\left(f_{s}\left(q, i_{p}\right)\right)-\sum_{k} \log \left(1-\sigma\left(f_{s}\left(q, i_{n}^{k}\right)\right)\right)\right)$

有边连接的是正例，然后采集k个负例，负例用到了难负样本挖掘：
在这里插入图片描述

一种是选择K-hop的节点作为负样本，K可以控制难易程度；一种是在维持图结构不变的情况下，将一个正样本替换成全局采得负样本。

文章认为这两种做法都可以强化GNN更加注意节点的属性学习上，避免GNN过分依赖图结构特征，从而缓解over-smoothing。

Multi-view graph contrastive learning

第二个子图和第三个子图得到的embedding，进行对比学习，同一个节点在两个视图的embedding是正例，不同节点是负例。这里只考虑同一类节点之间计算InfoNCE loss，因此会有三个对比学习loss。

所有的loss加起来是total loss：
$\begin{aligned} \mathcal{L}_{q u e r y}&=\sum_{q_{1} \in v_{q}}-\log \frac{\exp \left(w f_{s}\left(q_{1}, q_{2}\right)\right)}{\sum_{v} \in \exp \left(w f_{s}\left(q_{1}, v_{2}\right)\right)}\\ \mathcal{L}_{u s e r} &=\sum_{\substack{u_{1} \in v_{u}, v_{u} \in \mathcal{V}}}-\log \frac{\exp \left(w f_{s}\left(u_{1}, u_{2}\right)\right)}{\sum_{v} \exp \left(w f_{s}\left(u_{1}, v_{2}\right)\right)} \\ \mathcal{L}_{a d} &=\sum_{\substack{i_{1} \in v_{i}, v_{i} \in \mathcal{V}}}-\log \frac{\exp \left(w f_{s}\left(i_{1}, i_{2}\right)\right)}{\sum_{v} \exp \left(w f_{s}\left(i_{1}, v_{2}\right)\right)}\\ \mathcal{L}_{\text {contra }}&=\mathcal{L}_{\text {query }}+\mathcal{L}_{\text {user }}+\mathcal{L}_{a d} \\ \mathcal{L}_{\text {total }}&=\mathcal{L}_{\text {link }}+\lambda_{1} \mathcal{L}_{\text {contra }}+\lambda_{2}\|\theta\|_{2}^{2} \end{aligned}$

Deep Aggregation

第一阶段每个节点已经有一个embedding $X了，然后再一次采样图 ，对于每个节点，采样三个不同种类子图出来 ，比如target node是user，给这个节点采样三个子图出来，每个子图出了target node之外，分别只包含 user、query、item节点。

然后在已有子图的基础上，和SIGN那篇一样，直接将不同阶卷积的向量拼接起来 $\left[X, A X, A^{2} X, A^{3} X\right]$ 作为模型的输入。但其实这里有误导的地方，应该是 1+3*3=10 个向量拼接起来，因为有三种子图，每个子图有三阶矩阵，所以实际应该是：
$\left[X, A_1X, A_1^{2} X, A_1^{3} X,A_2X, A_2^{2} X, A_2^{3} X,A_3X, A_3^{2} X, A_3^{3} X\right]$

CTR Prediction

图1.3，拼接好的向量分别送入双塔中，进行CTR预估。负样本是曝光未点击样本：
$\mathcal{L}_{C T R}=\sum\left(-\log \sigma\left(f_{s}\left((q, u), i_{c l k}\right)\right)-\sum_{k} \log \left(1-\sigma\left(f_{s}\left((q, u), i_{p v}^{k}\right)\right)\right)\right)$

实验

DC-GNN-Pf和DC-GNN-Pt是指跳过Deep Aggregation，直接用pretrain的输出embedding输入CTR，然后fix或者fine-tuning embedding。

全部评论 (0)

还没有任何评论哟~

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

《DCGNN:DecoupledGraphNeuralNetworksforImprovingandAcceleratingLargeScaleEcommerceRetrieval》WWW’22 在工...

【GCN-CTR】端到端的GNN-CTR：Dual Graph enhanced Embedding Neural Network for CTR Prediction (KDD‘21)

DGENN:DualGraphenhancedEmbeddingNeuralNetworkforCTRPredictionKDD’21 性能简直无敌了，线下这个收益上线岂不是xx亿的收益？代价就是虽然...

关于GNN、GCN、GraphSage（2）--GCN

GCN 我们首先考虑一个多层图卷积网络（GCN），其层间传播规则如下：在这里，是一个激活函数，可以说Relu（）、sigmoid（）等。以一个具体的图G为例：上述公式其实就是一个迭代的过程。但...

A Benchmark on Tricks for Large-scale Image Retrieval

ABenchmarkonTricksforLargescaleImageRetrieval 摘要 1、引言 2.预处理技巧 2.1数据清理和实验 2.2小规模验证集 2.3实验结果 3、学习表示 4、...

【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

早期工作FiGNN 《FiGNN:ModelingFeatureInteractionsviaGraphNeuralNetworksforCTRPrediction》CIKM’19 类似session...

Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba （Application）

期刊：KDD’18 作者：JizheWang,PipeiHuang,ZhiboZhang,BinqiangZhao,HuanZhao,DikLunLee 单位：Alibaba，HongKongUniv...

GNN in KG(五) OAG: Toward Linking Large-scale Heterogeneous Entity Graphs，KDD2019

目录 Introduction PROBLEMDEFINITION THELINKGFRAMEWORK LinkingVenues—SequencebasedEntities LinkingPaper...

GNN,GCN学习整理

GNN GNN定义 GNN是GraphNeuralNetwork的简称，是用于学习包含大量连接的图的联结主义模型。当信息在图的节点之间传播时GNN会捕捉到图的独立性。与标准神经网络不同的是，GNN会保...

三.GNN之GCN，GraphSAGE，GAT

fromtorchgeometric.datasetsimportPlanetoid dataset=Planetoidroot=tmp,name=Cora 构建GCN importtorch imp...

GNN 2021(十二) On the Equivalence of Decoupled Graph Convolution Network and Label Propagation，WWW

解耦的GCN的工作机制还没有被很好地理解，尽管它是有效的。在这篇论文中，从一个新的和基本的角度探讨了半监督节点分类的解耦GCN。我们进行了深入的理论分析，证明解耦后的GCN本质上与两步标签传播相同：首...

是否确定退出登录?

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

《DC-GNN: Decoupled Graph Neural Networks for Improving and Accelerating Large-Scale E-commerce Retrieval》(WWW’22)

图与数据集

方法

预训练

Link Prediction

Multi-view graph contrastive learning

Deep Aggregation

CTR Prediction

实验

全部评论 (0)

相关文章推荐

【GCN-CTR】DC-GNN: Decoupled GNN for Improving and Accelerating Large-Scale E-commerce Retrieval WWW22

【GCN-CTR】端到端的GNN-CTR：Dual Graph enhanced Embedding Neural Network for CTR Prediction (KDD‘21)

关于GNN、GCN、GraphSage（2）--GCN

A Benchmark on Tricks for Large-scale Image Retrieval

【GCN-CTR】早期工作Fi-GNN (CIKM‘19)——懂了，要用Transformer～

Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba （Application）

GNN in KG(五) OAG: Toward Linking Large-scale Heterogeneous Entity Graphs，KDD2019

GNN,GCN学习整理

三.GNN之GCN，GraphSAGE，GAT

GNN 2021(十二) On the Equivalence of Decoupled Graph Convolution Network and Label Propagation，WWW