Advertisement

论文分享 《Mitigating Hidden Confounding Effects for Causal Recommendation》

阅读量:

文章目录

该研究论文题为《降非隐混杂效的因果推断方法及其应用》

复制代码
* 实验
* 总结

《Mitigating Hidden Confounding Effects for Causal Recommendation》

在推荐系统中存在因混淆因素导致的虚假关联是因果推荐的核心关注点。已有研究主要关注于可观察到的混淆因素的情况(其中少部分探讨了不可观测情况但未深入分析),而本文则着重提出了一种方法,在无法测量隐藏混淆因素时如何有效减轻其影响。具体思路是构建了一个名为RCH(隐性confounder removal)的新框架。通过前门准则将要评估的因果效应分解为两个可识别且与潜在混杂因子独立的部分。研究者在这两个实际应用场景——电商产品推荐和微视频推荐——中基于MMGCN网络架构构建了RCH框架,并在其基础上进行了实验验证。

因果图

在这里插入图片描述

I:物品特征。
U:用户特征。

V:潜在的混淆因素。同时影响着物品特征和偏好事件的发生。

L:用户偏好的标识。发生在用户物品交互之后,比如点赞或者购买。

$M: 由{U,I}构成的用户-物品对与偏好标识之间的中间变量集。例如,在购买流程中,点击→添加购物车→购买;在观看完后→点赞。

V \rightarrow M通常是有边的,但是作者在本文中不予考虑。

因果效应计算

最终目标是系统地推导出因果效应P(l|u,do(i)),在未进行混杂因素测量的条件下完成这一目标。本文详细阐述了公式的推导过程的一本书籍

P(l,v,m|u,do(i))=P(m|u,do(i))P(v)P(l|m,v,u)\tag{1}

因为L,V,M的条件独立性,公式(1)成立

\begin{aligned} P(l|u,\operatorname{do}(i))&\stackrel{(a)}{=}\sum_{m}P(m|u,\operatorname{do}(i))\cdot \sum_{v}P(v)\cdot P(l|m,v,u)\\ &\stackrel{(b)}{=}\sum_{m}P(m|u,\operatorname{do}(i))\cdot P(l|u,\operatorname{do}(m)). \end{aligned} \tag{2}

公式(2b)借助后门调整得出。变量P(m|u,do(i))代表I对M的影响程度;变量P(l|u,do(m))则反映M对L的作用大小。由此可见,在无需测量V的前提下,在图示模型中将I \leftarrow V \rightarrow L \leftarrow M这条路径阻断之后,则可得到:

\begin{aligned} \sum_{v}P(v)P(l|m,v,u)& =\sum_v\sum_i P(v|i)P(i)P(l|m,v,u) \\ &= \sum_i\sum_v P(v|i)P(i)P(l|m,v,u,i) \\ &= \sum_i\left(\sum_v P(l|m,v,u,i) P(v|i,m)\right) P(i) \end{aligned}

其中第(a)步到第(d)步分别对应于推导过程中的关键步骤。

公式(3a)成立条件:P(v)=\sum_vP(v|i)P(i)

公式(3b)成立条件:在因果图中给定V,M后,I和L是独立的。P(l|m,v,u) = P(l|m,v,u,i)

公式(3c)成立条件:在因果图中给定I后,M和V是独立的。P(v|i)=P(v|i,m)

公式(3d)成立条件:边际分布的性质决定的。

为此,在计算L的因果效应时,并基于以下两个条件概率进行求解:

P(l|u,do(i))=\sum_mP(m|u,i)\sum_{i'}P(l|i',m)P(i')\tag{4}

HCR框架

在这里插入图片描述

训练阶段

P(m|u,i) = f_{m}\left(u,i\right)
由于M受到U的影响,因此:

P(l|i',m)P(i') = h(u,i,m)=h^1(u,m)*h^2(u,i)\tag{5}

多任务学习:该算法旨在最小化以下两个目标的总和:第一部分用于衡量模型在关系预测任务中的表现(记为R_M),第二部分则用于评估辅助分类器(记为h)在标签预测上的性能(记为R_L)。其中第一项损失由参数f_m决定并加权于数据集D中的每对(u,i,m),第二项损失由参数h决定并加权于数据集D中的四元组(u,i,m,l)。

所有的骨干模型共享嵌入层,以促进跨任务的知识传递。

推理阶段

根据公式4覆盖了M和I的计算开销较大,在此对h(u,i,m)进行了分解为多个函数形式的组合设计

其中S_{u} = \sum_{i'} h^{2}(u, i')在给定u的情况下被视为一个常数项。这是因为该项在排序过程中不受任何影响,因此在推理阶段可以被省略。

实验

三个Research question:
RQ1为对比HCR与其他SOTA的推荐性能。
研究HCR各部分因果效应在整体性能中的作用影响(消融实验分析)。
探讨HCR改进方案在时间效率、稳定性及性能指标方面的优势(主要针对不同模型进行对比分析)。

总结

该文章涉及大量公式和较为复杂的理论推导过程,在深入理解其核心思想方面存在一定困难。从文章中可以看出作者做了大量的工作,在无论是理论研究还是实验部分的内容都非常丰富。总体而言,这篇文章的难度较高(尽管其内容本身并不算复杂)但需要深入理解其原理才能更好地掌握其中的关键点。

全部评论 (0)

还没有任何评论哟~