KGNN:基于知识图谱的图神经网络预测药物与药物相互作用
点击蓝字

关注我们
AI TIME欢迎每一位AI爱好者的加入!
药物间相互作用(DDI)预测作为药理学与临床实践中的核心议题,在临床试验阶段对潜在的DDI识别对于患者福祉及社会安全均具有重要意义。现有研究主要依赖于基于人工智能的计算模型,并倾向于整合多种数据源并结合先进图嵌入方法以实现目标;然而研究者鲜有关注药物与其他实体(如靶标与基因等)之间的潜在关联性;此外,在知识图谱领域也进行了相关研究
针对现有方法的不足,在本研究中我们提出了一个创新性的解决方案。该方案旨在解决药物相互作用(DDI)预测问题,并通过构建一个基于知识图谱的知识密集型框架——即基于知识图谱的图神经网络(KGNN)。该框架能够通过在知识图谱中挖掘实体间的关联关系从而有效提取药物及其潜在邻域信息。为了从知识图谱中提取高阶拓扑信息和语义关联我们对每个实体的邻域进行了深入学习分析,并将其作为它们的局部感知域。随后我们将这些区域内的特征差异与当前实体表示之间的差异进行融合处理以实现多阶段感知能力的发展最终能够自然扩展出多阶段感知区域以建模复杂的高阶拓扑关系并捕获潜在存在的长距离药物相关性特征。本次分享会我们非常荣幸地邀请了来自湖南大学的知识分子林轩博士为我们分享这一研究成果

林轩是一位在读博士期间便已获得湖南大学计算机科学与技术专业博士学位的学生,在伊利诺伊大学芝加哥分校计算机学院攻读博士学位期间其指导老师为Philip S.Yu教授。他主要从事机器学习图神经网络以及药物重定位等相关领域的研究工作并已在多个国际顶级会议与期刊上发表高水平论文共计7篇其中包括IJCAI AAAI ECAI Briefings in Bioinformatics等知名学术期刊与会议。此外他还担任了IJCAI AAAI Briefings in Bioinformatics Neurocomputing等多个重要会议与期刊的审稿人

一、背景和动机
药物间的相互作用(DDI)称为同时或按顺序服用两种及以上药物时所发生的药效学变化及其伴随效应。例如,在日常生活中某人因睡眠欠佳而服用安神药等镇静剂时可能出现过敏症状如皮疹等治疗过敏的相关症状则需配合抗组胺类药物使用二者若混用可能导致中枢神经系统的抑制效果减弱如果从事驾驶车辆或机械操作等需要高度集中注意力的工作岗位一旦发生突发情况就可能因为无法及时反应而带来难以预料的安全风险因此通过提前识别潜在的药物相互作用(DDI)能够有效规避此类事件的发生

图1 药物间相互作用
对现有DDI预测方法进行归纳总结后发现主要可分为两大类一类基于分子特征学习另一类则建立在基于网络的学习框架上前者关注药物分子的特征提取后者则着重于分析药物间的相互作用网络结构研究者们在这一领域进行了大量探索并提出了多种创新性的解决方案
其中一类基于分子特征学习主要聚焦于从药物分子本身的性质中提取关键信息这类方法都建立在同一假设基础上即其嵌入表征相近的药物间倾向于呈现出相似的DDI交互关系如图2右侧展示所示若两种化合物具有类似的分子结构则它们所学到的特征向量也应具有较高的相似度值从而能够推断出潜在存在的相互作用关系
在此过程中研究人员探索了多种不同的特征提取方式其中一些采用了类似于一维SMILES编码方式所体现的序列特性如传统基于化学计量学的方法如Molecular Descriptors以及基于化学指纹技术(ECFP)的方法此外还有采用三维坐标位置信息作为关键属性的研究方向
值得注意的是近年来研究者们提出了许多创新性的方法试图通过多视角整合药物特征以提升相似性度量效果但这些工作大多仅限于局部层面的研究往往需要依赖丰富的领域知识来辅助构建有效的表征模型
另一类常用的DDI预测策略基于网络嵌入模型

图2 现有DDI预测方法
从上述分析可以看出,这些方法的根本目标在于获取更多关于生物关联的数据。如果一个图表或数据能提供更多关于生物分子网络的信息,则有助于提升药物-药物相互作用(DDI)预测的准确性。此时构建一个知识图谱模型成为一个理想的选择。由于知识图谱不仅记录了多个实体间的结构联系以及与每个节点相关的语义信息,并且能够有效整合多源数据资源。在回顾以往DDI预测方法的发展历程时我们发现现有的基于知识图谱的方法这一方法直接利用节点嵌入技术通过提取节点嵌入来表征每个分子特征。然而这一方法未充分考虑每个分子所连接的丰富邻居信息。针对上述不足我们在研究中采用了一种创新的方法即在知识图谱中引入基于图神经网络的技术通过使用图神经网络对节点的邻域进行采样将各邻居的信息综合起来得到分子特征向量

图3 知识图谱和图神经网络
**二、**基于知识图谱的图神经网络
图4展示了基于知识图谱的图神经网络的主要组成部分,其主要由以下三个核心部分构成:首先,通过DDI提取并构建相应的知识图谱模型;其次,设计高效的神经网络层;最后,实现药物间相互作用关系的预测模型。

图4 基于知识图谱的图神经网络框架
在第一步中,我们主要采用了DrugBank和KEGG-drug两个数据集来进行DDI的提取。通过对这些数据集进行解析处理,我们得以提取出一系列药物对。值得注意的是,在这些药物对中包含了一些经FDA认证的直接相互作用(Direct Drug Interactions, DDI)。例如,在图4所示的例子中可以看到一个具体的DDI案例:DB00001与DB01181。在知识图谱构建过程中,我们采用Bio2RDF工具来整合并构建了一个兼容于RDF的数据链接网络。

图5 DDI提取和KG构建
在输入数据处理阶段,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在对实体进行分析的过程中,在构建知识图谱的过程中

图6 KGNN层
图7概述了KGNN算法的流程。整个框架分为三个主要环节:首先,在数据集中收集药物配对关系并构建相应的知识图谱;其次,在此框架中使用KGNN模型处理输入信息,并获取药物及其相关实体在邻域中的特征表示;最后,在知识图谱的基础上计算不同药物之间的相似性度量值,并通过反馈机制输出其相互作用的可能性。

图7 KGNN算法
**三、**实验结果
实验部分基于DrugBank及KEGG-drug两个数据集对KGNN的表现进行评估。采用8:1:1的比例将所有获得确认的药物相互作用实例作为阳性样本进行随机分配至训练集验证集与测试集同时从阳性样本的补集中随机选取阴性样本用于模型训练通过多维度指标综合评估模型预测效果具体包括准确率(ACC)平均 precision-recall值(AUPR)Area Under ROC Curve(AUC-ROC)以及F1分数从MF算法到知识图谱嵌入技术中选择MF-RW-NN-DL-KG这五种代表方法进行对比研究

图8 实验设定
图9展示了KGNN与基准方法在性能上的对比。每种方法的第一行和第二行分别对应于DrugBank数据集和KEGG-drug数据集上的实验结果。通过对实验结果的分析可以看出,该方法在两个数据集上均表现优异。此外,在消融实验中评估了三种不同的聚合方法,发现通过拼接聚合的方法达到了最佳效果.同时,这些变体的表现均优于作为基准的对比方法,反映出了KGNN方法的稳定性.

图9 对比、消融实验结果
该研究探讨了影响知识图谱网络(KGNN)性能的关键参数k、H和d的作用。首先,在调整邻接空间大小k的过程中发现:当k取值为16时(超过6会导致内存溢出),模型表现出最佳性能。这表明,在采样数量不足的情况下(即无法涵盖足够的信息源),模型的表现会受到严重影响。接着,在探究感知域深度H的变化规律时发现:当H设定在2层时(超过3层会导致计算效率下降),模型能够有效提取特征。最后,在考察嵌入维度大小d的影响过程中发现:适当调节d值(如从8增长到512)能够显著提升模型的学习能力

图10 不同参数的实验结果
四、总结和未来展望
总体而言,林轩团队开发了一种创新性的架构来解决DDI(药物相互作用)预测问题。该架构将图神经网络整合于知识图谱构建过程中,并通过提取与药物相关的拓扑特征信息以及语义关联关系来增强模型性能;针对未来研究方向,则主要探讨以下几个方面:首先计划扩展至更大规模的知识图谱数据库;其次重点开发高效的采样策略;最后尝试将现有技术延伸至多类型药物相互作用分析及其它相关应用场景;在此过程中避免局限于单一的二分类预测模式。

图11 总结和未来工作
Paper: https://www.ijcai.org/Proceedings/2020/0380.pdf
Code: https://github.com/jacklin18/KGNN
整理:何文莉
审稿:林 轩
排版:岳白雪
我们热忱欢迎AI领域的专家学者赐稿, 诚挚期待各位深入探讨学科发展历程与前沿科技. 对于当前热点议题, 我们已邀请相关领域专家共商 matters. 同时, 在线平台正渴求优秀的稿件作者.
请将简历等信息发至yun.he@aminer.cn!
微信联系:AITIME_HY
AI TIME是由一群具有科学探索精神与人文情怀背景的青年学者组成的社会化平台。该圈层致力于传承与弘扬科学研究的精神内涵,并通过组织深入探讨的形式, 针对人工智能领域中的核心议题展开研究与交流, 促进学术思想交流, 在这样的平台中实现专业知识经验的有效分享

更多资讯请扫码关注

(直播回放:https://b23.tv/ifBA8L)
(点击“阅读原文 ”下载本次报告ppt)
