知识图谱_知识图谱综述(四):时序知识图谱
本文是对这篇论文A Survey on Knowledge Graphs: Representation, Acquisition and Applications 的翻译工作,在去除冗杂内容后进行删繁就简处理,并力求语言通俗易懂。鉴于本人水平有限,在完成这项翻译工作时难免会有不足之处,请予以谅解!
6. 时序知识图谱
现有知识图谱研究主要聚焦于静态结构,这类模型无法适应随时间演变的数据特征,而对动态变化的知识图谱的研究则相对较少。然而,时间序列信息的重视程度却较高,因为许多领域中的数据都呈现出明显的时序特性,其内在规律往往遵循一定的演化模式。近期研究已经开始将时间序列数据纳入 Knowledge Representation Learning (KRL) 和 Knowledge Graph Construction (KGC) 框架中,并将其统称为时间序列知识图谱
(1)时序信息Embedding
时间感知的Embedding主要融入了时序的信息,将三元组扩展到四元组
,
提供了关于fact的额外的时间信息。
Leblay, 2018 对于带有时序标记的三元组进行了系统地探讨,并深入分析了基于这一特征的时间范围预测问题,在现有embedding技术的基础上进行了一定程度上的拓展,并提出了以向量为基础的方法命名为TTransE(TransE Enhanced),其形式化定义如下所示:
时间范围4元组在原来3元组的基础上添加了时间范围
,其中
分别表示三元组有效的起始和终止时间。当给定一个时间戳
的时候,可以根据动态KG得到静态的子图
。
HyTE, 2018 将时间戳看做超平面
,将实体和关系的表征进行映射,以head实体为例
,tail实体和关系同理。时间映射打分函数为:
其中,映射转义公式为
。
LSE4KGC, 2018 将对词序列和时间词序列进行连接,并采用LSTM模型对拼接后的时间感知谓词序列进行编码处理。最终的隐藏层将被用来提取并表示时间感知的关系性信息。
。扩展的TransE和DistMult对应的打分函数分别为
。通过将实体
的上下文定义为包含
的事实的集合,
Liu, 2019 相关工作引入了一种称为"上下文选择器"的技术框架。该研究首先提出了这种技术的核心概念,并随后开发了一种基于此的技术方案来实现目标。首先,该研究引入了一种称为"上下文选择器"的方法来识别有用的信息片段;其次通过所选的上下文片段评估时间一致性。
(2)动态实体
现实中的时间会在一定程度上影响实体的状态及其相互关联的情况。为了提升对时间范围推理的效果,
CTPM, 2014 将其建模为状态变化的检测,并通过上下文学习生成从状态到状态转变的向量表示。
Know-evolve, 2017 则探究了实体在知识图谱中的演化过程及其后续关系的发展。
研究者们采用多源时间点过程来模拟事实的变化轨迹,并利用RNN模型来捕捉非线性的时间演变特征。
RENET, 2019 则采用了基于RNN的时间编码器与邻居聚合器来建模节点之间的交互过程,并通过这种机制来捕获节点间的时间依赖关系。
(3)时序关系依赖
现有的时序依赖主要采用时间线关系链的形式存在,在此基础之上构建有效的知识表示体系具有重要意义。例如,在知识图谱领域中常见的知识体征演化模式如wasBornIn --> graduateFrom --> workAt --> diedIn等典型场景中就体现了这一特点。Jiang (2016) 提出时间感知Embedding方法,并基于时序正则化的联合学习框架对事件序列进行建模研究。该方法通过定义合理的时序打分函数来融合事件序列与一致性信息,在此基础上构建有效的知识表示体系并完成属性提取任务
,
属于一种对称矩阵,在分析时间序列关系时需关注编码关系的时间顺序问题。通过建立整数线性规划模型,并在此基础上进一步应用分离约束、有序约束以及段落约束三种时间一致性条件。
(4)时序逻辑推理
已有研究表明,在处理时间序列数据方面存在多种方法。Chekol, 2017 基于马尔科夫逻辑网络和概率软逻辑的方法在不确定时序知识图谱(KG)上进行了推理研究。RLvLR-Stream, 2019 针对KG流数据特点,在时间相邻路径规则的基础上提出了新的推理框架。
