Advertisement

ChainNet: Learning on Blockchain Graphs with Topological Features

阅读量:

该文章发表于ICDM2019会议。作者包括Nazmiye Ceren Abay,Cuneyt Gurcan Akcora,Yulia R. Gel,Umar D. Islambekov,Murat Kantarcioglu,Yahui Tian以及Bhavani Thuraisingham等学者。

1 背景问题

  • 区块链图结构如何影响其价格水平?
    • 传统的方法:主要依赖于关键指标如度分布、模块数目和聚类系数等;然而这些方法未能捕捉到诸如交易量和交易规模等重要属性及其与网络结构的关系。
      chainlets:其局限性在于仅关注交易类型而忽视了诸如转移金额等关键信息。

2本文贡献:

  • 该文首次引入了持久性同源理论用于加密货币市场的趋势分析,并展示了其在市场行为模式识别中的应用潜力。
  • 在 blockchain 网络结构中提取拓扑特征,并结合机器学习模型来优化比特币价格走势的预测。
  • The Betti derivative was introduced as a novel concept to capture the rate of change in the topological structure of blockchain graphs.
  • This study demonstrates the effectiveness of the Betti derivative in forecasting Bitcoin price trends.

3 LEARNING GRAPH BASED AND TOPOLOGICAL FEATURES

问题描述

已知数据:

在这里插入图片描述

比特币网络上的特征:

在这里插入图片描述

对应比特币价格(美元为单位):

在这里插入图片描述

Q&A

  • 区块链网络活动如何影响现实世界的比特币价格?这些因果关系是否成立?
    我们的假设认为,在输入与输出之间的比特币交易结构记录了各类买家与卖家的行为动机,并通过这些动机体现市场情绪的变化情况,并最终导致价格波动的发生。关于因果性的论证已在前文工作中进行扩展。

多数在线比特币交易所都会以用户之间的形式进行私钥/公钥对的交换来进行内部处理(handled in-house)。我们如何理解这些丢失的交易?过去的工作数据显示,在区块链公开交易中进行内部交易的速度大约是其3至30倍。进一步研究表明,在线交易所即使在内部处理时也会定期将大量订单发布到区块链。因此兑换过程仍然包含着重要的信息。

在研究视角下,请问价格预测问题为何如此重要?这是因为价格动态对区块链市场中占据着举足轻重地位的关键资产产生了深远影响。我们主张,在现实世界中由链外仲裁产生的price被视为一个独特的外部验证器,在一个由世界各地真实参与者共同构建的巨大且复杂的生态系统中运行机器学习模型。

基本方法:

graph filtration(FL)图过滤

论文采用逐步提升比特币金额阈值来筛选交易网络,并创建其不同版本;然后将这些版本整合起来训练一个模型。

the Betti sequences

通过构建拓扑summaries作为工具来深入解析节点度序列及其导出特性的持久属性。该系统性方法建立在坚实的代数拓扑理论基础上,并通过多维度视角整合关键信息;相比之下,则是依据经验法则驱动的方法进行操作,在此过程中允许用户主动设定数值阈值并完成相关网络筛选任务

Learning Graph Representations

构建异构化的区块链网络结构,在其中节点代表地址或交易记录。连接关系按照生成区块的时间顺序排列配置好;每个交易节点仅在该区块中出现一次;而地址节点可能在多个区块中被引用。值得注意的是,在比特币系统中,这些地址无法重复使用。

The k-Chainlet

有向异构图为:

在这里插入图片描述

B表示节点类别:B = {Address, Transaction}。
设交易节点的数量为k,则称为k-chainlet:通常情况下,默认取值为1。

在这里插入图片描述

chainlet方法在区块链图上应用网络模体,缺点如下:

  • shapes较多;
  • 没有考虑转账金额等信息

a) Occurrence and Amount Matrices:
交易表示为:

在这里插入图片描述

它的output和input地址集为:

在这里插入图片描述

每个input地址

在这里插入图片描述

发送

在这里插入图片描述

总的output金额为:

在这里插入图片描述

共有T个交易,input和output的最大地址数为:

在这里插入图片描述
在这里插入图片描述

把chainlet编码成2个维度:

在这里插入图片描述

整个区块链图给表示为2个矩阵:第 i 行第 o 列带包了子结构C的信息

occurrence matrices

在这里插入图片描述

amout matrices

在这里插入图片描述
在这里插入图片描述

如图共有4个chainlet,分为3种:
各出现一次:

在这里插入图片描述

出现2次:

在这里插入图片描述

它们的自然整合需要通过用户定义的量级来优化incidence矩阵或消除incidence矩阵中的count矩阵。

在这里插入图片描述

如果满足转账金额阈值,chainlet出现的次数用O记录:

在这里插入图片描述
在这里插入图片描述

FL通过根据一组尺度值保留节点之间的边来捕获持久的子结构。

Learning Topological Representations

用基于TDA的方法分析区块链图。
目标:

在这里插入图片描述

通过将Betti序列用于持久同源计算的结果总结,并为了提高对这些特征数量统计的能力而采用这种方法。每一个这样的元素都被称为一个Betti数,并且它是基于每个刻度层级进行计算得到的。

在这里插入图片描述

4 实验评估

数据集

作者收集了2009年1月至2018年12月的比特币交易数据,并进行了一些筛选。

特征学习

在某天内的交易特征为:

在这里插入图片描述

实验结果

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~