【文献阅读】Early Detection and Prevention of Malicious User Behavior on Twitter Using Deep Learning Techs
Abstract
该系统倡导采用前瞻性策略,并致力于通过分析海量数据来预判潜在风险。
该技术通过追踪用户嵌入的行为轨迹,在恶意行为出现前能预判其行为。
为了验证该方法的有效性, 我们采用了动态有向多重图模型, 捕捉 Twitter 用户间的动态交互关系。
在识别有害账户方面的准确率(F1分数)较现有方案提升至40.66%以上。
Contribution
构建数据集
该检测模型采用了动态图模型,并考虑到数据的时间特性;定期更新用户的嵌入表示;通过分析网络结构、用户的互动行为以及推文中URL和标签所蕴含的信息来提取语义特征。
研究其动态过程中的交互模式及其影响因素,并基于这些发现开发出一种新型预测模型
提出两个关键研究问题:
RQ 1:是否可以通过利用社交网络交互信息主动检测恶意用户?
RQ 2:恶意用户一旦发动攻击,能够多快被识别出来?
DATA GATHERING AND SOURCES

源自TTC:
自2019年7月发生的一场香港抗议活动期间起
在2019年6月的一份报告中,Twitter透露共有1666个与伊朗政府相关的账户。这些账户总计发出约200万条推文,并主要关注于伊朗在国际新闻报道中的外交政策和地缘政治策略。这些账户因平台操控行为违反Twitter的规定而遭到暂停处理。
在2020年5月的一份报告中指出,在俄罗斯(具体日期未详):Twitter识别出与当前政策(Current Policy)媒体平台相关的1152个相关账户。该媒体平台被发现从事国家支持的政治宣传活动。这些账号参与了一系列协调活动,在进行跨平台信息传播的同时,并过度夸大了某些信息的影响力。其目标涵盖了宣扬统一俄罗斯党的主张,并试图削弱政治异见者的声势。

标签无法完全确保非机器人分类,并需区分合法与非法用户;但在表一中将其与机器人数据集混杂标注。

通过 Twitter 平台的主要用户互动行为来构建边。考虑到在 Twitter 攻击中常见的误导性标签或 URL ,将其编码为边的相关特征以便于构建预测模型。
JODIE



Update Operation:

改写说明

random forest (RF) classifier

