jk260.com

加密货币安全事件频发,如何用机器学习监控项目风险?

  加密货币是一种存在于数字世界的交易媒介(另一种支付形式),依靠加密技术使交易安全。加密货币背后的技术允许用户直接向他人发送货币,而不需要通过第三方,如银行。为了进行这些交易,用户需要设置一个数字钱包,而不需要提供身份证号码或信用评分等个人细节,因此可以让用户伪匿名。

  对于普通的加密货币用户来说,这种匿名性可以让他们放心,因为他们的个人信息或交易数据不会被黑客窃取。然而,这种交易匿名性的提高,也容易被犯罪分子滥用,进行洗钱、恐怖融资等非法活动。这种非法活动给区块链钱包用户以及加密货币实体都造成了巨大的损失。虽然金融行动特别工作组(FATF)等监管机构已经在这些实体的监管中引入了标准化的指导方针,但由于每天都有大量的加密货币实体和交易发生,监控加密货币空间是一项具有挑战性的任务。

  解决方案

  图片来源: https://dribbble.com/shots/2723032-Needle-in-a-Haystack

  因此,人们有兴趣利用开源信息,例如新闻网站或社交平台,来识别可能的安全漏洞或非法活动。在与 Lynx Analytics 的合作中,我们(来自新加坡国立大学的一个学生团队)已经致力于开发一个自动工具,以刮取开源信息,预测每篇新闻文章的风险分数,并标记出风险文章。这个工具将被整合到 Cylynx 平台中,这是 Lynx Analytics 开发的一个工具,用于帮助监管机构通过使用各种信息源监控区块链活动。

  开源信息的数据获取

  我们确定了 3 类开源数据,这些数据可以提供有价值的信息,帮助检测加密货币领域的可疑活动。这些类别是:

  传统的新闻网站,如谷歌新闻,它将报告重大的黑客事件。加密货币专用新闻网站,如 Cryptonews 和 Cointelegraph,它们更有可能报道小型实体和小型安全事件的新闻。社交网站,如 Twitter 和 Reddit,在官方发布黑客新闻之前,加密货币所有者可能会在那里发布有关黑客的消息。

  检索文章和社交帖子的内容,然后建立情绪分析模型。该模型为文章中提到的实体分配了一个风险活动的概率。

  情绪分析模型

  我们尝试了四种不同的自然语言处理工具进行情绪分析,即 VADER、Word2Vec、fastText 和 BERT 模型。在通过选定的关键指标(召回率、精度和 F1)对这些模型进行评估后,RoBERTa 模型(BERT 的一个变种)表现最佳,被选为最终模型。

  图片来源: https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/

  RoBERTa 模型对新闻文章(标题和摘录)或社交帖子的文本进行处理,并为特定文本分配一个风险分数。由于该文本在数据收集过程中已经被标记为实体,我们现在已经有了加密实体的相关风险指标。在后期,我们将多个文本的风险分数结合起来,给出一个实体的整体风险分数。

郑重声明:本文版权归天网查所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。