宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > 世界币 > 正文

想做好区块链数据分析?先来看看如何解决“去匿名化”这个大难题

作者:

时间:1900/1/1 0:00:00

在最近的会议演讲中我经常会被问到:区块链数据分析的最大挑战是什么?我的回答就一个词:去匿名化。

我坚定地认为,识别不同类型的参与者并理解其行为是解锁区块链分析潜力的核心挑战。我们花费了相当多的时间来考虑这个问题以识别出与数字货币运动的伦理不发生冲突的正确边界。在这篇文章里,我想进一步探讨这个思路。

市场上大多数区块链的架构依赖于匿名或伪匿名机制来保护其节点的隐私并实现去中心化。数据混淆机制可以将加密资产交易数据记录在公开的账本上让每个人都能访问,但是也让分析这些数据变得异常困难。

如果不能识别参与者的身份,就很难理解区块链数据集并分析出有意义的结果,而且区块链分析只能徘徊在初级阶段。然而,重要的一点是要理解,去匿名化区块链数据集并不是要知道账本中每个地址的真实身份,这个方向基本上是不具备可扩展性的可能。

Aave社区今日将开启关于“弃用Aave V2 AMM市场”的ARFC提案投票:4月23日消息,Snapshot投票页面显示,Aave社区将于今日21:00开启关于“弃用Aave V2 AMM市场”的ARFC提案投票,并将于4月29日结束。

该提案表示,考虑到AMM V2市场的低使用率,以及现在唯一未冻结的资产是V2 ETH和V3 ETH上可用的主要资产(DAI、USDC、USDT、WBTC、ETH),因此建议弃用AMM V2市场。这包括将所有LP代币的清算阈值设置为零,并冻结所有其他资产(DAI、USDC、USDT、WBTC、ETH)。冻结资产不会清算头寸。

将LT设置为零可以清算受影响的账户(以LP代币抵押品借款的用户),目前Aave V2 AMM市场上有大约15万美元的LP代币存款。

如果Snapshot投票通过,则发布AIP提案,并留出足够的通知时间供用户根据需要调整其仓位。[2023/4/23 14:22:00]

相反的,我们可以识别并理解区块链中已知参与者的行为,例如交易所、OTC柜台、矿工以及其他构成区块链生态系统的核心成员。

美国银行:2022年下半年加密货币价值的崩溃将为2023年的黄金市场提供一些支持:金色财经报道,美国银行:2022年下半年加密货币价值的崩溃将为2023年的黄金市场提供一些支持。[2023/1/10 11:04:26]

地址数量会不知不觉误导你

网络的量度是区块链分析中无所不在的一个指标,也是一个可以清晰地展示去匿名化威力的指标。

地址数量是最常见的一个具有误导性的指标,因为并非所有的地址都同等重要。交易创建的一个用于临时性转账的地址,显然不能和另一个长期持有资产的钱包地址相提并论。

类似的,像币安这样的交易所的热钱包,肯定也不同和我的个人钱包采用同样的方法和指标去分析。同等对待所有地址的匿名性,注定会导致解读的有限性并且经常会得出误导性的结论。

CZ:加密可能是唯一稳定的东西:金色财经报道,Binance创始人CZ在?在最近的一次采访中表示,尽管许多主流资产正在应对波动性和价格下跌,但加密货币是目前“唯一稳定的东西”。在这个非常动态的环境中,加密可能是唯一稳定的东西。价格是波动的,但如果你看看技术,如果你看看加密货币的基本面,有限的供应,什么都没有改变。在整个动荡局势中,从技术角度来看,这是最稳定的事情。[2022/12/8 21:29:33]

匿名性vs.可解读性

匿名或伪匿名身份是可伸缩的去中心化架构的关键因素之一,但是这也让从区块链数据集中获取有价值的信息变得极端困难。理解这一观点的一个办法,就是把匿名性视为区块链分析的可解读性的一个反因子。

在区块链数据集中匿名性与可解读性之间的摩擦相对来说还比较小。一个区块链数据集的匿名性越高,从中获取有意义的信息的难度就越大。参与者的身份提供了其行为的上下文环境,而上下文环境则是可解读性的关键构建模块。

印度央行称加密货币可能导致经济 \"美元化\":5月16日消息,据印度报业托拉斯报道,印度中央银行的高级官员告诉议会金融委员会,加密货币可能导致部分经济的 \"美元化\",这可能有损国家的主权利益。

\"几乎所有的加密货币都是以美元计价的,由外国私人实体发行,它最终可能导致我们经济的一部分美元化,这将违背国家的主权利益,\"这些官员告诉金融委员会的成员,包括议会金融常设委员会主席Jayant Sinha。(Coindesk)[2022/5/16 3:19:30]

去匿名化vs.打标签

「你是什么」远比「你是谁」要重要。

去匿名化区块链数据集并不涉及了解每个参与者的真实身份。试图了解每个用户的真实身份不仅是一个意义重大的任务,而且也会让分析工作难以突破一定的规模。

相反,我们可以试着理解一个参与者的关键特征来让我们的分析达到一定程度的可解读性。因此,不需要清楚地识别每个地址的真实身份,我们可以给地址打标签或者附加一些描述性的元数据,来让其行为具备一定的上下文环境。

在大规模数据中,打标签常常要比个体识别更有效果。理解区块链生态系统中特定个体的行为当然会让分析达到更个性化的程度,但是对于在宏观层面理解行为的趋势就显得相对受限了。

因此,相对与对区块链地址的个体真实身份的识别,去匿名性的挑战与地址的关键性属性的标注的关系更大。我们如何实现这一点?

机器学习会是一个优秀的解决方案

标注或者去匿名化区块链的思路可以让区块链分析更好地生态中已知参与者的行为模式和特征。直觉上我们可以考虑创建一些规则来分析区块链生态系统中的不同成员,例如:

“如果一个地址持有大量比特币地址并且一次执行100个交易,那么这是一个交易所地址……”

虽然很有吸引力,但是基于规则的方法将很快失效,无法再提供有用的信息。下面列出了部分原因:

预置知识的完整性:基于规则的分类会假定我们对于如何识别区块链生态中的不同参与者有足够的知识。这显然是不正确的假设。

持续的变化:区块链解决方案的架构一直都在演变,这对任何嵌入的规则而言都是挑战。

特征属性的数量:创建一条有两三个参数的规则很简单,但是试图创建一条有几十个甚至上百个参数的规则就没那么简单了。要识别出像交易所或OTC柜台这样的地址需要大量的特征。

因此我们不能使用预置的规则,我们需要一种可以从区块链数据集中学习模式的机制来自动推断出有意义的规则让我们可以标注相关的参与方。从概念上来说,这是一个经典的机器学习问题。

从机器学习的观点,我们应该从两个主要途径来考虑应对去匿名化的挑战:

无监督学习:无监督学习聚焦于学习指定数据集中存在的模式并识别相关分组。在区块链数据集的上下文中,可以使用无监督学习模型基于地址的特征将其匹配到不同的分组中并对这些分组进行标注。

监督学习:监督学习方法可以利用已有的知识来学习指定数据集中的新的特性。在区块链上下文中,可以使用监督学习方法基于已有的交易所地址数据集训练一个模型来识别出新的交易所地址。

去匿名化或者给区块链数据集打标签很少是只用监督学习或者只用非监督学习,更多的情况下需要两种方法的结合。机器学习模型可以有效地学习区块链生态系统中特定参与者的特征,并利用这些特征来理解其行为。

在使用区块链ETL工具将区块链原始数据加载到数据库或大数据分析平台后,将标注层引入区块链数据集是进行更有价值的区块链数据分析的一个关键挑战。

这些标签提供了更好的上下文环境,也让区块链分析模型具有更好的可解读性。不过尽管我们有机器学习这样强大的工具,去匿名性依然是分析理解区块链生态系统的道路上一个不可忽视的重大路障。

本文来源于“区块链大本营”。

标签:区块链加密货币AAVEAVE区块链专业毕业后到底做什么加密货币交易appaave币能涨到多少钱Kurai MetaVerse

世界币热门资讯
数据显示:比特币价格经历“过山车”行情

北京时间12月5日8点,反映加密货币市场整体走势的ChaiNext100指数报641.92点,过去24小时下跌1.07%,成交额423.08亿美元,成交较前24小时增加23.90%,该指数成分代币中12个上涨.

1900/1/1 0:00:00
FUBT关于LUCY推出净买入大赛的公告

尊敬的FUBT用户: 为喜迎12月Lucia嘉年华活动,LUCY官方推出净买入大赛。用户参与LUCY交易即有机会获得Lucia旗下双宿智能硬件套装以及全国网红民宿免费住权益.

1900/1/1 0:00:00
鼓捣币:六旬老人投资股票比特币,被60多万

不知道大家有没有听过一句很流行的话:“70后炒股,80后炒房,90后炒币,00后炒鞋”。不管是哪个年龄段的人,都会去投资,因为你不理财,财不理你。但是不管做什么投资,一定要选正规的平台和可靠的技术指导.

1900/1/1 0:00:00
数据显示:以太坊30天ROI持续下滑,新增地址增速明显加快

据TokenGazer数据分析显示,截止至12月6日11时,以太坊价格为$147.56,总市值为$16,082.80M,受行情波动影响,主流交易所24H以太坊交易量约为$84.03M.

1900/1/1 0:00:00
建行副行长纪志宏:将进一步打通创新链、应用链、价值链,探索更多的区块链应用场景。

据人民网消息,中国建设银行副行长纪志宏发表题为《拥抱区块链,践行新金融》的评论文章。文章指出,上世纪开始的互联网广泛应用已经深刻改变了金融生态,以区块链、人工智能、5G为代表的新技术也将会对金融业态进行重塑,践行普惠性、科技性、共享性.

1900/1/1 0:00:00
LBK Solar 「Suter」每日流通盘公示(12.04)

尊敬的LBank用户: 出于市场透明性考虑,LBKSolar「Suter」承诺LBK社区对Suter解锁流通盘进行每日公示。本公告公示今日Suter流通量为:10,800,634.45?Suter.

1900/1/1 0:00:00