比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

想做好區塊鏈數據分析?先看看如何解決“去匿名化”這個大難題_USD

Author:

Time:1900/1/1 0:00:00

作者?|?新缸中之腦

責編|?Carol

來源|區塊鏈大本營

在最近的會議演講中我經常會被問到:區塊鏈數據分析的最大挑戰是什么?我的回答就一個詞:

去匿名化。

我堅定地認為,識別不同類型的參與者并理解其行為是解鎖區塊鏈分析潛力的核心挑戰。我們花費了相當多的時間來考慮這個問題以識別出與數字貨幣運動的倫理不發生沖突的正確邊界。在這篇文章里,我想進一步探討這個思路。

市場上大多數區塊鏈的架構依賴于匿名或偽匿名機制來保護其節點的隱私并實現去中心化。數據混淆機制可以將加密資產交易數據記錄在公開的賬本上讓每個人都能訪問,但是也讓分析這些數據變得異常困難。

如果不能識別參與者的身份,就很難理解區塊鏈數據集并分析出有意義的結果,而且區塊鏈分析只能徘徊在初級階段。然而,重要的一點是要理解,去匿名化區塊鏈數據集并不是要知道賬本中每個地址的真實身份,這個方向基本上是不具備可擴展性的可能。

Kava計劃推出面向Cosmos DApp和應用鏈的USDT存款激勵計劃:7月26日消息,Kava 計劃推出Kava Rise: Cosmos USDt激勵計劃,以支持Cosmos應用鏈,為Cosmos創建一個新的USDT存款激勵計劃。如果第148號提案獲得通過,從2023年8月1日起,KAVA激勵措施將以編程方式按比例分配給IBC上USDT存款最高的前十名Cosmos DApp和應用鏈。[2023/7/26 15:59:02]

相反的,我們可以識別并理解區塊鏈中已知參與者的行為,例如交易所、OTC柜臺、礦工以及其他構成區塊鏈生態系統的核心成員。

地址數量會不知不覺誤導你

網絡的量度是區塊鏈分析中無所不在的一個指標,也是一個可以清晰地展示去匿名化威力的指標。

加密貨幣專家:BTC的價格在減半之前和之后的幾個月內可能會上漲15倍:金色財經報道,鑒于機構投資者的興趣日益濃厚,加密貨幣專家Micha?l van de Poppe表示,BTC的價格在減半之前和之后的幾個月內可能會上漲15倍。可能會經歷一個與2015年至2017年相當的周期,這是一個有大量機構投資者、更多的散戶和政府進入市場的階段。

在價格增長方面,據此期望比特幣在這個周期內達到10倍,甚至15倍,這很可能會出現90年代末互聯網股票市場泡沫相似的情況,互聯網泡沫約為10到15萬億美元,后來的崩潰是因為價格和炒作總是開始加速,這也將不可避免地發生在加密貨幣上,然后這種緩慢、漸進的采用會在以后較慢的周期中發生,如果比特幣出現回調,樞軸點將在42000美元左右。[2023/6/30 22:10:44]

地址數量是最常見的一個具有誤導性的指標,因為并非所有的地址都同等重要。交易創建的一個用于臨時性轉賬的地址,顯然不能和另一個長期持有資產的錢包地址相提并論。

ETH 2.0總質押數已超1767.29萬:金色財經報道,數據顯示,ETH 2.0總質押數已超1767.29萬,為17672874個,按當前市場價格,價值約314.30億美元。此外,目前ETH 2.0質押總地址數已超56.84萬,為568438個。[2023/3/21 13:16:03]

類似的,像幣安這樣的交易所的熱錢包,肯定也不同和我的個人錢包采用同樣的方法和指標去分析。同等對待所有地址的匿名性,注定會導致解讀的有限性并且經常會得出誤導性的結論。

匿名性vs.可解讀性

匿名或偽匿名身份是可伸縮的去中心化架構的關鍵因素之一,但是這也讓從區塊鏈數據集中獲取有價值的信息變得極端困難。理解這一觀點的一個辦法,就是把匿名性視為區塊鏈分析的可解讀性的一個反因子。

安全團隊:孫宇晨地址將1200萬枚TUSD轉移至幣安:金色財經報道,據派盾(PeckShield)監測,標記為孫宇晨的地址已將1200萬枚TUSD轉移至幣安。[2022/10/17 17:28:56]

在區塊鏈數據集中匿名性與可解讀性之間的摩擦相對來說還比較小。一個區塊鏈數據集的匿名性越高,從中獲取有意義的信息的難度就越大。參與者的身份提供了其行為的上下文環境,而上下文環境則是可解讀性的關鍵構建模塊。

去匿名化vs.打標簽

「你是什么」遠比「你是誰」要重要。

去匿名化區塊鏈數據集并不涉及了解每個參與者的真實身份。試圖了解每個用戶的真實身份不僅是一個意義重大的任務,而且也會讓分析工作難以突破一定的規模。

數字人民幣App更新1.0.9.0版:從32位升級到64位:金色財經報道,據蘋果App Store和各大安卓平臺顯示,數字人民幣App昨日已完成新版本1.0.9.0升級。更新日志顯示,新版數字人民幣App大小不到70MB,體積更小、啟動更快,還優化了付款碼免密設置,而本次體積變小的主要原因是從32位升級到了64位版本。據悉,從今年開始,小米、OPPO、vivo、華為等國內手機廠商就相繼宣布,將關閉新應用32位單包上傳入口,這也加快了32位應用淘汰速度。此次更新,數字人民幣App也正式升級到了64位版本。[2022/5/16 3:18:37]

相反,我們可以試著理解一個參與者的關鍵特征來讓我們的分析達到一定程度的可解讀性。因此,不需要清楚地識別每個地址的真實身份,我們可以給地址打標簽或者附加一些描述性的元數據,來讓其行為具備一定的上下文環境。

在大規模數據中,打標簽常常要比個體識別更有效果。理解區塊鏈生態系統中特定個體的行為當然會讓分析達到更個性化的程度,但是對于在宏觀層面理解行為的趨勢就顯得相對受限了。

因此,相對與對區塊鏈地址的個體真實身份的識別,去匿名性的挑戰與地址的關鍵性屬性的標注的關系更大。我們如何實現這一點?

機器學習會是一個優秀的解決方案

標注或者去匿名化區塊鏈的思路可以讓區塊鏈分析更好地生態中已知參與者的行為模式和特征。直覺上我們可以考慮創建一些規則來分析區塊鏈生態系統中的不同成員,例如:

“如果一個地址持有大量比特幣地址并且一次執行100個交易,那么這是一個交易所地址……”

雖然很有吸引力,但是基于規則的方法將很快失效,無法再提供有用的信息。下面列出了部分原因:

預置知識的完整性:基于規則的分類會假定我們對于如何識別區塊鏈生態中的不同參與者有足夠的知識。這顯然是不正確的假設。

持續的變化:區塊鏈解決方案的架構一直都在演變,這對任何嵌入的規則而言都是挑戰。

特征屬性的數量:創建一條有兩三個參數的規則很簡單,但是試圖創建一條有幾十個甚至上百個參數的規則就沒那么簡單了。要識別出像交易所或OTC柜臺這樣的地址需要大量的特征。

因此我們不能使用預置的規則,我們需要一種可以從區塊鏈數據集中學習模式的機制來自動推斷出有意義的規則讓我們可以標注相關的參與方。從概念上來說,這是一個經典的機器學習問題。

從機器學習的觀點,我們應該從兩個主要途徑來考慮應對去匿名化的挑戰:

無監督學習:無監督學習聚焦于學習指定數據集中存在的模式并識別相關分組。在區塊鏈數據集的上下文中,可以使用無監督學習模型基于地址的特征將其匹配到不同的分組中并對這些分組進行標注。

監督學習:監督學習方法可以利用已有的知識來學習指定數據集中的新的特性。在區塊鏈上下文中,可以使用監督學習方法基于已有的交易所地址數據集訓練一個模型來識別出新的交易所地址。

去匿名化或者給區塊鏈數據集打標簽很少是只用監督學習或者只用非監督學習,更多的情況下需要兩種方法的結合。機器學習模型可以有效地學習區塊鏈生態系統中特定參與者的特征,并利用這些特征來理解其行為。

在使用區塊鏈ETL工具將區塊鏈原始數據加載到數據庫或大數據分析平臺后,將標注層引入區塊鏈數據集是進行更有價值的區塊鏈數據分析的一個關鍵挑戰。

這些標簽提供了更好的上下文環境,也讓區塊鏈分析模型具有更好的可解讀性。不過盡管我們有機器學習這樣強大的工具,去匿名性依然是分析理解區塊鏈生態系統的道路上一個不可忽視的重大路障。

Tags:區塊鏈APPUSDcosmos區塊鏈技術通俗講解ppt圖靈幣appUSDCCosmostarter

比特幣價格實時行情
最近爆發的新型勒索病為“推廣”比特幣操碎了心_RAN

來源:小蔥區塊鏈 名為DeathRansom的比特幣勒索病在誕生初期幾乎淪為笑柄,因為受感染的用戶發現這個病鎖死文件的邏輯非常粗糙,僅僅是在原始文件文件名后添加了一個“.wctc”的擴展名.

1900/1/1 0:00:00
現場丨海南區塊鏈戰略怎么走?海南省副省長等重要領導今天給出了答案_聯盟鏈

巴比特訊,12月1日,海南國際離岸創新創業示范區建設暨區塊鏈·數字資產交易技術創新高端論壇在海南三亞舉行.

1900/1/1 0:00:00
掃描區塊鏈大數據公司,這是個賺錢的生意嗎?_CHA

文|?Carol設計|Tina編輯|畢彤彤來源|PANews大數據方興未艾。在“區塊鏈”和“大數據”概念的雙重加持下,有越來越多的創業公司進入這條賽道,資本市場對此也較為看好.

1900/1/1 0:00:00
精選 | 五分鐘速覽區塊鏈十年歷史;以太坊2.0信息大全_區塊鏈

今天內容包括: 1、區塊鏈十年歷史; 2、JasonChoi談Synthetix;3、2019年是DeFi的一年;4、減半故事還行不行:萊特幣的減半后暴跌;5、以太坊2.0信息大全.

1900/1/1 0:00:00
一文看懂摩根大通的區塊鏈產品布局_區塊鏈

摩根大通,作為美國銀行業的巨頭之一,其首席執行官杰米?戴蒙曾多次炮轟過比特幣,但事實上,摩根大通是最早接觸區塊鏈的金融機構之一.

1900/1/1 0:00:00
行情分析:BTC仍處于技術性調整階段,主流幣市場分化BCH表現較好_BTC

行情回顧:昨日走勢反彈在7400一線受阻后,走勢進入震蕩的趨勢中,市場量能收縮,價格在7000-7300區間內調整,今日凌晨價格在7200區域上方運行,走勢不斷試圖上攻試探高點阻力.

1900/1/1 0:00:00
ads