原文作者:Yang
引子
“數”中自有黃金屋,鏈上數據潛藏著無盡的Alpha。當我們跟隨smartmoney聞風而動,當我們夜以繼日地在NFTParadise中尋找trendingNFT,當我們查詢StepN每日新鞋鑄造數據時,你是否好奇這些數據如何而來?面對眾多鏈上數據分析平臺和紛繁復雜的功能,你是否還在尋找最適合自己的那個平臺?
1.背景介紹
隨著鏈上生態的日益蓬勃,如DeFi交易、借貸,NFT的鑄造、交易等,用戶的行為被直接透明地記錄在鏈上。這些鏈上行為的數據對應著鏈上價值的流動,對這些數據的分析和根據分析而得出的洞察和見解變得極為有價值。鏈上數據分析平臺,如Nansen,TokenTerminal,DuneAnalytics,FootprintAnalytics,flipsidecrypto,glassnode,Skew等順應這些日益增長的需求,面向個人和機構用戶推出了側重點略有不同的產品。
本文先將簡述鏈上數據分析平臺背后的數據架構,意在告訴讀者那些鏈上數據分析結果從何而來,如何而來。隨后我們從數據豐富度(覆蓋區塊鏈數量)、數據粒度、數據延遲、平臺易用性和查詢自由度等維度為讀者梳理市場上主流的面向個人用戶的數據分析平臺。最后分享我們對Web3未來鏈上數據索引、查詢和分析的一點暢想。
2.鏈上數據分析平臺數據架構介紹
雖然區塊鏈記錄著所有原始的交易數據,鏈上數據本身都是公開透明的,但當我們提出:過去24小時Uniswap的交易量是多少?當前百分之多少的BAYC持有者也同時持有至少一個Moonbirds?......等等問題時,鏈上原始數據并不能給我們答案,我們需要通過索引(indexing),處理(processing),存儲(storage)等等一系列數據攝取(ingestion)的處理過程,再根據所提問題來聚合運算對應的數據,才能得到問題的答案。直接查詢區塊鏈來求得問題答案是非常耗時耗力的,為了讓鏈上數據能夠被快速檢索,當前主流的鏈上數據分析平臺會將索引得到的原始鏈上數據,經過一系列處理后,存入由平臺負責更新和管理的數據倉庫(datawarehouse)中。當用戶在Nansen追蹤smartmoney的交易動態,或在DuneAnalytics上查看可視化分析時,用戶對所謂“鏈上數據”的查詢,實際上是在查詢由項目方中心化控制的數據庫而非區塊鏈本身。
FTX債權人聯盟評論FTX重組計劃:無擔保債權人委員會意見被忽視:金色財經報道,FTX債權人聯盟于推特上發表對FTX重組計劃意見。聯盟表示,無擔保債權人官方委員會(UCC)意見被忽視,UCC提出以下要求:UCC應該有權選擇誰來運行FTX、重新啟動和復蘇代幣、將26億美元現金投入短期國債并獲得持有利息。此外,UCC反對FTX提出的延長排他要求的申請,以便債權人能夠自行提出計劃。[2023/8/1 16:11:24]
鏈上數據分析平臺的數據倉庫架構大致如下:
數據采集層:?平臺從區塊鏈節點獲取原始鏈上數據,部分平臺會接受第三方提供的數據源,還有的平臺(如FootprintAnalytics)支持用戶上傳鏈下數據來輔助最終的數據分析。
數據處理層:各平臺將原始數據以流式處理或批次處理的方式進行數據抽取、轉換和加載。流式處理中,實時原始數據被源源不斷地輸入并被持續處理,通常意味著數據延遲低,分析結果時效性更高;而批次處理雖然數據延遲會稍高,分析結果時效性稍低,但更適用于大容量的數據處理。
數據存儲層:經過處理后的數據會根據平臺方預先定義的格式存儲進數據集的各數據表中以待后續使用。
數據整合層:存儲的數據會被聚合運算。計算可以是根據預先設定好的指標來進行的(metricscomputation),也可以階段性的(periodic)或是根據設定好的條件被觸發的(event-drivenaggregation)等。
數據分析層:運算完成的結果被實時地報告、輸出。對于個人用戶而言,我們主要在數據分析層與鏈上數據分析平臺進行交互,比如Nansen提供的BusinessIntelligence報告界面,DuneAnalytics和FootprintAnalytics上眾多的的可視化圖表,以及部分平臺提供的API接口等。
數據:Arbitrum Nova橋接存儲ETH總量突破2萬枚:金色財經報道,據Dune Analytics最新數據顯示,Arbitrum基于AnyTrust技術的新鏈Arbitrum Nova橋接存儲ETH總量已突破2萬枚,本文撰寫時達到20,311枚,按照當前價格計算約合3700萬美元,其橋接交易總量達到197,27 筆,ETH存儲獨立用戶量為164,587個。此外,當前Arbitrum One橋接存儲ETH總量已接近250萬枚,橋接交易總量為1,017,515筆。[2023/5/20 15:15:37]
各平臺采取了不同的方案來建設和維護自己的數據倉庫。比如Nansen借助第三方GoogleCloudPlatform完成數據倉庫的建設和維護。
(https://www.nansen.ai/post/nansen-and-google-cloud-empower-web3-investors-with-high-quality-real-time-market-intelligence)
圖片來源:GoogleCloudNansenCaseStudyhttps://cloud.google.com/customers/nansen
而DuneAnalytics,FootprintAnalytics,TokenTerminal等平臺則獨立建設和維護自己的數據倉庫。以FootprintAnalytics為例,其數據倉庫架構如下圖所示。
灰度比特幣信托負溢價率漲至40.58%:金色財經報道,Coinglass數據顯示,當前灰度總持倉量達226.62億美元,主流幣種信托溢價率如下:BTC,-40.58%;ETH,--53.22%;ETC,-62.66%;LTC,-47.06%;BCH,-19.8%。
此前報道,ARK方舟基金持倉數據顯示,4月1日至今,ARK方舟基金持續減持所持GBTC份額,累計減持89995份GBTC,按當前價計算,價值約128.33萬美元。截止發稿,GBTC報14.26美元。[2023/5/14 15:02:24]
3.主流鏈上數據分析平臺比較
本節以內容視角和用戶視角,從數據豐富度(覆蓋區塊鏈數量)、數據粒度、數據延遲、平臺易用性和查詢自由度等維度來對比幾家主流的鏈上數據分析平臺,包括Nansen,TokenTerminal,DuneAnalytics,FootprintAnalytics。
部分平臺給用戶提供標準化的信息報告界面,比如Nansen,TokenTerminal等。
Nansen
Nansen應該是大家最為熟悉的鏈上數據分析平臺之一。相較于其他平臺,其最為出色的功能是錢包標記(walletprofiler/walletlabeling)。借助錢包標記并結合其他鏈上數據為用戶提煉出極具價值的信息,比如SmartMoney,幫助用戶追蹤巨鯨、重度DeFi玩家的實時動向。其他熱門產品包括HotContract,發現新興熱門的DeFi和NFT合約;NFTParadise,一覽實時NFT鑄造數據等等。
Nansen現在支持Ethereum,Arbitrum,Avalanche,BSC,Celo,Fantom,Optimism,Polygon,Ronin,Terra,Solana共計11條區塊鏈的鏈上數據分析
律師事務所Rosen計劃對比特幣礦企Argo Blockchain提起集體訴訟:2月13日消息,律師事務所Rosen計劃對比特幣礦企Argo Blockchain提起集體訴訟,正在調查潛在索賠名單,鼓勵在Argo損失超過10萬美元的投資者聯系該律所,并提醒投資者在針對Argo提起的聯邦證券集體訴訟中尋求首席原告角色的截止日期為2023年3月27日。
金色財經此前報道,ArgoBlockchain去年曾因財務問題瀕臨破產,2022年12月28日,Argo Blockchain同意向Galaxy Digital以6500萬美元價格出售其位于德州的Helios采礦設施,以避免破產。[2023/2/13 12:02:48]
Nansen普通版僅為用戶提供精選數據
流式處理和批次處理。部分數據分析已實現近乎實時的報告
零門檻
Nansen普通版僅提供標準信息模板界面。針對機構客戶對自定義鏈上數據查詢和分析的需求,Nansen借助GoogleCloudPlatform的BlockchainDatasets發布了NansenInstitutions產品,讓專業/機構用戶能夠編寫滿足定制需求的SQLQueries。
值得一提的是,Nansen在NansenResearch頻道中發布了不少鏈上分析報告。研究報告會對重點事件進行抽絲剝繭般的鏈上追蹤和分析,讀者不妨偶爾閱讀這些報告(如Nansen針對上月stETH脫錨事件發布的報告https://www.nansen.ai/research/on-chain-forensics-demystifying-steth-depeg),對學習鏈上分析的方法大有裨益。
TokenTerminal
TokenTerminal以提供準確的協議收入(protocolrevenue)而著名。基于協議收入,TokenTerminal計算了各協議的市銷率,市盈率等數據。這些數據在一定程度上為各協議提供了估值基準。
初創公司Alphaledger發行三筆美國市政債券:金色財經報道,美國初創公司Alphaledger在其獲準的區塊鏈上發行了三筆美國市政債券。在區塊鏈上記錄發行情況只是Alphaledger計劃的第一步,該公司的目標是利用智能合約進行鏈上清算和托管。
根據SIFMA的數據,在2021年,有13000個市政債券發行,價值4820億美元。(ledgerinsights)[2022/12/20 21:55:10]
TokenTerminal追蹤了超過130個協議的數據
TokenTerminal僅為用戶提供精選數據
批次處理。據IOSG團隊近期與TokenTerminal的溝通,目前TokenTerminal平臺上的數據大約有兩天時間的延遲
零門檻
僅提供標準信息界面
TokenTerminal協議收入數據圖例:過去365天收入前十的區塊鏈和協議的收入占比
另外一些主流鏈上數據分析平臺則向用戶開放數據表,用戶可自由編寫代碼進行查詢,在查詢內容上給予用戶一定的自由度,如DuneAnalytics和FootprintAnalytics。
DuneAnalytics
DuneAnalytics是最早開放用戶自主查詢的鏈上數據分析平臺,擁有最大的分析師團體和用戶社區。DuneAnalytics提供了高度顆粒化的原始鏈上數據,分析師可以自由地利用這些數據寫出自定義的查詢。DuneAnalytics也對項目方團隊開放Abstraction,項目方可以根據自己協議的數據內容創造更適合的數據表供分析師使用。但自主查詢具備一定的門檻,分析師需具備PostgreSQL的編寫能力才能創造滿足自己需求的數據查詢。而且查詢延遲與分析師SQL編寫水平和對DuneAnalytics提供的數據表熟悉程度高度相關。
DuneAnalytics提供了Ethereum,BSC,Optimism,Polygon,GnosisChain,Solana共計6條區塊鏈的鏈上數據
極細
流式處理。數據延遲大約五分鐘
DuneAnalytics對分析師提出了一定的SQLcoding要求
高
有了高度顆粒化的原始數據,分析師便可以在DuneAnalytics自由創建鏈上分析。如每日StepN新鞋鑄造及歷史積累數據https://dune.com/queries/627689/1170627
DuneAnalytics于2022年5月30日發布了DuneEnginev2。DuneEnginev2在將DuneAnalytics的數據架構進行大改來為用戶提供更快查詢響應和更好查詢表現的同時,也將對用戶體驗的影響降至最低。
FootprintAnalytics
相較于Nansen低使用門檻但僅提供標準化信息界面,DuneAnalytics提供了自由查詢但又要求分析師具備編寫PostgreSQL語言的能力,FootprintAnalytics為用戶提供了兩全其美的解決方案,在給予極大的查詢自由度的同時降低了使用門檻。它是如何做到的?
“鏈上數據錯綜復雜,分析師可能需要寫成百上千行代碼才得以完成一個指標的計算。為了解決分析門檻高的問題,Footprint清理和集成鏈上數據,給數據賦予了業務意義,使得用戶無需SQL查詢和編碼也可以分析區塊鏈數據。任何人都可以通過豐富的圖表界面在幾分鐘內構建自己的自定義圖表,解密鏈上數據,發現項目背后的價值趨勢。”
FootprintAnalytics不僅提供原始區塊鏈數據,更將鏈上數據進行分級。最原始的鏈上數據為銅級別(Bronzedata),經過篩選、清洗和增強的數據為銀級別(Silverdata),進一步整理出具備業務意義的數據為金級別(Golddata)。
已經整理完成的具有商業邏輯和業務意義的金銀級別數據可以直接用于分析。借助金銀級別數據,FootprintAnalytics為用戶提供了通過簡單地拖拽數據表就能自主查詢鏈上數據的服務。不管讀者你是否會寫類SQL語言代碼,你都可以快速創建滿足自己定制化需求的數據分析信息界面,并將所需信息通過直觀且可互動的圖表可視化。
FootprintAnalytics目前提供了Ethereum,Arbitrum,Avalanche,Boba,BSC,Celo,Fantom,Harmony,IOTEX,Moonbeam,Moonriver,Polygon,Thundercore,Solana等共計17條區塊鏈的鏈上數據
FootprintAnalytics既為用戶提供粒度極細的原始數據,也為用戶提供精選數據
目前FootprintAnalytics對采集到的原始數據進行每日一次的批次處理,數據延遲為一天
在FootprintAnalytics平臺,用戶無需SQL查詢和編碼也可自由分析鏈上數據。對于具備SQL代碼能力的分析師,Footprint也提供原始數據供分析師發揮。
高
讀者不妨現在就前往FootprintAnalytics,幾分鐘即可上手制作一個自己的鏈上分析界面
圖片來源:IOSG
4.一點暢想——去中心化鏈上數據分析
鏈上數據分析如此重要,當今用戶卻只能依賴Nansen,DuneAnalytics等中心化管理的“鏈上數據”分析平臺來輔助投資決策。在這些平臺上,用戶無法驗證所用數據是否未經篡改,不得不信任平臺所提供的數據集是確鑿真實的。“Don’tTrust.Verify.”在鏈上數據分析這里成了一句空話。
Web3浪潮滾滾而來,鏈上生態越發豐富,未來的智能合約和去中心化應用可能不僅僅需要原始鏈上數據和預言機所提供的數據作為輸入信息,還可能需要輸入基于鏈上原始數據計算得出的分析結果,那時候我們還能信任和使用這些中心化鏈上數據分析平臺作這類用途嗎?答案恐怕是否定的。
IOSG團隊近期看到已有項目團隊在實現去中心化鏈上數據查詢和分析的道路上邁出了第一步。由于篇幅受限,且聽下回分解——通向去中心化鏈上數據分析之路。
來源:金色財經
關于NFT資產和元數據的重要性現如今你應該已經有所耳聞。說的更具體些,NFT資產和元數據儲存在哪里?這是最終的決定性因素,決定你的NFT能持續多久,是否能夠永存,或者是否會在某天突然消失?本文將.
1900/1/1 0:00:00原文作者:?Hasu,JeffAmico,andJacobPhillips 創作者:Dewei 審核者:DAOctor 原文:?MusingsonGovernanceDAO領域的發展狀態雖然仍處.
1900/1/1 0:00:007月12日,由中國化工企業管理協會主辦的“2022全國化工企業數智化轉型發展論壇”在淄博成功舉辦.
1900/1/1 0:00:00真是“無巧不成書”,繼前天一位同學問我加密資產的問題后,昨天又有另一個同學群里的一位同學突然問我:比特幣和黃金哪一個更值得配置?他之所以問起這個問題.
1900/1/1 0:00:00更專注一級市場、公募、二級市場潛力幣推薦,項目孵化的探究、暴漲山寨幣,優質幣種的挑選和做到更專業,提供海內外一級市場優質項目----區塊鏈阿生對于這個問題,我說三個觀點:首先.
1900/1/1 0:00:00北京時間2022年7月15日21點,CertiK動態掃描監測系統Skynet天網監測到若干導致TIGER代幣價格下跌的可疑交易.
1900/1/1 0:00:00