隨著Chat-GPT的橫空出世, 我們進入了AIGC帶來的顛覆性創新的時代。
AIGC(AI Generated Content),被認為是繼UGC、PGC之后的新型內容生產方式,AI繪畫、AI寫作等都屬于AIGC的分支,Chat-GPT就是一種自然語言處理的大AI語言模型,AI模型作為AIGC的具體形式,在訓練過程和推理過程中有哪些關鍵要素呢?
要素一:算力
高質量、多樣性的數據是訓練AI模型的基礎,算力為模型訓練提供了驅動能力。
在算力提供方面,對于AI模型訓練階段,算力用于執行大規模數據集上的反向傳播、參數更新和模型優化等任務。較高的算力可以加快訓練過程的速度,使得模型能夠更快地收斂和學習數據的特征。 對于AI模型推理階段,算力用于將已訓練好的模型應用于新的數據實例進行預測和推斷。在實時應用中,算力的高低決定了模型能夠處理的請求量和響應速度。
web3音樂公司Sound宣布完成2000萬美元A輪融資:金色財經報道,web3音樂公司Sound宣布完成2000萬美元A輪融資,a16z crypto領投,其他參與者包括 Palm Tree Crew、A Capital、Sound Ventures、Collab +Currency、Scalar Capital、Snoop Dogg、Ryan Tedder 和 Tay Keith。Sound 創始人告訴 The Block,該公司將利用這筆資金來擴大其團隊并擴大其 web3 音樂戰略。[2023/7/12 10:51:10]
許多復雜的AI算法需要大量的計算資源。傳統AI的發展受限于硬件設備的性能和計算能力。尤其是在處理大規模數據集或進行高度復雜的模型訓練時,需要更強大的計算能力。
二層跨鏈計算平臺CoinWeb完成200萬美元融資:金色財經報道,二層跨鏈計算平臺CoinWeb宣布完成200萬美元融資,在開曼群島和英屬維爾京群島注冊的持牌基金管理公司SAVA Investment Management參投。Coinweb支持在多個不同的區塊鏈之上運行去中心化應用程序,允許應用程序開發人員結合每個區塊鏈的最佳屬性和功能,2022年推出跨鏈代幣化平臺LinkMint,旨在降低企業客戶的入場門檻。(digitaljournal)[2023/4/6 13:48:50]
目前,市面上對智能算力的共享還缺乏成熟的產品和方案,傳統的算力市場引入個人終端等第三方社會閑散算力,而算力服務運營者不具備對節點的有效掌控能力,并不能保證算力節點自身的安全與可信,使得安全防護的廣度和難度大幅提升。
Diem前首席運營官Bertrand Perez將加入Web3基金會擔任COO:金色財經報道,由 Facebook 支持的 Diem 穩定幣項目的前首席運營官 Bertrand Perez 將加入 Web3 基金會擔任首席運營官。Perez于 2019 年初加入 Diem(當時稱為天秤座)擔任首席運營官,他表示,在今年夏天辭去了職務,原因是決定將該項目從瑞士金融監督機構FINMA的監管下轉移到美國本土監管。[2021/9/7 23:07:24]
數據基于隱私保護的數據共享是AIGC建模的重要支撐。
在數據提供方面,AIGC的模型訓練需要使用大量的數據來獲得良好的性能,提升模型的推理能力和準確性。以ChatGPT為例,GPT的訓練使用了數百億個令牌(tokens)的數據。作為一個大型的AI語言模型,GPT的訓練數據包括了互聯網上廣泛的文本來源,包括網頁、書籍、文章、論文和其他公開可用的文本資源。這些數據覆蓋了多個領域和主題,使得模型能夠具備廣泛的知識和語言理解能力。
ChainSafe 獲得以太坊基金會資助,將維護 Web3JS 項目:加拿大科技公司ChainSafe宣布獲得以太坊基金會的資助,將維護并開發Web3JS代碼庫,而之前該項目的代碼庫由以太坊基金會維護。ChainSafe表示,Web3JS是區塊鏈領域下載量最大的JS庫之一,有成千上萬的用戶依賴于該庫,ChainSafe也剛剛發布了他們接過Web3JS之后的第一個版本1.3.0-rc.0。另外,ChainSafe也是以太坊2.0客戶端Lodestar的開發者。[2020/9/5]
總而言之,訓練一個AI大模型需要海量的數據,單一企業的內部數據往往不足以滿足需求,因此這個過程中需要數據共享,然而全球數據量在飛速增長的同時,數據共享帶來的隱私泄露嚴重影響了數據價值的充分利用。IBM Security2022年7月份的報告顯示,2021 年 3 月至 2022 年 3 月期間全球 550 家企業出現的數據泄露事件,平均一起數據泄露產生的損失達到 440 萬美元,相比較2020年損失增加了13%,因此如何在保證數據隱私安全的前提下,進行數據流通和價值挖掘,并服務于AIGC技術的成長,成為業內日益關注的一個話題。
Web3作為建立在區塊鏈和去中心化技術之上的新一代互聯網,具有更大的去中心化、開放性和透明度。當AI結合Web3時,它可以獲得許多與傳統AI不同的優勢。
Web3的去中心化特性使得全球范圍內的計算資源能夠被整合和共享。這為AI模型訓練和推理提供了更大規模的計算能力。傳統AI模型訓練通常依賴于單一的計算設備或云服務提供商,而結合Web3可以利用全球網絡中的分布式計算資源,提供更高效和彈性的算力支持。
Web3的核心概念之一是去中心化和用戶掌握數據的權力。結合AI,Web3可以為用戶提供更多控制權和數據共享的機會,使其能夠以更加隱私安全的方式參與AI模型的訓練和數據共享。
Web3的智能合約和分布式計算平臺可以促進AI模型的開發和部署。智能合約可以提供去中心化的方式來管理和驗證模型的訓練過程,同時分布式計算平臺可以利用全球網絡中的計算資源來加速模型的訓練和推理。
Web3可以通過激勵機制和去中心化的數據市場,促使用戶提供更多高質量、多樣性的數據,從而改善傳統AI所面臨的數據限制問題。
Waterwheel的算力網絡結合TEE技術和區塊鏈技術構建一個可信、公開、高效的算力共享平臺,具備全網算力節點和區塊鏈節點的統籌盤點能力,能夠納管全球各地的閑置算力。
Waterwheel是基于區塊鏈和隱私計算打造去中心化的數據共享平臺,建設覆蓋全球的數據資產網絡,支持數據貢獻者個人進行數據登記和參與數據眾籌任務,并通過隱私計算技術解決數據流通過程中數據泄漏的安全問題,在保證數據安全隱私的前提下,為數據貢獻者帶來價值收益。
傳統的AIGC同樣缺乏隱私保護,用戶的獨特創意通過prompt輸入絕大部分會被直接公開,不同的AI模型提供和計費方式,也使用戶付出了更高的成本,由于AIGC的創作過程主要由AI模型完成,創作者很難通過傳統的版權交易方式獲得合理的收益。
Waterwheel融合區塊鏈、隱私計算、AI技術,打造安全可信的模型訓練平臺,通過使用隱私計算TEE技術的遠程證明和隱私環境,解決模型訓練方、數據提供方和算力提供方之間的互相不信任和數據泄漏風險的問題,保證模型訓練的全流程中,數據和模型處于“可用不可見”的狀態,幫助AI模型訓練方安全合規獲取更多的數據,同時將AI模型托管在隱私環境中,保證模型的安全和隱私性。
期待看到更多Web3.0平臺推動AI行業的發展和應用!
金色早8點
Odaily星球日報
金色財經
Block unicorn
DAOrayaki
曼昆區塊鏈法律
在講遞歸銘文之前,這里先普及一下什么是 Ordinals 和 Brc20。Ordinals 協議是一個為聰編號的系統,賦予每個聰序列號,并在交易中追蹤它們.
1900/1/1 0:00:00作者:金色財經,36度區塊鏈 摘要 6月14日,全國政協委員、香港特區立法會議員吳杰莊在推特宣布與加密貨幣交易所Coinbase取得聯系,探討Coinbase在香港發展的機會.
1900/1/1 0:00:00作者:Osgur Murphy O Kane、Frank Fu、Yohji Van Weert;編譯:Luffy.
1900/1/1 0:00:00作者:31 | Trader,來源:作者推特@althunter31四月上線主網,僅兩個月 TVL 翻了幾十倍,占了整個 #LSDfi 賽道 TVL 的 38.9%.
1900/1/1 0:00:00作者:0x1987 摘要 近期美國SEC起訴幣安,并將多個代幣認定為證券,引發市場對于山寨幣的拋售,恐慌情緒蔓延.
1900/1/1 0:00:00引言 多鏈是未來的發展趨勢,可擴展性的追求將 Ethereum 引向了 Rollup 技術的搭建。在轉向模塊化區塊鏈的過程中,人們再次關注到了應用鏈.
1900/1/1 0:00:00