比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

手把手教你用 AIGC 賦能 Web3 項目_AIG

Author:

Time:1900/1/1 0:00:00

近期“AI+Web3”的熱度上升,相關概念 Token 也迎來了一波漲幅,由于很多加密圈的朋友并不是非常了解 AIGC,這可能會導致投資失誤或者錯過潛在的機會。我從去年 1 月份開始關注AIGC,親身經歷了 2022 年 AIGC 技術和產業的高速發展,今天我就跟大家簡單解讀一下現在 AIGC 的發展格局、AI+Web3 項目的現狀以及如何使用 AIGC 工具創作 Web3 資產。

從模型功能上區分,目前 AIGC 主要涉及文字、圖片、音樂和視頻的生成(本文主要分析AIGC即人工智能生成內容領域,暫不涉及其他 AI分支)。

文字模型現象級應用當屬 OpenAI 的 ChatGPT,續寫文字、創作故事、寫代碼、修BUG、寫詩、做表...... 你所有能想象到的與文字相關的內容它都可以做。它可以極大程度上減少人的工作量,使用得當將會是文字工作者的利器。現在媒體平臺上很多文章都是用 AI 寫的,這一領域有很多潛在的機會,解決實際問題,創造新的工作流,打造商業閉環是我們這些使用工具的人需要去考慮的事情。

ChatGPT 可以幫助開發人員完成大量的代碼編寫工作,還可以查找修改錯誤,當然它有可能出錯,在使用中需要留意,盡信書不如無書。

此外,各類建議、策劃、編撰等文字工作是它最擅長的,對于文字工作者來說,ChatGPT絕對是超強的輔助工具。

但是 ChatGPT 不是萬能的,你可以將其定義為一個什么都懂一些的“全才”,但它卻不是精通一切的“專家”。對于某些比較專業的知識,它的回答可能會出錯,這包括但不限于編程細節、密碼學、數學、歷史等領域,所以在使用 ChatGPT 的時候最好對內容再復核一遍,以免出現嚴重錯誤,在最近的版本更新中,ChatGPT 很多錯誤點已經得到了修正,隨著模型的逐步完善,未來的想象力是無限的。

AI 生成圖片是 AIGC 領域發展最快的賽道,2021 年最火的技術還是生成對抗網絡(GAN),但是它距離產品化還有很長的距離;到了 2022 年初,Disco Diffusion 橫空出世引發了第一波 AIGC 爆點,Disco Diffusion 擅長對場景的刻畫,出圖場面恢弘大氣,但是畫面不夠清晰,作圖速度慢,要以10分鐘計數;4月份,OpenAI 的 DALLE 2 上線,7月份 Midjourney 開放公測,使用Discord 端作畫,1 分鐘之內可以同時出 4 張圖,藝術性超高,在 11 月份發布 V4 版本后進一步穩固了自己最強 AI 作畫工具的地位;8 月份,Stable Diffusion 正式發布,作圖速度縮短至 10 秒之內,圖片細節、清晰度都有極大的提升,并且奉行開源主義,所有代碼都開源,這也誕生了龐大的社區,是之后世界范圍內 AIGC 流行的火種,包括后面基于 Stable Diffusion 訓練的專門生成二次元圖像的 NovalAI。

美國眾議院金融服務委員會:穩定幣有望徹底改變我們的支付系統:金色財經報道,美國眾議院金融服務委員會在官方社交賬號表示,穩定幣有望徹底改變我們的支付系統。要使這一創新技術充分發揮其潛力,明確的法規和強有力的消費者保護是必不可少的。兩黨聯合提出的《穩定幣支付清晰度法案》可同時實現這兩點。[2023/8/9 21:33:34]

如今 AI 作圖領域呈現 Midjourney + Stable Diffusion 的雙巨頭局勢,Disco Diffusion 和 DALLE2 在技術更新上已經離開了第一梯隊,其余產品大多都是基于Stable Diffusion 的開源框架調整的。

AI 生成音樂和視頻是一個發展相對較慢的賽道,至今還沒有現象級應用,市場上存在的產品均不太成熟,其在技術難度上比生成圖片和文字要大,但是已經有很多公司準備在 2023 年攻克這個難題,或許我們馬上就能看到比較成熟的視頻和音樂生成平臺。下面我挑選幾個相對優秀的產品簡單介紹一下。

AI 生成音樂最常見的玩法是用戶輸入一段文字或者一張圖片,模型根據內容輸出一段音樂,對應的產品可以關注 Riffusion,它除了實現以上功能外還能在不同風格輸入之間自然轉換。

AI生成視頻可以體驗產品 QuickVid,它可以在很短的時間內根據文字描述生成一段流暢的視頻,你還可以選擇不同使用場景下的視頻風格,視頻質量較高,與人為剪輯的效果差別不大。

AIGC 可以助力 Web3 項目更快更好的完成文字和圖片的設計工作,這在 NFT 和 GameFi 項目中應用最為廣泛,但是這也需要一定的技巧,使用恰當的 Prompt 使 AIGC 輸出可用的圖片,并使用 ChatGPT 完成項目文案相關工作,描述詞的使用有很多講究,成為一名AI藝術家需要很多的前期學習,為了讓大家快速完成需求,下面我簡單說幾種使用 AIGC 輸出 Web3 可用圖像的方法。

有一些特殊的 Prompt 可以控制模型輸出特定風格的圖片,這些圖片可以直接拿來作為NFT或者 GameFi 內素材使用,版權屬于創作者自己。下面我使用 Stable Diffusion 做一些示范(stable diffusion 開源免費試用,每個人都可以嘗試)。直接復制我下面的描述詞,自己定義括號中的內容。

國家市場監管總局:2022 年數字藏品等新模式監管難度加大:金色財經報道,國家市場監管總局發文《2022 年消費者投訴舉報呈現十大特點》,其中“新消費熱點不斷涌現,伴隨引發的消費糾紛走高”第六個特點中提到,2022 年,數字藏品(NFT)等新模式問題抬頭,監管難度加大,相關訴求 5.97 萬件(上一年僅 198 件),主要集中在不發貨、不退款、惡意哄抬價格、收取高額手續費、隨意封禁消費者賬號等。“盲盒”熱潮下,消費者訴求高達 4.14 萬件,同比增長 61.72%。IP 跨界聯名產品掀起搶購狂潮,相關訴求 3.81 萬件,同比增長 66.96%,某些商家借機抬高價格,而產品質量參差不齊、假冒偽劣、發貨拖延、售后服務缺失等問題突出。[2023/3/14 13:03:44]

注:只需要改變括號中的內容就可以得到相同類型的圖片,示例文字順序=圖片順序,圖片內角色依次為 Yoda、Superman、ironMan、MaiShiranui、shark、batman、Bumblebee和wizard。你可以嘗試所有其他可能性。

Funky pop (Yoda/Superman/iron Man/Mai Shiranui/shark/batman/Bumblebee/wizard) figurine, made of plastic, product studio shot, on a white background, diffused lighting, centered

這類圖片直接發一個 NFT 項目綽綽有余,每個都是 1/1,你只需要告訴 AI 想要什么。

這段描述詞中的 temple 可以改也可以不改,都可以做出不錯的效果圖。

Tiny cute isometric temple, soft smooth lighting, soft colors, soft colors, 100mm lens, 3d blender render, trending on polycount, modular constructivism, blue blackground, physically based rendering, centered

這類圖片可以構建一個土地NFT項目或者游戲中的建筑。

LayerZero Labs:存在硅谷銀行清算賬戶中的金額可以忽略不計:金色財經報道,據全鏈互操作性協議LayerZero開發公司Layerzero Labs首席執行官兼聯合創始人Bryan Pellegrino在社交媒體確認,該項目在硅谷銀行的敞口“實際上為0”,而且存放在硅谷銀行清算賬戶中的金額幾乎可以忽略不計(大約只占到LayerZero總流動資金的0.3%),大部分資金規模也都在美國聯邦存款保險公司(FDIC)的限額范圍之內,所以一切都還好。[2023/3/11 12:56:07]

通過改變粗體內容,生成不同的矢量動物形象

kawaii low poly panda character, 3d isometric render, white background, ambient occlusion, unity engi

可改變粗體內容,生成不同的房間

Tiny cute isometric living room in a cutaway box, soft smooth lighting, soft colors, purple and blue color scheme, soft colors, 100mm lens, 3d blender render

通過以上案例我們可以看到,AIGC 可以在圖片設計上輔助甚至取代畫師,你可以創造出獨一無二的藝術風格、角色,而不需要掌握繪畫的技巧,這是生產力的極大進步。

以上工作流使用的是開源的 Stable Diffusion 通用模型,它無法生成模型素材中不存在的東西,比如你無法讓它生成一只無聊猿,模型本身也不知道什么是無聊猿,所以它存在局限性和時效性。為了解決以上提到的問題,我們可以訓練自己的模型,將需要的素材都放進去,從而使模型輸出內容符合我們的預期,這在 NFT 二創、擴展,GameFi 輔助設計等方面都有很大的應用潛力。

展示幾張我訓練的無聊猿模型二創成圖效果,從左到右分別是蝙蝠俠風格,黏土風格,畢加索抽象風格和黃金材質:

拉丁美洲數字支付公司Ripio在巴西推出預付加密卡:金色財經報道,拉丁美洲數字支付公司Ripio首席執行官Sebastian Serrano表示,Ripio已經開始在巴西推出一種預付借記卡,允許用加密貨幣支付,并獲得比特幣的現金回饋獎勵。該公司希望在年底前發行25萬張卡,向其在南美國家的100萬用戶提供該產品。這些卡是與Visa合作開發的。該公司表示,該卡將允許使用巴西官方貨幣巴西雷亞爾和28種加密貨幣進行支付。Serrano表示Ripio正在考慮增加比特幣以外的加密貨幣的獎勵。

Serrano說,該公司還計劃今年晚些時候在阿根廷推出該卡,并且不排除在該公司運營的其他國家推出該卡,如烏拉圭、哥倫比亞、墨西哥和西班牙。(CoinDesk)[2022/8/24 12:44:09]

當然也可以控制生成與原本項目圖片相似度極高的圖片,下列四張圖片有兩張原圖,兩張用無聊猿模型生成的圖,幾乎很難分辨,你可以猜一下,后面我會揭曉答案。

模型訓練原理很簡單,用自己提供的圖片訓練出一個專屬模型,但是讓普通人從零開始訓練一個AIGC模型是很困難的,好在Stable Diffusion 給我們提供了一些比較簡單的模型訓練方法。

現在常用的技術方案有三種:Fine-Tuning、DreamBooth、Textual-Inversion

特性解釋:

Fine-Tuning -- 模型訓練、原生框架

優點:功能最全,效果最好,prompt 控制精確,是優質精細模型的統一技術方案

缺點:訓練復雜,硬件要求高,訓練時間長,訓練圖片需要標記詞

DreamBooth -- 模型訓練、簡易框架、添加特殊標識符

優點:訓練簡單、速度快、硬件要求相對低、不需要精確的圖片標記詞,能較好地生成不同風格的圖片,開放模型最常用方案

缺點:受限于 [X][類別] 的表示方式,訓練SD模型中不存在的類效果會差一些,整體出圖質量低于Fine-Tune,模型文件:2-4G

Textual-Inversion -- 新定義特征向量,不改變模型本身

優點:需要圖片數量少:3-5張,訓練文件小:幾十KB

缺點:對于原SD中不存在的創新的物體、畫風等出圖效果不好,暫無商業用例

綜合考慮成本與難度,新手推薦使用 DreamBooth 訓練自己的模型,這里我給大家找了一個最簡單的Colab版本,它可以使用谷歌免費的服務器訓練模型并生成圖片,前期需要處理的素材也最少。

穩定幣市值占比近2個月從9.35%上升至近14%:6月13日消息,大約兩個月前的4月11日,穩定幣市值為1900億美元,即將超過2000億美元,加密貨幣總體市值為2.03億美元,當時穩定幣市值占比為9.35%。

目前加密貨幣市值約為1.15萬億美元,穩定幣市值為1590億美元,占比上升至13.8%,其中USDT占6%以上,USDC占比超4%,BUSD占比為1.58%。(Bitcoin.com)[2022/6/13 4:20:48]

訓練模型之前,你需要訓練使用的準備圖片,初次嘗試最好在10張左右,尺寸512*512,如果圖片尺寸不合適可以使用 BIRME 等工具調整。

打開上面的鏈接,也就是:https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb

主頁顯示如下,這是一個即時更新的頁面,它不會保存你的更改,你可以直接在這個頁面使用,或者點擊“文件”選擇“在云端硬盤中保存一份副本”,打開副本頁,這個頁面會保存你的所有更改。

之后我們開始模型訓練,首先點擊第一行的運行按鈕,連接Google云端硬盤,安裝到gdrive。

運行完成后在按鈕前面會出現綠色的對勾,右上角RAM/磁盤也出現綠色對勾,后面每段程序運行完成的標志都是這個小對勾。上一段程序運行結束后,點擊下一段的按鈕繼續運行。

接下來安裝依賴,下載模型

開始正式訓練,首先為你的模型起個名字。

上傳圖片,點擊運行后會出現“選擇文件”按鈕,選定圖片后上傳,我這里選擇了八張 CloneX 的圖片作為訓練素材,并為它們命名為 CloneX1-8,這里對圖片的命名不要與已有單詞相同,它是對你訓練素材的特殊標記。圖片命名方式可以參考下圖。

運行 Captions,并跳過 Concept images

開始訓練,訓練步數設置為圖片數量*100,我是用了八張圖片,這里選擇 800,其他參數暫時不需要調整,等后面熟練掌握了模型訓練方法再進行更精準的訓練。

點擊運行,出現以下界面表示訓練開始,等待訓練完成。這里有兩個訓練過程,一個是訓練文字,一個是訓練圖片。

訓練完成后直接運行測試模型,這里不需要調整參數。

程序運行完后會出現一個鏈接,點擊打開到可以作圖的 WebUI 界面。

WebUI 的主頁如下,1處選擇使用的模型,2處輸入描述詞,也就是你對想要輸出圖片的內容,3處輸入負面描述詞,也就是你不想要圖片出現什么內容,3可以空著不填。填寫完描述詞后點擊生成圖片。

因為我們對圖片的標記是CloneX,所以我們生成圖片時前部分要指定主體,這里推薦固定句式“a picture of clonex with + ......”,with 后面加對圖片的描述,每個描述詞(短語)之間用逗號隔開。

簡單測試,這里輸入提示詞“a picture of clonex with beautiful girl, red hair”,結果應該會出現一個紅色頭發的女生CloneX形象,效果如下圖:

測試2,輸入提示詞:“a picture of clonex with beautiful girl, Long green hair, black coat, yellow eyes”也就是綠色長發、黑色外套、黃色眼鏡的女CloneX,生成效果如下

從以上兩個簡單測試來看,用10張以內的素材圖片訓練的模型就可以很好的生成想要的圖片,而且這些CloneX是原本不存在的,是你創造了它們!以后喂10張圖給AI,它可以給你10,000張圖,這是生產力質的提升。

我把這個訓練的模型上傳到了 Huggingface,有興趣的朋友可以拿去玩,在訓練過程中遇到什么問題也可以聯系我。鏈接:https://huggingface.co/wheart/clonexnft

揭曉答案,無聊猿那四張圖片,前兩張是AI生成的,后面兩張是原圖。

隨著 AIGC 的興起、ChatGPT 的爆火、微軟對 AI 百億投資等事件的鋪墊,Crypto 很多 AI 項目也得到了更多的關注,諸如 AGIX 之類的 AI 概念 Token 都迎來了一波不錯的漲幅。但是就目前這些 AI+Web3 的項目來看,我并沒有發現真正有想象力的產品。這段時間受到關注的項目大都是很久之前的老項目,所以只能看作是版塊輪動帶動了它們,長線來看沒有好的標的。如果后面出現基于新 AI 技術做的產品或許可以關注。

目前很多 Crypto 大佬,像 CZ、Vitalik 都對 AI 技術產生了興趣,所以對于 AI+Web3 之后的發展,我個人認為還是值得期待的。

綜合來看,目前 AIGC 在 Web3 的應用還處于非常初級的階段。現階段利用好 AI 工具可以對項目的設計、開發、運營工作提供極大的便利,下一階段肯定會出現更多優秀的產品,我們要做的就是學習、使用、分析、發現,比大部分人多走一步,不錯過 AIWeb3 這趟車。

文心

個人專欄

閱讀更多

金色財經

金色早8點

Odaily星球日報

Arcane Labs

澎湃新聞

歐科云鏈

深潮TechFlow

MarsBit

BTCStudy

鏈得得

Tags:AIGIONIGCFusionAIGENIUS價格Shib Original Visionigc幣是真的嗎Fusion Heroes

萊特幣價格
SEC打擊BUSD DeFi穩定幣會迎來新的發展契機嗎?_FRA

原文作者:Ignas,DeFi 研究員 原文編譯:0x11 DeFi 穩定幣在 UST 崩潰之中受到重擊,但 DAI、FRAX 和 LUSD 依然保持堅挺.

1900/1/1 0:00:00
以太坊:一個示例解釋Vitalik的以太坊隱私解決方案_ALI

以太坊的聯合創始人Vitalik Buterin前段時間發表了一篇文章,該文章主要討論的是如何通過所謂的“隱身地址”來為以太坊網絡增加隱私.

1900/1/1 0:00:00
比特幣開發者解讀Nostr如何構建去中心化社交網絡_比特幣

文/ Raj arshimaitra,比特幣開發者,Rust-Nostr作者;譯/金色財經xiaozou 1、Nostr基本介紹 Nostr是一個非常輕量級的開放協議.

1900/1/1 0:00:00
觀點:美國對加密貨幣的打擊就打在這點上_FTX

在FTX崩盤后,許多人都在擔心和猜測監管打擊行動的腳步會越來越近。本周,我們看到加密貨幣交易所krakan同意停止向美國用戶提供質押服務,該公司還向監管該國證券的美國實體-美國證券交易委員會-支.

1900/1/1 0:00:00
實戰演示:如何從0至1實現WEB3項目的爆發性增長?_DAO

來源:“人人都是產品經理”(ID:woshipm) 作者:王宇庭 經歷大起大落,WEB3也開始在新年出現回暖行情,1月1日,茅臺發布元宇宙APP,火爆全網.

1900/1/1 0:00:00
“胖協議”還是“胖應用”?Web3 技術堆棧中的最大價值在哪里?_SWAP

作者:Michael Nadeau來源:The DeFi Report本周我們將深入探討一個價值數十億美元的問題:在 Web3 技術堆棧中.

1900/1/1 0:00:00
ads