來源:量子位
開源AI繪畫扛把子,StableDiffusion背后公司StabilityAI再放大招!
全新開源模型DeepFloydIF,一下獲星2千+并登上GitHub熱門榜。
DeepFloydIF不光圖像質量是照片級的,還解決了文生圖的兩大難題:
準確繪制文字。
以及準確理解空間關系。
Starknet發布路線圖,將于2024年重點實現去中心化:4月25日,據官方消息,StarkWare發布文章明確以太坊二層解決方案Starknet 2023年目標和路線圖。根據路線圖,Starknet 2023年將主要開發重點放在提升網絡性能和UX上,其中包括提升網絡效率、降低交易成本以及實現費用市場等。此外,Starknet表示計劃于2024年重點實現運營和決策層面的去中心化。[2023/4/25 14:24:57]
網友表示,這可是個大事,之前想讓Midjourneyv5在霓虹燈招牌上寫個字AI都是瞎劃拉兩筆,對于鏡子理解的也不對。
0xscope:此前轉移總供應量7%的StarkNet代幣STRK,或系分發初始分配:1月9日消息,Web3知識圖譜協議0xscope發推表示,其研究員Bobie發現0x5c21開頭地址10小時前進行了43筆鏈上轉賬,轉移了694,895,781枚StarkNet代幣STRK,約占代幣總供應量的7%,且這部分代幣由StarkNet代幣鑄造合約此前轉入的634,725,965枚STRK和早期分發的剩余部分(12月6日、12月15日、12月22日、12月29日)組成,其中12個LockedTokenGrant合約地址之前沒有收到過轉賬,23個其他地址在1月3日和1月5日收到了來自0x5c21 的測試轉賬,2個地址在12月22日收到測試轉賬。0xscope猜測這可能是StarkNet正在分發其初始分配。[2023/1/9 11:02:30]
博報堂將與Astar開發公司Stake Technologies成立Web3合資企業:9月27日消息,日本廣告公司博報堂(Hakuhodo)與波卡平行鏈Astar Network的開發公司Stake Technologies將在2022年成立合資企業,幫助客戶在波卡平行鏈Astar Network建立Web3業務,以滿足加密相關業務的日本公司的需求。(日本經濟新聞)[2022/9/27 22:32:28]
使用DeepFloydIF,可以把指定文字巧妙放置在畫面中任何地方。
霓虹燈招牌、街頭涂鴉、服飾、手繪插畫,文字都會以合適的字體、風格、排版出現在合理的地方。
Blockstack推出分散式應用商店指南:分散式網絡開發公司Blockstack推出分散式應用程序指南app.co,邁出成為dapp開發人員專用商店的第一步。 聯合創始人Ryan Shea表示,公司正在啟動資源,旨在橋接去中心化應用開發人員和潛在用戶,并認為“這是分散式應用開發和探索的關鍵時刻”。[2018/5/17]
這意味著,AI直出商品渲染圖、海報等實用工作流程又打通一環。
還在視頻特效上開辟了新方向。
目前DeepFloydIF以非商用許可開源,不過團隊解釋這是暫時的,獲得足夠的用戶反饋后將轉向更寬松的協議。
比特幣在Bitstamp平臺重回17000美元關口:據比特幣交易平臺Bitstamp,比特幣重新站上17000關口,日內漲幅逾13%。[2018/1/6]
有需求的小伙伴可以抓緊反饋起來了。
像素級圖像生成
DeepFloydIF仍然基于擴散模型,但與之前的StableDiffusion相比有兩大不同。
負責理解文字的部分從OpenAI的CLIP換成了谷歌T5-XXL,結合超分辨率模塊中額外的注意力層,獲得更準確的文本理解。
負責生成圖像的部分從潛擴散模型換成了像素級擴散模型。
也就是擴散過程不再作用于表示圖像編碼的潛空間,而是直接作用于像素。
官方還提供了一組DeepFloydIF與其他AI繪畫模型的直觀對比。
可以看出,使用T5做文本理解的谷歌Parti和英偉達eDiff-1也都可以準確繪制文字,AI不會寫字這事就是CLIP的鍋。
不過英偉達eDiff-1不開源,谷歌的幾個模型更是連個Demo都不給,DeepFloydIF就成了更實際的選擇。
具體生成圖像上DeepFloydIF與之前模型一致,語言模型理解文本后先生成64×64分辨率的小圖,再經過不同層次的擴散模型和超分辨率模型放大。
在這種架構上,通過把指定圖像縮小回64×64再使用新的提示詞重新執行擴散,也實現以圖生圖并調整風格、內容和細節。
并且不需要對模型做微調就可直接實現。
另外,DeepFloydIF的優勢還在于,IF-4.3B基礎模型是目前擴散模型中U-Net部分有效參數是最多的。
在實驗中,IF-4.3B取得了最好的FID分數,并達到SOTA。
誰是DeepFloyd
DeepFloydAIResearch是StabilityAI旗下的獨立研發團隊,深受搖滾樂隊平克弗洛伊德影響,自稱為一只“研發樂隊”。
主要成員只有4人,從姓氏來看均為東歐背景。
這次除了開源代碼外,團隊在HuggingFace上還提供了DeepFloydIF模型的在線試玩。
我們也試了試,很可惜的是目前對中文還不太支持。
原因可能是其訓練數據集LAION-A里面中文內容不多,不過既然開源了,相信在中文數據集上訓練好的變體也不會太晚出現。
OneMoreThing
DeepFloydIF并不是StabilityAI昨晚在開源上的唯一動作
語言模型方面,他們也推出了首個開源并引入RLHF技術的聊天機器人StableVicuna,基于小羊駝Vicuna-13B模型實現。
目前代碼和模型權重已開放下載。
完整的桌面和移動界面也即將發布。
DeepfloydIF在線試玩:
https://huggingface.co/spaces/DeepFloyd/IF
代碼:
https://github.com/deep-floyd/IF
StableVicuna在線試玩:
https://huggingface.co/spaces/CarperAI/StableVicuna
權重下載:
https://huggingface.co/CarperAI/stable-vicuna-13b-delta
參考鏈接:
https://deepfloyd.ai/deepfloyd-if
https://stability.ai/blog/deepfloyd-if-text-to-image-model
https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot
https://stable-diffusion-art.com/how-stable-diffusion-work/
原文作者:ThorHartvigsen,加密?KOL原文編譯:Felix,PANews四月份,部分?VC?和聰明錢有一些大的投資組合變化.
1900/1/1 0:00:00自人類歷史的黎明以來,集體故事一直定義著我們的文化,并豐富了我們對世界的理解;講故事的人一直是塑造這些敘事的推動力.
1900/1/1 0:00:00NFT作為可以代表獨一無二的數字資產或實物資產的加密代幣,它在區塊鏈上具有唯一性和不可替代性。NFT在以太坊等智能合約平臺上已經發展了多年,誕生了許多著名的項目和應用.
1900/1/1 0:00:00來源|Decrypt 編譯|潮外音 加密貨幣交易所Coinbase報告第一財季出現虧損,但這家總部位于舊金山的公司受到加密貨幣寒冬的影響遠低于預期.
1900/1/1 0:00:00作者:胡描編輯:羅麗娟 今年以來,游戲公司紛紛投資AI公司、成立AIlab、自建AI模型。無論是AIGC對游戲制作的降本增效,還是其沖破當前游戲工業化極限的可能性,都讓游戲企業成為了新一輪AI浪.
1900/1/1 0:00:00隨著近兩周BRC-20走熱,比特幣交易費用飆升。BTC.com數據顯示,BTC每日手續費從兩周前的13.6BTC增長至403.9BTC,兩周增幅2870%?,創下自2018年1月20日以來的最高.
1900/1/1 0:00:00