比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > Gate.io > Info

Stability AI 連扔兩個王炸!首個開源 RLHF 模型登基,DeepFloyd IF 像素級出圖_TAB

Author:

Time:1900/1/1 0:00:00

來源:新智元

開源先鋒StabilityAI一天扔了兩枚重磅炸彈:發布史上首個開源RLHF大語言模型,以及像素級圖像模型DeepFloydIF。開源社區狂喜!

最近,大名鼎鼎的StableDiffusion背后的公司,一連整了兩個大活。

首先,StabilityAI重磅發布了世上首個基于RLHF的開源LLM聊天機器人——StableVicuna。

StableVicuna基于Vicuna-13B模型實現,是第一個使用人類反饋訓練的大規模開源聊天機器人。

有網友經過實測后表示,StableVicuna就是目前當之無愧的13BLLM之王!

對此,1xexited創始人表示,這可以看作是自ChatGPT推出以來的第二個里程碑。

另外,StabilityAI發布了開源模型DeepFloydIF,這個文本到圖像的級聯像素擴散模型功能超強,可以巧妙地把文本集成到圖像中。

這個模型的革命性意義在于,它一連解決了文生圖領域的兩大難題:正確生成文字,正確理解空間關系!

秉持著開源的一貫傳統,DeepFloydIF在以后會完全開源。

StailibityAI,果然是開源界當之無愧的扛把子。

StableVicuna

世上首個開源RLHFLLM聊天機器人StableVicuna,由StabilityAI震撼發布!

Cosmostation公布2023年路線圖,計劃將Mintscan發展為跨鏈分析和儀表盤應用程序:1月5日消息,Cosmos網絡區塊瀏覽器服務商Cosmostation公布其2023年路線圖。其表示,2023年將致力于構建協議基礎設施,將其基于Cosmos-SDK網絡的區塊瀏覽器Mintscan發展成為跨鏈分析和儀表盤應用程序,并添加如下新功能:跨鏈安全、鏈間安全、跨鏈及其他領域的綜合API/RPC服務、為Interchain及其他領域提供動力、專注于智能合約和DApp可訪問性等。[2023/1/5 10:23:20]

一位Youtube主播對StableVicuna進行了實測,StableVicuna在每一次測試中,都擊敗了前任王者Vicuna。

所以這位Youtuber激動地喊出:StableVicuna就是目前最強大的13BLLM模型,是當之無愧的LLM模型之王!

StableVicuna基于小羊駝Vicuna-13B模型實現,是Vicuna-13B的進一步指令微調和RLHF訓練的版本。

而Vicuna-13B是LLaMA-13B的一個指令微調模型。

從以下基準測試可以看出,StableVicuna與類似規模的開源聊天機器人在整體性能上的比較。

StableVicuna可以做基礎數學題。

Gate.io 將于8月6日開啟Startup項目Gamestarter認購通道:據官方公告,Gate.io將于8月6 日 18:00 -8 月7日 10:00開啟Startup項目Gamestarter (GAME)認購通道,16小時內有效下單同等對待。用戶需要參與認購時需要同意 DAO 鎖倉 15 天才能參與認購。用戶鎖倉后到 8月7日12 點之前,請務必保證現貨交易賬戶中有不低于鎖倉數額的DAO 和足夠的付款 USDG 金額, 鎖倉數額的 DAO 或者付款USDG不足的,自動排除在有效訂單之外。當日認購結束后,系統將統計所有符合條件的鎖倉。[2021/8/3 1:31:20]

可以寫代碼。

還能為你講解語法知識。

開源聊天機器人平替狂潮

StabilityAI想做這樣一個開源的聊天機器人,當然也是受了此前LLaMa權重泄露引爆的ChatGPT平替狂潮的影響。

從去年春天Character.ai的聊天機器人,到后來的ChatGPT和Bard,都引發了大家對開源平替的強烈興趣。

這些聊天模型的成功,基本都歸功于這兩種訓練范式:指令微調和人類反饋強化學習(RLHF)。

這期間,開發者一直在努力構建開源框架幫助訓練這些模型,比如trlX、trl、DeepSpeedChat和ColossalAI等,然而,卻并沒有一個開源模型,能夠同時應用指令微調和RLHF。

大多數模型都是在沒有RLHF的情況下進行指令微調的,因為這個過程十分復雜。

最近,OpenAssistant、Anthropic和Stanford都開始向公眾提供RLHF數據集。

StabilityAI把這些數據集與trlX提供的RLHF相結合,就得到了史上第一個大規模指令微調和RLHF模型——StableVicuna。

Standard與Plasm達成合作,Standard將在Plasm上構建智能合約版本:據官方消息,波卡生態的混合式抵押彈性供應穩定幣協議Standard宣布與Plasm達成合作,Standard將在Plasm上構建智能合約版本,Standard將從其平行鏈向Plasm提供預言機信息,以生成虛擬股票和虛擬大宗商品等相關合成資產。[2021/5/25 22:42:05]

訓練過程

為了實現StableVicuna的強大性能,研究者利用Vicuna作為基礎模型,并遵循了一種典型的三級RLHF管線。

Vicuna在130億參數LLaMA模型的基礎上,使用Alpaca進行調整后得到的。

他們混合了三個數據集,訓練出具有監督微調(SFT)的Vicuna基礎模型:

OpenAssistantConversationsDataset(OASST1),一個人工生成的、人工注釋的助理式對話語料庫,包含161,443條消息,分布在66,497個對話樹中,使用35種不同的語言;

GPT4AllPromptGenerations,由GPT-3.5Turbo生成的437,605個提示和響應的數據集;

Alpaca,這是由OpenAI的text-davinci-003引擎生成,包含52,000條指令和演示的數據集。

研究者使用trlx,訓練了一個獎勵模型。在以下這些RLHF偏好數據集上,研究者得到了SFT模型,這是獎勵模型的基礎。

OpenAssistantConversationsDataset(OASST1),包含7213個偏好樣本;

AnthropicHH-RLHF,一個關于AI助手有用性和無害性的偏好數據集,包含160,800個人類標簽;

斯坦福人類偏好(SHP),這是一個數據集,包含348,718個人類對各種不同回答的集體偏好,包括18個從烹飪到哲學的不同學科領域。

最后,研究者使用了trlX,進行近端策略優化(ProximalPolicyOptimization,PPO)強化學習,對SFT模型進行了RLHF訓練,然后,StableVicuna就誕生了!

Gate.io 將于明日23:00開啟Startup項目WSIENNA:據官方公告,Gate.io將于5月4日(明日)23:00 至5月5日 21:00開啟Startup項目Sienna(WSIENNA)認購通道,22小時內有效下單同等對待。用戶需要達到VIP1和以上級別才能參與認購,VIP等級越高的用戶認購額度越高。用戶下單后到結束認購后2小時內,請務必保證現貨交易賬戶中有不低于認購金額的足夠金額,金額不足將自動排除在有效訂單之外。請務必注意:認購結果預計于5月6日 00:00公布。[2021/5/3 21:19:55]

據StabilityAI稱,會進一步開發StableVicuna,并且會很快在Discord上推出。

另外,StabilityAI還計劃給StableVicuna一個聊天界面,目前正在開發中。

相關演示已經可以在HuggingFace上查看了,開發者也可以在HuggingFace上下載模型的權重,作為原始LLaMA模型的增量。

但如果想使用StableVicuna,還需要獲得原始LLaMA模型的訪問權限。

獲得權重增量和LLaMA權重后,使用GitHub存儲庫中提供的腳本將它們組合起來,就能得到StableVicuna-13B了。不過,也是不允許商用的。

DeepFloydIF

在同一時間,StabilityAI還放出了一個大動作。

你敢信,AI一直無法正確生成文字這個老大難問題,竟然被解決了?

沒錯,下面這張「完美」的招牌,就是由StabilityAI全新推出的開源圖像生成模型——DeepFloydIF制作的。

波卡周報:Staking比例調整至75%后,將增加驗證人獎勵:波卡Polkadot今日在官方平臺更新本周進展,主要包括:1.6月29日,Kusama上正在進行一個議案公投,在平行鏈開啟前,將staking的比率從50%調整到75%;2.6月30日,Kusama目前正在進行一個議案投票,將驗證人的數量從400增加到500;3.7月1日,Web3基金會技術教育負責人Bill發推,Polkadot上的驗證人數量將保持在197個,而不是增加到200個;4.7月1日,Soramitsu宣布創建 Polkaswap的計劃,一個將連接到Polkadot的非托管代幣交換的基礎設施;5.7月2日,Polkadot發布v0.8.13版本,此外,Kusama第68個議案已經通過,Kusama的最佳staking比例將調整為75%,在平行鏈開啟前,驗證人將得到更多的區塊獎勵。截止發文,波卡主網的staking數據:波卡目前的版本:Polkadot CC1, version 13;現階段:第二階段 NPoS,可進行提名和驗證人設置;全網已發行( 映射) DOT:828.1 萬;驗證人:197個;候選驗證人:148個;提名人:689 個;抵押率:54.49%,即 451.2萬個DOT正在進行 staking;上一個era獎勵:1,795個DOT,一個ear = 24 小時。[2020/7/6]

除此之外,DeepFloydIF還能夠生成正確的空間關系。

模型剛一發布,網友們已經玩瘋了:

prompt:Robotholdinganeonsignthatsays"Icanspell".

不過,對于prompt中沒有明確說明的文字,DeepFloydIF大概率還是會出錯。

prompt:AneonsignofanAmericanmotelatnightwiththesignjavilop

官方演示

順便一提,在硬件的需求上,如果想要實現模型所能支持的最大1,024x1,024像素輸出,建議使用24GB的顯存;如果只要256x256像素,16GB的顯存即可。

是的,RTX306016G就能跑。

代碼實現:https://gist.github.com/Stella2211/ab17625d63aa03e38d82ddc8c1aae151

開源版谷歌Imagen

2022年5月,谷歌高調發布了自家的圖像生成模型Imagen。

根據官方演示的效果,Imagen不僅在質量上完勝OpenAI最強的DALL-E2,更重要的是——它能夠正確地生成文本。

迄今為止,沒有任何一個開源模型能夠穩定地實現這一功能。

與其他生成式AI模型一樣,Imagen也依賴于一個凍結的文本編碼器:先將文本提示轉換為嵌入,然后由擴散模型解碼成圖像。但不同的是,Imagen并沒有使用多模態訓練的CLIP,而是使用了大型T5-XXL語言模型。

這次,StabilityAI推出的DeepFloydIF復刻的正是這一架構。

甚至在測試中,DeepFloydIF憑借著COCO數據集上6.66的zero-shotFID分數,直接超越了谷歌的Imagen,以及一眾競品。

下一代圖像生成AI模型

具體來說,DeepFloydIF是一個模塊化、級聯的像素擴散模型。

模塊化:

DeepFloydIF由幾個神經模塊組成,它們在一個架構中相互協同工作。

級聯:

DeepFloydIF以多個模型級聯的方式實現高分辨率輸出:首先生成一個低分辨率的樣本,然后通過連續的超分辨率模型進行上采樣,最終得到高分辨率圖像。

擴散:

DeepFloydIF的基本模型和超分辨率模型都是擴散模型,其中使用馬爾可夫鏈的步驟將隨機噪聲注入到數據中,然后反轉該過程從噪聲中生成新的數據樣本。

像素:

DeepFloydIF在像素空間工作。與潛在擴散模型不同,擴散是在像素級別實現的,其中使用潛在表征。

上面這個流程圖展示的就是,DeepFloydIF三個階段的性能:

階段1:

基本擴散模型將定性文本轉換為64x64圖像。DeepFloyd團隊已經訓練了三個版本的基本模型,每個版本都有不同的參數:IF-I400M、IF-I900M和IF-I4.3B。

階段2:

為了「放大」圖像,團隊將兩個文本條件超分辨率模型應用于基本模型的輸出。其中之一將64x64圖像放大到256x256圖像。同樣,這個模型也有幾個版本:IF-II400M和IF-II1.2B。

階段3:

應用第二個超分辨率擴散模型,生成生動的1024x1024圖像。最后的第三階段模型IF-III擁有700M參數。

值得注意的是,團隊還沒有正式發布第三階段的模型,但DeepFloydIF的模塊化特性讓我們可以使用其他上采樣模型——如StableDiffusionx4Upscaler。

團隊表示,這項工作展示了更大的UNet架構在級聯擴散模型的第一階段的潛力,從而為文本到圖像合成展示了充滿希望的未來。

數據集訓練

DeepFloydIF是在一個定制的高質量LAION-A數據集上進行訓練的,該數據集包含10億對。

LAION-A是LAION-5B數據集英文部分的一個子集,基于相似度哈希去重后獲得,對原始數據集進行了額外的清理和修改。DeepFloyd的定制過濾器用于刪除水印、NSFW和其他不適當的內容。

目前,DeepFloydIF模型的許可僅限于非商業目的的研究,在完成反饋的收集之后,DeepFloyd和StabilityAI團隊將發布一個完全免費的商業版本。

參考資料:

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stability.ai/blog/deepfloyd-if-text-to-image-model

Tags:STATABVICUNAUNAstakedXYMBACKSTABDOGELuna Doge Token

Gate.io
Sui很優秀 但沒有區塊也沒有鏈 它只能是Web3世界的外圍_MOVE

作者:北辰 上周在《Sui是下一輪的行業敘事or上一輪的末日余暉?》的文章中的觀點引發的討論比較多,本來想用一篇文章來「小心求證」,但發現是給自己挖了一個大坑,后面才是慢慢填坑的時候.

1900/1/1 0:00:00
幣圈職務侵占罪辯護之如何區分公司和個人資產_CUR

虛擬貨幣挖礦、投資、推廣等活動存在高額利潤回報,因此在國內法規已經明確虛擬貨幣相關活動為非法的情況下仍吸引不少人冒險進行虛擬貨幣投資炒作,從而引發較大的刑事風險.

1900/1/1 0:00:00
巴菲特、芒格在股東大會上對近期 AI 炒作持懷疑態度_人工智能

來源:Wind 香港萬得通訊社報道,周六,成千上萬的人聚集在內布拉斯加州奧馬哈的CHI健康中心,參加伯克希爾哈撒韋公司的年度會議.

1900/1/1 0:00:00
AI在勞動節淘汰7800打工人,IBM打響科技巨頭用AI取代人類崗位的第一槍?_Chain

來源:量子位 原標題:《AI在勞動節淘汰7800打工人,永久的》“這不是演習,AI讓人失業來真的了!”就在這個勞動節假期,科技巨頭IBM宣布:暫緩可以被AI取代的崗位的招聘.

1900/1/1 0:00:00
DeFi 巨頭 Aave、Curve 推出穩定幣 重塑去中心化 3Pool_USD

Aave原生穩定幣GHO、Curve原生穩定幣crvUSD是加密社區最近熱議的大事件,是時候對DeFi最著名的穩定幣池之一進行重塑了.

1900/1/1 0:00:00
Ordinals 與 BRC-20熱潮下,盤點比特幣可擴展性發展的四大方向_CORD

原文:Top?4?Directions?of?Bitcoin?Ecosystem?Scalability作者:kenyou由GweiResearch編譯 Ordinals?NFT?和?BRC-2.

1900/1/1 0:00:00
ads