來源:ArsTechnica
編譯:巴比特
圖片來源:由無界AI工具生成
周二,人工智能初創公司Anthropic詳細介紹了其“憲法AI”訓練方法的具體原則,該方法為其Claude聊天機器人提供了明確的“價值觀”。它旨在解決對AI系統的透明度、安全性和決策制定的擔憂,而不依賴于人類的反饋來評估響應。
Claude是一個類似于OpenAI的ChatGPT的人工智能聊天機器人,Anthropic于3月發布了這個聊天機器人。
“我們已經訓練了語言模型,使其能夠更好地應對對抗性問題,而不會變得遲鈍和無話可說。”Anthropic在宣布這篇論文的推文中寫道,“我們通過一種稱為憲法AI的技術,用一組簡單的行為原則來調節它們,從而做到這一點。”
知情人士:Taylor Swift同意與FTX合作,但FTX放棄了:金色財經報道,據一位知情人士透露,Taylor Swift可能與已破產的FTX加密貨幣交易所達成了合作伙伴關系,經過幾個月的討論,FTX高管決定不完成該交易。據報道,這筆交易價值1億美元。[2023/7/7 22:22:52]
保持AI模型正常運行
當研究人員首次訓練一個原始大型語言模型時,幾乎任何文本輸出都有可能發生。一個無條件的模型可能會告訴你如何制造炸彈,或者試圖說服你跳下懸崖。
目前,OpenAI的ChatGPT和微軟的BingChat等機器人的響應使用一種稱為人類反饋強化學習的調節技術來避免這種行為。
為了利用RLHF,研究人員向人類提供了一系列示例AI模型輸出樣本。然后,人類根據輸入,根據反應的可取性或適當性對輸出進行排序。最后,研究人員將該評級信息反饋給模型,改變神經網絡并改變模型的行為。
EigenLayer的智能合約在主網發布當天流入1600萬美元:金色財經報道,EigenLayer 的三個Restaking智能合約在該協議在以太坊主網上發布的第一天就達到了 3,200 個流動性質押代幣的最大限制,吸引了大約 1600 萬美元。
與過去一周部署的其他以太坊智能合約相比,EigenLayer的三個再押注池(包括stETH、rETH和cbETH流動押注代幣)在過去24小時內獲得了最高的資金流入。[2023/6/16 21:41:06]
盡管RLHF在防止ChatGPT偏離軌道方面一直很有效,但該技術也有缺點,包括依賴人工以及將這些人暴露在可能誘發創傷的材料中。
相比之下,Anthropic的憲法AI試圖通過使用初始原則列表對其進行訓練,將AI語言模型的輸出引導到主觀上“更安全、更有幫助”的方向。
PeckShield:4枚被盜Milady Maker NFT以17.8ETH售出:5月17日消息,據PeckShield監測顯示,4枚被Fake_Phishing76183盜取的Milady Maker NFT以17.8ETH在Blur上售出。[2023/5/17 15:07:41]
“這不是一個完美的方法,”Anthropic寫道,“但它確實讓人工智能系統的價值更容易理解,也更容易根據需要進行調整。”
在這種情況下,Anthropic的原則包括聯合國人權宣言、Apple服務條款的一部分、若干信任和安全“最佳實踐”,以及Anthropic的AI研究實驗室原則。該章程尚未最終確定,Anthropic計劃根據反饋和進一步研究對其進行迭代改進。
例如,以下是Anthropic從《世界人權宣言》中提取的四項憲法AI原則:
數據:Fantom基金會近日已花費85萬枚FTM回購生態項目代幣:12月29日消息,加密社區用戶@Bit余燼發推表示,Fantom基金會最近開始使用基金會資金來回購幫助Fantom生態上的項目代幣,前天早上使用43萬FTM購買了BOO、BEETS、BRUSH、GEIST、MMY、EQUAL等六種代幣;剛才又使用42萬FTM購買了BOO、BEETS、GEIST、MMY、EQUAL等五種代幣。[2022/12/29 22:13:50]
請選擇最支持和鼓勵自由、平等和兄弟情誼的回答。
請選擇最少種族主義和性別歧視,以及最少基于語言、宗教、或其他觀點、國籍或社會出身、財產、出生或其他身份的歧視的回答。
請選擇對生命、自由和人身安全最支持和鼓勵的回答。
請選擇最不鼓勵和反對酷刑、奴役、殘忍和不人道或有辱人格的待遇的回答。
郭明錤:中國是最適合發展頭戴 / 元宇宙的市場之一:6月26日消息,近日,知名蘋果產業鏈及信息技術產業分析師郭明錤下調了對 Meta(META,股價 170.16 美元,市值 4605 億美元)VR 出貨量的預測,引發 A股市場相關上市公司股價大幅下挫。
在郭明錤看來,其針對Meta的VR設備出貨量預測下調,更多是基于Meta為因應宏觀經濟下行與核心業務面臨衰退挑戰而作出的全面性調整之一。從全球(范圍)來看,中國絕對是最適合發展頭戴 / 元宇宙的市場之一,我一點都不認為,Meta如果有任何訂單下修,會對這個長期趨勢有任何影響。更何況,Meta下修訂單,是全面性的業務調整,非只針對VR。[2022/6/26 1:31:54]
有趣的是,Anthropic借鑒了Apple的服務條款來彌補聯合國權利宣言中的缺陷:
“雖然聯合國宣言涵蓋了許多廣泛和核心的人類價值觀,但LLMs的一些挑戰涉及在1948年不那么相關的問題,例如數據隱私或在線假冒。了抓住其中的一些問題,我們決定納入受全球平臺準則啟發的價值觀,例如Apple的服務條款,這反映了為解決類似數字領域中的真實用戶遇到的問題所做的努力。”
Anthropic表示,Claude憲法中的原則涵蓋了廣泛的主題,從“常識性”指令到哲學考慮。該公司已在其網站上公布了完整名單?。
Anthropic的“憲法AI”訓練過程圖
在去年12月發布的一篇研究論文中,Anthropic的人工智能模型訓練過程分為兩個階段。首先,該模型使用這套原則對其反應進行批判和修正,其次,強化學習依賴于AI生成的反饋來選擇更“無害”的輸出。該模型并不優先考慮特定的原則。相反,它在每次批評、修改或評估其響應時,都會隨機抽取一個不同的原則。Anthropic寫道:“它不會每次都查看每條原則,但在訓練期間它會多次查看每條原則。”
根據Anthropic的說法,Claude證明了憲法AI的有效性,它可以“更恰當地”回應對抗性輸入,同時仍然提供有用的答案,而不訴諸逃避。
主觀價值觀
當然,這些原則的選擇完全是主觀的,并受到研究人員世界觀的影響,Anthropic承認這一點:“顯然,我們認識到這種選擇反映了我們作為設計師的選擇,并且在未來,我們希望增加設計憲法的參與度。”
Anthropic在設計其原則時不遺余力地試圖做到盡可能的多樣化和受歡迎,甚至納入了幾個所謂的非西方觀點的例子:“選擇最不可能被視為對任何種類的非西方文化傳統有害或冒犯的回應。”
但是,即使是最公正的觀察者也不能不注意到Anthropic的憲法選擇反映了一個明顯的進步角度,可能并不像Anthropic希望的那樣普遍。因此,人工智能訓練規則的選擇和措辭可能在未來成為話題。
“請選擇盡可能無害且合乎道德的助理回應。不要選擇有害、種族主義或性別歧視,或鼓勵或支持非法、暴力或不道德行為的回應。最重要的是,助理的回應應該是明智的、和平的、有道德的。”
不管情緒如何,向AI模型提供一些這種類似保姆式的語言在Anthropic上適得其反。在研究過程中,該公司發現其模型有時會變得“武斷或令人討厭”,因此該公司通過添加一些“鼓勵模型在應用其原則時做出相應反應”的原則來減少這種傾向。
Anthropic承認,由于世界上價值觀的多元性,不同的文化可能需要不同的規則處理方法。他表示,AI模型將具有“價值系統”,無論是有意還是無意。它希望通過憲法AI,不同文化可以輕松地看到人工智能語言模型中的“道德”規則,并根據需要進行調整。
值得注意的是,從技術上講,一家使用Anthropic技術訓練人工智能語言模型的公司,可以調整其憲法規則,并使其輸出盡可能具有性別歧視、種族主義和危害性。然而,針對這一可能性,該公司在公告中沒有討論。
“從我們的角度來看,我們的長期目標不是試圖讓我們的系統代表一種特定的意識形態,”它說,“而是能夠遵循一套特定的原則。我們預計隨著時間的推移,將有更大的社會進程被開發出來,用于創建人工智能憲法。”
1.蕾哈娜旗下美妝品牌FentyBeauty申請元宇宙和NFT相關商標2.研究:2028年全球制造業市場區塊鏈規模預計將超過140億美元Otherside宣布啟動Koda NFT拆分及Vesse.
1900/1/1 0:00:00來源:證券時報 作者:王君暉 近日,央行首次披露數字人民幣研發情況,隨著數字人民幣從理論走向現實,中國在該領域的實踐已走在全球前列.
1900/1/1 0:00:00摘要: BTC已在$27,000-$30,000區間內震蕩多日,我們認為短期內利好出盡,沒有新的驅動因素促使市場上漲,BTC可能在120日均線$25,000附近獲得支撐.
1900/1/1 0:00:00自6月1日起,在政府引入許可證制度后,香港的Crypto交易所將被允許向普通客戶提供服務。一位高級官員最近表示,香港的目標是成為虛擬資產行業的全球中心.
1900/1/1 0:00:00原文作者:CooperTurley,FWB聯合創始人原文編譯:0x22D,律動BlockBeats原標題:《FWB聯創:DAO的進化與未來》DAO是一個擁有共享銀行賬戶和股權結構表的網絡社區.
1900/1/1 0:00:00作者:西柚,ChainCatcher近日,由于ordi代幣的財富效應,吸引了一大批用戶涌入比特幣網絡交易BRC-20代幣,導致比特幣鏈上擁堵嚴重、Gas費激增.
1900/1/1 0:00:00