來源丨元宇宙簡史
作者丨元宇宙簡史編輯Eco
OpenAI最新研究利用GPT-4自動進行大語言模型中神經元行為的解釋和評分,并將其應用于另一種語言模型GPT-2,公開了這些GPT-2神經元解釋和分數的數據集。這項技術讓人們能夠利用GPT-4來定義和自動測量AI模型的可解釋性,從而更好地理解智能是如何工作的。
大語言模型是基于大量文本數據訓練,包含數千億或更多參數的語言模型。
在大數據時代,這類AI機器學習模型可以在提升產品銷售、輔助人類決策過程中起到很大的作用。
但是計算機通常不會解釋它們的預測結果,而語言模型想要變得更強大、部署更廣泛,就需要研究可解釋性,因為人類對模型內部工作原理的理解仍然非常有限,例如可能很難從中檢測到有偏見、欺騙性內容輸出。
波卡推出去中心化治理平臺Polkadot OpenGov,支持同時進行多個公投:6月15日消息,波卡推出去中心化且開放的治理平臺Polkadot OpenGov,簡化其治理模型。改進的治理平臺廢除了Polkadot委員會等一等公民,取代Polkadot理事會和技術委員會的是一個名為Polkadot Fellowship的新當選機構,它對網絡沒有實權,也不能更改參數或移動資產,Fellowship有45名成員,并且隨著核心開發人員提交候選資格,該成員可能會繼續增長。
此外,新的治理模型支持同時對多個問題進行投票,一切都由社區直接控制,之前的治理系統一次只能進行一次公投,默認情況下每次公投持續28天,因此一年只能進行12或13次公投。[2023/6/15 21:40:15]
可解釋性就是將模型能用通俗易懂的語言進行表達,把模型的預測過程轉化成具備邏輯關系的規則的能力,從而通過查看模型內部來發現更多信息。
Gemini前高管推出Token化T-Bill保險庫OpenEden:金色財經報道,Gemini 的前亞太區負責人Jeremy Ng 和亞太區業務發展負責人Eugene Ng推出了一家名為 OpenEden 的新加密初創公司,以提供 Token 化國庫券 (T-Bills) 的敞口。OpenEden 于去年年初成立,今天推出了首款產品。該產品被稱為 OpenEden T-Bill 保險庫,讓 USDC 穩定幣持有者鑄造 TBILL Token 并獲得收益。[2023/4/4 13:43:13]
例如,如果有一個針對“漫威超級英雄”的神經元,當用戶向模型提問“哪個超級英雄的能力最強”時,這個神經元就會提高模型在回答中說出漫威英雄的概率。
OpenSea已重新部署NFT類別頁面,新增游戲選項:1月31日消息,據OpenSea在社交媒體披露,該 NFT 市場已重新部署 NFT 類別并新增了游戲(Gaming)選項,旨在進一步提升特定 NFT 細分市場的可訪問性,并讓用戶可以從同類類別中快速找到表現最好和趨勢最好的 NFT 資產,無需再通過 NFT 列表進行篩選,當前已更新的 NFT 類別包括:藝術、游戲、會員、PFP 和攝影。[2023/1/31 11:38:20]
站在OpenAI的角度看,大模型未來將和人腦一樣擁有“神經元”,這些神經元會觀察文本中的特定規律,進而影響到模型本身生產的文本。
所以可解釋性就是將模型能用通俗易懂的語言進行表達,把模型的預測過程轉化成具備邏輯關系的規則的能力,從而通過查看模型內部來發現更多信息。
為了實現這個目標,OpenAI最近發布了一個關于GPT-4語言模型解析神經元的對齊性研究成果,利用自研基于GPT-4技術的開源工具,來嘗試計算其他架構、更簡單語言模型上神經元的行為并對其進行評分。
OpenAI CEO:ChatGPT已突破百萬用戶,對話費用平均只有幾美分:12月5日,OpenAI 首席執行官 Sam Altman 在社交媒體上發文表示,OpenAI 訓練的大型語言模型 ChatGPT 于上周三推出,截至今日已突破 100 萬用戶。并在回復推特首席執行官馬斯克時表示“每次對話的平均費用可能只有幾美分”,正試圖找出更精確的測量方法并壓縮費用。[2022/12/5 21:23:50]
而且,還可以將其應用于另一種語言模型中的神經元——本次選擇4年前發布、包含307200個神經元的大模型GPT-2為實驗樣本,公開了這些GPT-2神經元解釋和分數的數據集。
數據:8月23日OpenSea交易額達1.94億美元,較前一日增長55.2%:據Dune.Analytics數據顯示,8月23日OpenSea交易額達1.94億美元,較前一日(1.25億美元)增長55.2%。OpenSea交易額已經連續三天突破1億美元,且持續刷新交易額紀錄。[2021/8/24 22:33:12]
“我們邁出了使用AI進行自動化對齊研究的重要一步。”OpenAI聯合創始人GregBrockman表示。
具體來說,OpenAI開發了一套包含自動化工具和測試方法的評估流程:
首先,研究人員讓GPT-2運行文本序列,等待某個特定神經元被頻繁“激活”;
然后,讓GPT-4針對一段文本生成解釋,例如通過GPT-4接收到文本和激活情況判斷漫威是否與電影、角色和娛樂有關;
隨后用GPT-4模擬GPT-2的神經元接下來會做什么,預測行為;
最后評估打分,對比GPT-4模擬神經元和GPT-2真實神經元的結果的準確度,在下圖這個例子中,GPT-4的得分為0.34。
使用上述評分方法,OpenAI開始衡量他們的技術對網絡不同部分的效果,并嘗試針對目前解釋不清楚的部分改進技術。例如,他們發現以下方式有助于提高分數:
-迭代解釋。他們可以通過讓GPT-4想出可能的反例,在根據其激活情況修改解釋來提高分數;
-使用更大的模型來進行解釋。隨著解釋模型能力的提升,平均得分也會上升。然而,即使是GPT-4給出的解釋也比人類差,這表明還有改進的余地;
-改變被解釋模型的架構。用不同的激活函數訓練模型提高了解釋分數。
OpenAI表示,他們正在將GPT-4編寫的對GPT-2中的所有307,200個神經元的解釋的數據集和可視化工具開源,同時還提供了OpenAIAPI公開可用的模型進行解釋和評分的代碼,從而希望學術界能開發出新的技術來提升GPT模型解釋分數。
OpenAI還發現,有超過1000個神經元的解釋得分至少為0.8分,這意味著GPT-4模型可以解釋大部分人類神經元,同時目前GPT理解的概念似乎和人類不太一樣。例如,他們發現了一些有趣但GPT-4并不理解的神經元。
這些神經元似乎對文本中的某些特征或模式有敏感度,但是GPT-4無法用簡單的語言描述它們。OpenAI希望隨著技術和研究方法的改進,進一步提高AI模型可解釋性能力,從而更好地理解這些神經元的行為和意義。
對于本研究局限性,OpenAI表示,目前GPT-4生成的解釋還不完美,尤其要解釋比GPT-2更大的模型時,表現效果很差。
神經元復雜行為無法用簡短的自然語言描述,OpenAI解釋了神經元的這種行為,卻沒有試圖解釋產生這種行為的機制,而且整個過程算力消耗極大等。
OpenAI希望在未來的工作中可以解決上述這些問題,最終OpenAI希望使用模型來形成、測試和迭代完全一般的假設,從而比肩人類大腦的想法和行為,以及將其大模型解釋為一種在部署前后檢測對齊和安全問題的方法。
然而在這之前,OpenAI還有很長的路要走。
“我們希望這將開辟一條有前途的途徑。”JeffWu表示,這一技術可以讓其他人可以在此基礎上構建并做出貢獻的自動化方案,從而解決AI模型可解釋性問題,很好地解釋這些模型行為,比如AI如何影響人類大腦中的神經元等。
嚴正聲明:本文為元宇宙簡史原創,未經授權禁止轉載!內容僅供參考交流,不構成任何投資建議。任何讀者若據此進行投資決策,風險自擔。
撰文:FredEhrsam這是一篇看完讓我毛骨悚然,汗毛直立的文章。作者Paradigm聯合創始人FredEhrsam發表于2017年2月,寫的卻是4年后當下的流行:元宇宙、區塊鏈、Crypto.
1900/1/1 0:00:00據TheBlock11月30日消息,私募股權公司ThomaBravo正在建立一項針對加密和金融科技的增長投資業務.
1900/1/1 0:00:00一直以來,市場對于GameFi的認知就是游戲化的DeFi。一個行業新范式傳播路徑往往是:DeFi率先鉆研出新的玩法,然后市場上其他相關仿盤開始出現,最后再將勢能傳導到GameFi中,用游戲的方式.
1900/1/1 0:00:00本文來源:21世紀經濟報道,作者:陳植隨著央行法定數字人民幣試點步伐提速,越來越多地方政府都在積極爭取數字人民幣試點.
1900/1/1 0:00:00在SuiNetwork主網上線一周后的今天,加密研究員2Lambroz對所有上線主網的DeFi項目進行了體驗,將這些dApp的相關信息整理和匯總在了一個表格之中.
1900/1/1 0:00:00頭條 ▌數據:BRC-20代幣市值四天內縮水6億金色財經報道,隨著比特幣銘文鑄造數量趨于平穩,交易數量和活躍地址逐漸走低,每個比特幣區塊支付的平均費用也已經從6BTC降至1BTC.
1900/1/1 0:00:00