比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > 波場 > Info

硅谷大佬都在聊的AI Agents 是真熱還是虛火?_GENT

Author:

Time:1900/1/1 0:00:00

AI Agents注定是一場馬拉松。

ChatGPT獲得巨大成功后,OpenAI已然奔向下一個目標——AI Agents(智能體)。

“如果一篇論文提出了某種不同的訓練方法,OpenAI內部會嗤之以鼻,認為都是我們玩剩下的。但是當新的AI Agents論文出來的時候,我們會十分認真且興奮地討論。普通人、創業者和極客在構建AI Agents方面相比OpenAI這樣的公司更有優勢。” OpenAI聯合創始人,前TeslaAI總監Andrej Karpathy說道。

Karpathy的公開發言為AI Agents添了不少熱度。但他的判斷并非一家之言。

早在3月份,AutoGPT就在GitHub上獲得7.4萬星,并快速成為史上Star數量增長最快的開源項目;而后發布的BabyAGI、AgentGPT更如雨后春筍般涌現:訂購披薩、整理郵箱、創建博客,甚至舉辦一場情人節派對……

越來越多的AI Agents出現在人們生活的各個場景下,熱潮迅速開始從硅谷蔓延。

自主執行、獨立運作,AI Agents被科技人士給予極高的期待,認為其是“變革社會的生產力工具”。更有人將其視作“通往通用人工智能(AGI)時代的開始”。

但呼聲并不能掩蓋現存的問題。

“大模型是AI Agents的前提,有了足夠好的硬件基礎后,才能去發展AI Agents。”真格基金管理合伙人戴雨森對「甲子光年」表示。

嚴格來說,市面上只有ChatGPT一個“合格”的大模型底座。受制于模型算力,國內仍然缺乏AI Agents的開發土壤。

未來美好,現實殘酷。技術研發與創業投資等都在搖擺中進行。AI Agents的紅利期何時真的伴隨大模型浪潮而來,誰都不得而知。但可以肯定的是,改變已悄然開始。

與其把AI Agents當作ChatGPT升級版,不如將它視作人類的“數字助理”更為合適。

它不僅告訴你“如何做”,更會“幫你做”。作為一種媒介,AI Agents代替人類與GPT等大語言模型(Large Language model, LLM)進行反復交互,只要給定目標,它便可以模擬智能行為,自主創建任務、重新確定任務列表優先級、完成首要任務,并循環直到目標達成。

美監管機構調查與硅谷銀行和簽名銀行的管理層是否有不當行為:金色財經報道,美國聯邦存款保險公司(FDIC)已對硅谷銀行和簽名銀行破產事件中管理人員的行為展開調查。FIDC主席Martin Gruenberg在周二參議院聽證會事先準備好的講話中說,“值得注意的是,這兩家銀行被允許倒閉。股東失去了他們的投資,無擔保債權人蒙受損失。董事會和大多數高管都被撤職了。”Gruenberg表示,FDIC可以對董事、高管、專業服務提供商和\"其他機構關聯方\"就與銀行有關的損失,以及銀行管理中的任何不當行為展開調查,并追究其責任。[2023/3/28 13:30:10]

與傳統的人工智能不同,AI Agents可以在沒有人類控制的情況下獨立運行。通過接入API,AI Agents甚至可以瀏覽網頁、使用應用程序、讀寫文件、使用信用卡付款等等。

簡單來說,只需要給它一個目標,AI Agents就能完成剩下的全部工作。例如HyperWrite研發的AI agent通過Chrome瀏覽器的控制程序來自動幫你訂購披薩。

圖源:HyperWrite CEO Matt Shumer Twitter賬號

這種想象放在科幻電影里并不難,但在人工智能探索歷程上,已經持續了將近半個世紀。

早在20世紀80年代,計算機科學家就開始探索如何開發一個可以像人類一樣交互的智能軟件。 但苦于數據和算力限制,AI Agents缺乏必要的現實條件。

斯坦福大學計算機科學博士Joon Park曾在訪談中表示:“我們一直在朝著那個方向努力,但過去幾十年的所有方法,甚至都沒有接近我們現在借助LLM所實現的效果......這就是為什么我們忘記了這一愿景。但當LLM出現時,我們意識到機會來了。”

大語言模型是AI Agents的核心大腦。通過拆解復雜任務,可以將復雜的用戶需求拆解為可實現的任務方式。

一方面,大模型的訓練建立在互聯網的基礎上包含了大量的人類行為數據,彌補了構建可信AI Agents的關鍵要素。

另一方面,在可觀的知識容量下,大模型涌現出優秀的上下文學習能力、推理能力。通過建立思維鏈來實現模型的連續思考和決策,AI Agents可以分析復雜問題,并將其拆解成簡單、細化的子任務。

硅谷銀行收到第一起來自股東的欺詐起訴,CEO和CFO成被告:金色財經報道,硅谷銀行被股東指控管理不善導致銀行倒閉,這可能成為該銀行第一次收到的股東發起的證券欺詐訴訟。上周五,該銀行關閉并進入破產程序,在創業界引起了巨大反響,加深了金融業的不確定性。在該訴訟案中,硅谷銀行CEO Greg Becker和CFO Daniel Beck被列為被告。[2023/3/14 13:01:48]

與此同時,LLM以語言作為媒介也改變了前端的交互形式。BV百度風投AI應用賽道負責人,投資副總裁溫永騰告訴「甲子光年」:“BV百度風投很早就開始關注AI Agents的發展,通過研判,我們認為原先的圖形用戶界面(GUI)有可能轉變為語言用戶界面(LanguageUI),AI Agents的前端應用將存在于所有可能與人類交互的前端形式之中。”

只是拆解任務,還遠遠算不上智能。LLM驅動下的AI Agents,離不開三個關鍵組件:

規劃(Planning):將大型任務分解為較小的、可管理的子目標;進行反思與細化,對過去行為進行分析、總結和提煉,以提高自身的智能和適應性,提高最終結果的質量。

記憶(Memory):短期記憶,進行上下文學習;長期記憶,能夠長期保存和調用無限信息的能力,一般通過外部載體儲存和快速檢索來實現。

工具使用(Tool use):可以學習調用外部API,以獲取模型權重中缺少的額外信息。

LLM驅動下的AI Agent System概覽

圖片來源:Lilian Weng個人博客

三個組件配合下,AI Agents不僅能像人一樣思考,也能像人一樣行動。

就像人類一樣,在從事復雜任務時,每一步之間往往會有一個推理過程。AI Agents也會借助ReAct組件(用于構建用戶界面的JavaScript庫),將大模型的推理能力和行為決策緊密結合起來,使語言模型可以根據知識進行有邏輯地計劃安排。

Reflexition框架則為AI Agents提供動態記憶與自我反思的能力。通過語言反饋而非更新權重的方式來強化Language Agents,讓它可以改進過去的行動決策、糾正過往的錯誤以不斷提高自身表現。

硅谷押注DeFI將顛覆傳統金融:據研究公司PitchBook的數據顯示,今年迄今為止已有72家DeFi公司獲得私人投資者青睞,超出去年全年總數四分之一以上。這些DeFi項目旨在重塑交易所、保險、借貸等金融業務。DeFi交易所Uniswap在5月份多數日子里的每日交易額都突破了10億美元,在ETH等加密貨幣的交易方面,Uniswap已經能媲美Coinbase等傳統加密貨幣交易所。DeFi Pulse網站數據顯示,過去一年,DeFi應用程序中用作貸款和交易抵押品的加密貨幣的價值增長了60余倍,達到670億美元。DeFi項目的支持者相信,長遠來看,這些應用有望重塑金融體系。但一些律師和風投人士認為,DeFi目前處于基本不受監管的灰色地帶,可能會面臨來自美國證券交易委員會新任主席Gary Gensler的壓力。盡管如此,一些傳統硅谷風投公司也不愿置身事外,并通過迂回方式參與了DeFi的發展。比如紅杉資本就通過參與投資的投資公司Paradigm和Polychain Capital,間接投資了DeFi交易所Uniswap和DeFi借貸公司Compound。(金融時報)[2021/6/3 23:07:39]

在信息獲取、儲存、保留、檢索的進程上,AI Agents也力圖模仿人類的記憶構成,構建高效的內存系統。

模擬人類記憶方式,AI Agents會將感覺記憶、短期記憶、長期記憶,分別表示為原始輸入的學習嵌入(如文本、圖像等)、上下文學習、外部向量儲存。任務與結果會儲存在記憶模塊中,當信息被調用時,儲存在記憶中的信息會回到與用戶的對話中,由此創造出更加緊密的上下文環境。

人類最顯著的特征之一就是使用和創造工具。通過配備外部工具,使用API來調用各種接口,AI Agents能夠模擬人類使用工具,完成更復雜的任務。

雖然技術層面并未完全成熟,諸如數據管理、長期記憶等問題仍在解決。但AI Agents自主執行、迭代優化、“解放雙手”的能力也讓走紅成為必然。

ChatGPT的誕生,實現了AI與人類進行多輪對話,并提供信息和建議的功能。Copilot的推出,使AI足以承擔為人類完成工作初稿的能力,例如Github Copilot、Microsoft 365 Copilot、Midjourney,分別成為人們在編程、辦公、圖像生成領域中的“智能副駕”。

硅谷王川:2年后灰度成為世界上利潤最高資產管理公司之一:硅谷王川發微博表示:BTC歷史上只有2017年十二月十六日到十二月二十日這五天的價格高于16800美元,離突破新高不遠了。但大部分人完全不知道發生了什么,或者即使模糊的知道,也沒有采取行動。照這個趨勢,一兩年后,灰度(和五十度灰無關)成為世界上利潤最高的資產管理公司之一,接近blackrock,可能性很大。[2020/11/17 21:05:34]

告訴AI完成一件任務,它就能完成一件任務——撰寫文案、回答問題,或者生成一張人類肉眼難以分辨真假的照片。而與此同時,人們也往往需要為AI的每一步行動提供具體清晰的提示。

此時的AI就像是初來乍到,沒有任何經驗,需要手把手教導的實習生。但是,如果你想要一個聽指令辦事,執行中遇到困難自己解決,盡量不給人添麻煩的好員工呢?

3、4月份,Camel、AutoGPT、BabyAGI、西部世界小鎮等多個AI Agents集中爆發,似乎讓人們看到了這樣的可能。

自3月份,Significant Gravitas將AutoGPT開源后,發布時間不到2個月,AutoGPT在GitHub上獲得的star數量已經達到13萬,成為史上star數量增長最快的開源項目。

斯坦福大學打造的西部世界小鎮

圖片來源:論文《Generative Agents: Interactive Simulacra of Human Behavior》

Andrej Karpathy就曾在Twitter上表示:“提示工程(prompt engineering)的下一個前沿是AutoGPTs”。截至目前,AutoGPT在代碼托管平臺Github上已經獲得超過14萬star,排名歷史第25位。

OpenAI聯合創始人兼CEO Sam Altman曾在多個場合表示,構建龐大AI模型的時代已經結束,智能體才是挑戰。

在一篇介紹自主智能體的文章中,作者Octane AI(一家數據營銷平臺提供商)聯合創始人兼CEO Matt Schlicht收集了來自業界、學術界、投資界等上百余人的觀點和看法,有來自Meta、Nvidia、Stability AI等大公司或AI初創公司的專家,也有斯坦福CS的教員和投資了包括Hugging Face在內的AI投資人,絕大多數都表達了對AI Agents潛能的期待和展望,甚至將其稱為“原始AGI”。

硅谷VC資金幫助加密貨幣基金提前達到目標:Multicoin資本,一個成立多年的位于德克薩斯州的加密投資基金,現在預計將在Q2 2018年底鎖定其2.5億美元的基金,在2017年剛成立的時候這只基金的目標僅僅是1億美金,目前達到的遠超預期的成績,這來源于更多投資者的加入。這些投資人包括David Sacks和Bill Lee (Craft資本), Marc Andreessen, Chris Dixon, Compound, Vy Capital, Passport Capital, Adam Zeplain (mark VC), Ari Paul (Blocktower), and Elad Gil (Color Genomics, Twitter)。[2018/3/12]

接替大模型,AI Agents似乎正在成為AI的下一個熱點。

但與此同時,反對的聲音也不絕于耳。

圖靈獎獲得者Yoshua Bengio在今年5月發布的博文《危害人類的AI是如何出現的》中就提及,人類能控制AI Agents總任務、總目標,并不意味著人類能控制AI Agents憑借自己的智慧分解出來的子任務、子目標,除非AI對齊(alignment)的研究取得突破,否則人類就沒有強有力的安全保障。

智能體的集體出現,大佬的追捧和質疑,AI Agents的浪潮迅速且火熱。

然而,AI Agents在人工智能的圈子內并不是一個新名詞。

2014年,DeepMind推出的圍棋AI AlphaGo,其實就是AI Agents的一種。與之類似的還有2017年OpenAI推出的用于玩《Dota2》的OpenAI Five,2019年DeepMind公布用于玩《星際爭霸2》的AlphaStar。

當時的業界潮流是通過強化學習(reinforcement learning)的方法來訓練和改進AI Agents,主要應用于游戲場景,特別是一些對抗性、具有明顯輸贏雙方的比賽中。但如果想要在真實世界中實現通用性,卻是一個懸而未決的問題。

之后的幾年,OpenAI轉向大語言模型,GPT系列的相繼推出,大模型成為各家科技廠商爭先涌入的賽道,也正是大模型的發展,讓AI Agents有了突破瓶頸、重新發展的契機。

相較于幾年前局限在游戲場景,在大模型的基礎上AI Agents可以實現什么?BV百度風投AI應用賽道負責人,投資副總裁溫永騰向「甲子光年」表示:“我們看到的不僅僅是技術進步使得AI在理解用戶意圖、收集信息以及執行任務的能力大大增強,更重要的是,AI Agents完全有能力重構未來的應用生態”。

在AutoGPT推出后不久,已經有不少網友使用AutoGPT來搭建自動化的個人助理。例如FirstSales.io的創始人兼CEO Udit Goenka發帖稱,他利用AutoGPT搭建了一個勘探引擎,可以搜索去年獲得種子輪投資的公司,并能描述創建列表的詳細信息。

Google軟件工程師Yew Jin Lim表示,他用AutoGPT創建了一個電子郵件助手,通過電子郵件向AI Agents發送任務詳情。

真格基金管理合伙人戴雨森告訴「甲子光年」:“Agent是一個讓生產力真正能大幅提高的方向,因為如果還是人做事情,人總是有限的”。

“AI Agents將會成為日常生活和工作中的生產力工具。”Matt Schlicht寫道,“從管理社交媒體賬號、投資市場,到出版最好的兒童讀物,AI Agents將存在于各個行業和每一項可以被想象出的任務之中。”例如aomni,是一款可以在網絡上查找任何主題信息的AI Agent,會通過創建列表,一項一項完成用戶的目標。

除了生產力需求之外,Inflection AI的個人AI Agent Pi提供了另一個可能的應用方向。

不同于ChatGPT、Claude通用人工智能的定位,Pi主打高情商、情感陪伴、提供情緒價值。Pi還會記住和用戶的歷史對話,除了參與并輔助人們的工作與生活,還會學習聯系朋友和家人的方式與用戶建立聯結。目前Inflection AI已獲得超15億美元的投資,超越了Anthropic,僅次于OpenAI。

“Building a kind of JARVIS(構建類似于JARVIS)”,這是Andrej Karpathy在Twitter上最新更新的簡介,JARVIS是漫威超級英雄鋼鐵俠的一位人工智能助手,具備獨立思考的能力,能幫主人處理各種事務,計算各種信息。

Karpathy的簡介也意味著,AI Agents賽道的發令槍已經打響。

外媒《The Information》指出,Sam Altman曾在5月私下告訴部分開發者,OpenAI希望將ChatGPT打造成個人工作助手,并有知情人士指出,OpenAI一直在關注如何使用聊天機器人來創建自主的AI Agents,相關功能很有可能部署在ChatGPT助手中。

無獨有偶,Meta也看到了AI Agents的機會。

早在4月,Zuckerberg就曾對投資者表示,Meta看到了“以有用且有意義的方式向數十億人介紹AI Agents的機會”,但此時他并沒有說明具體的應用。

而在6月一次與員工舉行的全體會議上,Zuckerberg宣布了一系列處于不同開發階段的技術,其中一個就是將帶來具有不同個性和能力的AI Agents來提供幫助或娛樂,最初主要用于Messenger和WhatsApp。

在國內,AI Agents相關的產品也相繼誕生。

在7月初的WAIC現場,阿里云就發布了旗下第一個智能體——ModelScopeGPT,面向開發者群體,并將在未來推出一系列智能體以應對多種應用場景。

華為在該領域也有涉及,但更側重于具身智能(Embodied AI),即大模型與機器人的結合。

除了大廠,AI Agents也是創業者們的機會。OpenAI聯合創始人Karpathy特意在此前的演講中提到:“普通人、創業者和極客在構建AI Agents方面相比OpenAI這樣的公司更有優勢。”

BV百度風投AI應用賽道負責人,投資副總裁溫永騰表示,BV團隊目前也對初創企業在AI Agents領域中的機會持樂觀態度。

“未來的應用生態將是多元化的,而非由單一巨頭主導。AI Agents的出現帶來了一次范式轉移的機會,許多傳統應用都面臨被顛覆改造的可能性。在這個過程中,初創公司有大量的機會去開墾新的領域。對于每一個特定的任務,AI Agents都有大量的優化空間,包括特定算法與服務的構建、用戶數據以及產品設計等方面,都是初創公司可以建立差異化優勢的地方。”

“此外,當前AI Agents的生態還不夠明確,這為初創企業提供了有利的發展機會,因為它們并不需要在一個已經確定的規則下進行競爭,從這個角度上來看,初創企業與大公司是站在同一起跑線上的,并且初創企業更為靈活,可以很快進行產品的調整。”

憑借在人工智能領域布局多年所積累的認知,BV百度風投并不認為模型公司會壟斷應用層的機會。因為對于底層模型公司來說,構建生態的意義遠大于壟斷某一應用,如果底層模型公司采取排他性的策略來獲取應用層的競爭優勢,可能會對其自身的生態造成傷害。底層模型公司可能會在他們關注的一兩個領域構建強大的AI Agents,但他們沒有必要在所有領域都與初創企業競爭。

尚未確定的生態,還未被制定規則的賽場,所有人又回到了同一起跑線上。

但不可否認的是,目前為止,除了許多演示之外,AI Agents并沒有真正的產品出現。

真格基金管理合伙人戴雨森將AI和人類協作的程度類比為自動駕駛的不同階段,AI Agents就好比自動駕駛的L4階段。但就如同L4一樣,AI Agents容易想象、演示,卻難以實現,AI Agents的真正應用還在不確定的未來。

將AI和人類協作的程度類比自動駕駛的不同階段

圖片來源:戴雨森即刻賬號@yusen

戴雨森強調,想要實現可用的AI Agents,還需要大幅提高大模型的能力,即使是對處于頂層的OpenAI來說,在延遲、性能上也有很高的提升空間。

“如果用蒸汽機來打比方的話,水燒到100度才能產生蒸汽,如果AI Agents的智力還沒有達到一定的程度,水只燒到了50度,即使已經花費了很多能源,依然無法產生蒸汽,依然是0。”

AI Agents賽道的發令槍已經打響,只不過,這絕對不是短短幾個月內的沖刺,而是注定要長達幾年,甚至跨越十年的長跑馬拉松。

甲子光年

媒體專欄

閱讀更多

Foresight News

金色財經 Jason.

白話區塊鏈

金色早8點

LD Capital

-R3PO

MarsBit

深潮TechFlow

Tags:GENENTGENTAGENGenebank Tokenengagement-tokenREGENT幣AGENTSHIBAINU價格

波場
金色早報 | Ripple案陪審團審判定于2024年第二季度進行_NBS

▌Ripple案陪審團審判定于2024年第二季度進行一位聯邦法官發布了何時可以在陪審團面前聽到Ripple vs SEC案論點的時間表,周三公布的法庭文件顯示.

1900/1/1 0:00:00
加密寒冬下的“擼毛生態”:項目方PUA得心應手 中小工作室叫苦連天_RIM

作者:深潮 TechFlow 清潔工8月15日,當SEI/Cyber正式上線Binance之后,擼毛社群哀嚎遍野,不少人宣稱自己被PUA/反擼,然后迅速達成共識:“國產項目只會PUA,毫無格局.

1900/1/1 0:00:00
我們找了三位內容公司的老板聊了聊 AI沖擊已經成了事實_GPT

“一個驚人的事實是,幾乎所有公司——不論是做游戲的,還是做直播電商、新消費、教育培訓、健身、播客、長短視頻的——都在討論一個共同話題:以ChatGPT為代表的AIGC.

1900/1/1 0:00:00
香港允許散戶在兩家交易所買賣虛擬資產 一公司股價上漲超60%_ASH

8月3日,香港加密貨幣交易所HashKey、OSL同一天宣布獲得香港證監會1號和7號牌照升級批準,業務范圍從專業投資者擴大到零售投資者.

1900/1/1 0:00:00
如何使用 ZK 和 VDF 實現「隱私 mempool」構想?_BLO

現在大部分的 L2 Sequencer 基本上都采取 「先到先出」 (FIFS)  的交易排序方式來保護用戶不被 MEV,但是這樣也弱化了區塊的價值.

1900/1/1 0:00:00
美SEC主席:當前的監管制度不具備應對AI危險的能力_人工智能

作者:Jacob Oliver,CryptoSlate;編譯:松雪,金色財經據彭博社報道,美國證券交易委員會 (SEC) 主席加里·詹斯勒 (Gary Gensler) 淡化了對加密貨幣的關注.

1900/1/1 0:00:00
ads