比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > LTC > Info

A16Z:生成式人工智能領域的 4 個突破點_CHA

Author:

Time:1900/1/1 0:00:00

大型語言模型(LLMs)已經成為科技行業的熱點,為我們提供了一些令人稱奇的體驗——從幾秒鐘內編寫一周的代碼,到生成比與人類進行的對話更富有共情的對話。通過使用成千上萬個GPU進行數萬億令牌的數據訓練,LLMs展示了出色的自然語言理解能力,并改變了文案和代碼等領域,將我們推進了全新、令人興奮的生成式AI時代。與任何新興技術一樣,生成式AI也受到了一些批評。盡管這些批評在一定程度上反映了LLMs當前能力的局限性,但我們將這些阻礙視為進一步創新的機會,而不是技術本質性的缺陷。

為了更好地了解LLMs的近期技術突破,并為創始人和運營者做好未來準備,我們與一些領先的生成式AI研究人員進行了交談,他們正在積極構建和訓練一些最大最前沿的模型,包括Anthropic公司的首席執行官Dario Amodei、Cohere公司的首席執行官Aidan Gomez、Character.AI公司的首席執行官Noam Shazeer以及AI21 Labs的Yoav Shoham。這些交談確定了未來即將到來的4個關鍵創新方向:導向、記憶、"手和腳"以及多模態。在本文中,我們將討論這些關鍵創新如何在未來6到12個月內發展,以及對于對將AI整合到自己的業務中感興趣的創始人來說,如何利用這些新進展。

導向

許多創始人對在其產品和工作流程中使用LLMs表示擔憂,因為這些模型有可能產生幻覺和重現偏見。為了解決這些問題,一些領先的模型公司正在致力于改進導向技術——一種在LLMs輸出中更好地控制模型結果、讓模型更好地理解和執行復雜用戶需求的方法。Noam Shazeer在這方面提到了LLMs和孩子之間的相似之處:“這是如何更好地引導[模型]的問題...我們在LLMs上面臨的問題就是我們需要正確的方式告訴它們如何按照我們的要求行事。小孩子也是如此——他們有時會編造事情,對幻想和現實沒有一個明確的理解。”盡管在模型提供商和類似Guardrails和LMQL的工具出現之后,在導向能力方面已經取得了顯著的進展,研究人員仍在不斷取得進步,我們認為這對于更好地將LLMs產品化對于最終用戶至關重要。

近一周內a16z相關地址已有9004枚MKR轉入Coinbase:金色財經報道,據鏈上分析師余燼監測,a16z關聯的0xd520開頭地址于9小時前將1500枚MKR(約140萬美元)轉入Coinbase。最近一周a16z關聯地址已將9004MKR(約843萬美元)轉入Coinbase,目前a16z相關地址還共計持有28514枚MKR(約2670萬美元)。[2023/7/18 11:01:32]

在企業公司中,改進的導向尤其重要,因為不可預測行為的后果可能是昂貴的。Amodei指出,LLMs的不可預測性會讓人們感到不安,作為一個API提供者,他希望能夠“對著客戶說‘不,模型不會做這個’,或者至少很少會這樣做。”通過改進LLMs的輸出,創始人們可以更有信心地確保模型的性能與客戶需求相符。改進的導向還將為其他行業的廣泛采用鋪平道路,這些行業對精確性和可靠性的要求更高,例如廣告行業,其中廣告投放的風險很高。Amodei還認為改進的導向可以應用于“法律用例、醫療用例、存儲金融信息和管理金融賭注,以及需要保護公司品牌的場景。您不希望您所整合的技術是不可預測或難以預測或刻畫的。”通過更好的導向,LLMs還能夠在少量提示工程的情況下完成更復雜的任務,因為它們將能夠更好地理解整體意圖。

LLMs導向方面的進展還有可能在用戶期望定制和準確回應的敏感消費者應用中開啟新的可能性。雖然當用戶與LLMs進行對話或創造性交互時,他們可能會容忍較低準確性的輸出,但是當用戶使用LLMs來協助日常任務、指導重要決策或增強生活教練、治療師和醫生等專業人士時,他們希望得到更準確的輸出。有人指出,LLMs有望取代搜索等已深入人心的消費者應用,但在這成為真正可能之前,我們可能需要更好的導向來改善模型輸出并建立用戶信任。

美國參議院銀行主席敦促FDIC調查由A16z支持的金融科技公司Tellus:金色財經報道,美國參議院銀行、住房和城市事務委員會主席、美國參議員謝羅德·布朗致信FDIC 主席馬丁·格倫伯格,表達了對 Tellus 索賠的擔憂。在信中,布朗敦促 FDIC 審查 Tellus 的商業行為,以確保客戶免受金融欺詐和濫用。Tellus 是一家由 Andreessen Horowitz 支持的金融科技公司,聲稱它可以通過使用這筆錢為某些美國單戶住宅貸款提供資金來為人們提供更高的儲蓄余額收益率。[2023/5/5 14:43:19]

關鍵突破點:用戶可以更好地定制LLMS的輸出。

記憶

由LLMs驅動的文案撰寫和廣告生成應用程序已經取得了巨大的成功,從而在營銷人員、廣告商和創業者中迅速流行起來。然而,目前大多數LLMs的輸出相對泛化,這使得難以將它們用于需要個性化和情境理解的用例。雖然提示工程和微調可以提供一定程度的個性化,但是提示工程的可擴展性較差,而微調往往代價高昂,因為它需要一定程度的重新訓練,并且通常需要與大多數閉源LLMs緊密合作。為每個個體用戶進行微調模型通常是不可行或不可取的。

上下文學習是實現這一目標的圣杯,其中LLMs從您的公司生成的內容、您公司的特定行話和特定上下文中獲取信息,以創建更精細、針對特定用例的輸出。為了實現這一目標,LLMs需要增強的記憶能力。LLM記憶有兩個主要組成部分:上下文窗口和檢索。上下文窗口是模型可以處理和用于指導其輸出的文本,除了它被訓練的數據語料庫之外。檢索是指從模型的訓練數據語料庫之外的數據體中檢索和引用相關信息和文檔(“上下文數據”)。目前,大多數LLMs的上下文窗口有限,無法原生地檢索附加信息,因此生成的輸出缺乏個性化。然而,通過更大的上下文窗口和改進的檢索,LLMs可以直接提供更加精細的、針對個別用例的輸出。

a16z crypto任命Eddy Lazzarin為新的首席技術官:金色財經報道,a16z crypto周三表示,任命Eddy Lazzarin為首席技術官,負責監督風險投資基金的研究和安全團隊。 a16z crypto創始人兼管理合伙人Chris Dixon在博客文章中寫道,在這個領域的技術專家中脫穎而出需要真正特殊的智慧,我們很幸運能在我們的團隊中擁有這樣的人。

此前擔任公司工程主管的Lazzarin 將繼續領導工程和數據科學團隊。據其網站稱,A16z crypto投資于加密和web3初創公司,已籌集超過76億美元。[2023/2/9 11:56:12]

特別是通過擴展上下文窗口,模型將能夠處理更大量的文本并更好地保持上下文,包括在對話中保持連貫性。這將進一步顯著提高模型在需要更深入理解較長輸入的任務中的能力,例如總結長篇文章或在長時間對話中生成連貫且上下文準確的回應。在上下文窗口方面,我們已經看到了顯著的改進——GPT-4具有8k和32k標記的上下文窗口,相比之下,GPT-3.5和ChatGPT的上下文窗口分別為4k和16k標記,而Claude最近將其上下文窗口擴展到驚人的100k標記。

僅擴展上下文窗口并不能充分改善內存,因為推理的成本和時間與提示的長度呈準線性甚至二次方關系。檢索機制通過與提示相關的上下文數據增強和完善LLM的原始訓練語料庫。由于LLMs是在一個信息體上進行訓練的,并且通常難以更新,檢索的兩個主要好處是根據Shoham的說法:“首先,它允許您訪問在訓練時沒有的信息源。其次,它使您可以將語言模型聚焦在您認為與任務相關的信息上。”矢量數據庫(例如Pinecone)已成為高效檢索相關信息的事實標準,并且作為LLMs的內存層,使模型更容易快速準確地搜索和引用海量信息中的正確數據。

VeeFriends宣布完成5000萬美元種子輪融資,a16z領投:金色財經報道,VeeFriends宣布完成5000萬美元的種子輪融資,a16z領投。融資用于支持構建283個VeeFriends角色的未來知識產權,及推動其創意、技術和體驗業務的擴張計劃。[2022/7/29 2:44:58]

增加的上下文窗口和檢索將在企業用例中尤為重要,例如導航大型知識庫或復雜數據庫。公司將能夠更好地利用其專有數據,如內部知識、歷史客戶支持票據或財務結果,作為LLMs的輸入,而無需進行微調。改進LLMs的記憶將在培訓、報告、內部搜索、數據分析和業務智能以及客戶支持等領域帶來改進和深度定制的能力。

在消費者領域,改進的上下文窗口和檢索將實現強大的個性化功能,從而革新用戶體驗。Noam Shazeer認為:“其中一個重大突破將是開發出一種具有非常高的內存容量,可以針對每個用戶進行定制,同時在規模上仍然具有成本效益的模型。您希望您的治療師了解您的生活方方面面;您希望您的老師了解您已經掌握的知識;您希望生活教練能夠就正在發生的事情向您提供建議。他們都需要上下文。” Aidan Gomez對此發展也表示興奮。“通過讓模型訪問與您獨特相關的數據,如您的電子郵件、日歷或直接消息,”他說,“模型將了解您與不同人的關系以及您如何與朋友或同事交談,并在這種情況下幫助您最大程度地提供幫助。”

關鍵突破點:LLMs將能夠考慮大量相關信息,并提供更個性化、定制和有用的輸出。

“手臂和腿部”:賦予模型使用工具的能力

LLMs的真正威力在于使自然語言成為行動的媒介。LLMs對常見且有詳細文檔的系統具有復雜的理解能力,但它們無法執行從這些系統中提取的任何信息。例如,OpenAI的ChatGPT、Anthropic的Claude和Character AI的Lily可以詳細描述如何預訂航班,但它們本身無法原生地預訂航班(盡管像ChatGPT的插件等技術進展正在推動這一邊界)。Amodei表示:“這個大腦在理論上擁有所有這些知識,只是缺少從名稱到按鈕的映射。”他說:“連接這些電纜并不需要太多的訓練。你有一個沒有實體的大腦,它知道如何移動,但它還沒有連接上手臂和腿部。”

A16z發布面向世界領導人的Web 3政策提案:金色財經報道,風險投資公司a16z發布了一份針對全球政府的政策議程,其中有關于如何 \"建立一個更好的互聯網 \"的10條指導原則。在該議程中,a16z鼓勵世界各國領導人積極思考Web 3政策,首先是建立一個清晰的愿景,提供適用于數字資產的清晰和公平的稅收規則,擁抱多方利益相關者的治理等等。Web 3指的是可能的下一代互聯網,包括去中心化的協議,旨在減少互聯網用戶對Facebook和亞馬遜等科技巨頭的依賴性。

去年10月,這家風險投資公司發布了一份針對美國立法者的類似的35頁報告,名為 \"如何贏得未來\",以及向參議院銀行委員會提出的關于澄清數字資產相關法律的建議。(coindesk)[2022/1/8 8:33:59]

隨著時間的推移,我們已經看到公司不斷改善LLMs使用工具的能力。像必應和谷歌這樣的老牌公司和Perplexity和You.com這樣的初創公司推出了搜索API。AI21 Labs推出了Jurassic-X,它通過將模型與一組預定工具(包括計算器、天氣API、維基百科API和數據庫)結合起來,解決了獨立LLMs的許多缺陷。OpenAI推出了ChatGPT的插件測試版,允許ChatGPT與Expedia、OpenTable、Wolfram、Instacart、Speak、網絡瀏覽器和代碼解釋器等工具進行交互,這一突破被認為類似于蘋果的“應用商店”時刻。最近,OpenAI在GPT-3.5和GPT-4中引入了函數調用 ,允許開發者將GPT的能力與任何外部工具進行鏈接。

通過從知識挖掘轉向行動導向,增加手臂和腿部的能力有望在各種公司和用戶類型之間實現一系列用例。對于消費者而言,LLMs可能很快就能給出菜譜建議,然后為您訂購所需的食材,或者建議一個早午餐地點并為您預訂餐桌。在企業領域,創始人可以通過接入LLMs使他們的應用程序更易于使用。正如Amodei所指出的:“對于從用戶界面角度來說非常難以使用的功能,我們可能只需用自然語言描述即可實現復雜的操作。”例如,對于Salesforce等應用程序,LLM集成應允許用戶用自然語言進行更新,并使模型自動進行這些更改,從而大大減少了維護CRM所需的時間。像Cohere和Adept這樣的初創公司正在致力于將LLMs集成到這類復雜工具中。

Gomez認為,雖然LLMs能夠在2年內使用Excel等應用程序的可能性越來越大,但“仍然需要進行許多細化工作。我們將擁有第一代能夠使用工具的模型,這將是引人注目但易碎的。最終,我們將獲得夢寐以求的系統,我們可以將任何軟件交給模型,并附上一些描述,例如‘這是工具的功能,這是如何使用它的’,它將能夠使用它。一旦我們可以為LLMs提供特定和通用的工具,它所帶來的自動化將成為我們領域的巔峰之作。”

關鍵突破點:LLMs將能夠與我們今天使用的工具進行更加有效的交互。

多模態

盡管聊天界面對許多用戶來說令人興奮和直觀,但人類聽和說語言的頻率可能與寫或讀語言的頻率相當或更高。正如Amodei所指出的:“AI系統能做的事情是有限的,因為并不是所有的事情都是文本。”具備多模態功能的模型能夠無縫地處理和生成多種音頻或視覺格式的內容,將這種交互擴展到超越語言的領域。像GPT-4、Character.AI和Meta的ImageBind這樣的模型已經能夠處理和生成圖像、音頻和其他模態,但它們在這方面的能力還比較基礎,盡管進展迅速。用Gomez的話說,我們的模型在字面上今天是盲的,這一點需要改變。我們構建了很多假設用戶能夠看到的圖形用戶界面(GUI)。

隨著LLMs不斷進化,更好地理解和與多種模態交互,它們將能夠使用依賴GUI的現有應用程序,比如瀏覽器。它們還可以為消費者提供更加引人入勝、連貫和全面的體驗,使用戶能夠超越聊天界面進行互動。Shazeer指出:“多模態模型的許多出色整合可以使事物更具吸引力和與用戶更緊密相連。”他還說:“我認為,目前大部分核心智能來自文本,但音頻和視頻可以使這些事物更有趣。”從與AI導師進行視頻聊天到與AI合作迭代和編寫電視劇劇本,多模態有潛力改變娛樂、學習與發展以及跨各種消費者和企業用例的內容生成。

多模態與工具使用密切相關。盡管LLMs最初可能通過API與外部軟件進行連接,但多模態將使LLMs能夠使用設計給人類使用但沒有自定義集成的工具,例如傳統的企業資源計劃(ERP)系統、桌面應用程序、醫療設備或制造機械。在這方面,我們已經看到了令人興奮的進展:例如,谷歌的Med-PaLM-2模型可以合成乳腺攝影和X射線圖像。而且從長遠來看,多模態(特別是與計算機視覺的集成)可以通過機器人、自動駕駛車輛和其他需要與物理世界實時交互的應用程序,將LLMs擴展到我們自己的物理現實中。

關鍵突破點:多模態模型能夠在沒有重大定制的情況下推理圖像、視頻,甚至物理環境。

盡管LLMs存在一些實際限制,但研究人員在短時間內對這些模型進行了驚人的改進。事實上,我們在撰寫本文時已經多次更新過它,這證明了該領域技術的快速發展。Gomez也表示同意:“LLM在20次中有1次編造事實顯然還是太高了。但我真的非常有信心,這是我們第一次構建這樣的系統。人們的期望相當高,所以目標已經從‘計算機很笨,只會做數學’變成了‘一個人可能做得更好’。我們已經足夠彌合差距,以至于批評集中在人類能做到什么程度上。”

我們特別對以下4項創新感到興奮,它們正處于改變創業者構建產品和經營公司方式的臨界點。從長遠來看,潛力更大。Amodei預測:“在某個時刻,我們可能會擁有一個模型,它能夠閱讀所有生物數據,并找出治愈癌癥的方法。”現實情況是,最好的新應用可能仍然是未知的。在Character.AI,Shazeer讓用戶開發這些用例:“我們將看到許多新的應用程序解鎖。對我來說很難說出這些應用程序是什么。將會有數百萬個應用程序,用戶比少數工程師更善于發現如何使用技術。”我們迫不及待地期待這些進步將如何影響我們作為創業者和公司在生活和工作中的方式,因為這些新工具和能力賦予了我們新的力量。

感謝Matt Bornstein、Guido Appenzeller和Rajko Radovanovi?在撰寫過程中提供的意見和反饋。

DoraFactory

個人專欄

閱讀更多

金色早8點

Odaily星球日報

金色財經

Block unicorn

DAOrayaki

曼昆區塊鏈法律

Tags:LMSGPTCHAAMOLMS幣FGPT價格bcha幣最新消息FreshCut Diamond

LTC
Matter-Labs :引介ZK Stack —— 構建ZK驅動的主權鏈模塊化框架_STACK

作者:zkSync;編譯:Kate, Marsbit 今天,我們很高興地分享我們實現這一使命的擴展愿景:ZK堆棧(ZK Stack),一個用于構建ZK驅動的主權鏈的模塊化框架.

1900/1/1 0:00:00
a16z 創始人:AI 是「終極媒體」_AND

作者:Li Yuan,極客公園投資圈里最會做媒體的,媒體圈里最會做投資的。用這句話來形容知名投資機構 a16z 的創始人 Marc Andreessen,可以說非常貼切了.

1900/1/1 0:00:00
DEX困境下 Uniswap V4解決了哪些問題?_DEX

Uni v4 草稿的發布是一件能夠極大振奮人心的事情,雖然又與其 token 賦能無關,且還沒有公布具體的發布日期,但是它提出了兩個核心的創新,一是 Hook,二是 The Singleton.

1900/1/1 0:00:00
打破區塊鏈的不可篡改性:代理模式如何實現智能合約升級?_ALL

代理模式使智能合約能夠升級其邏輯,同時維持其鏈上地址和狀態值。對代理合約的調用會通過delegateCall的方式執行來自邏輯合約的代碼,以修改代理合約的狀態.

1900/1/1 0:00:00
ZKML與分布式算力:AI與Web3的潛在治理敘事_SYNC

關于ZKML:ZKML(Zero Knowledge Machine Learning)是一種機器學習技術,它結合了零知識證明(Zero-Knowledge Proofs)和機器學習算法.

1900/1/1 0:00:00
關于OpenAI、DeepMind等向英國政府開放模型的幾點看法_PEN

OpenAI、DeepMind將向英國政府開放模型?英國首相Rishi Sunak周一在倫敦科技周上宣布.

1900/1/1 0:00:00
ads