撰文:Sonya Huang和Pat Grady
編譯:深思圈
AIGC(AI-Generated Content 人工智能生成內容)是最近一個熱門的話題,伴隨著大量應用的落地,AI生成圖片、文字、音頻甚至視頻等內容也漸漸走入了人們的日常。
剛幾個小時前,紅杉美國官網發表了最新一篇題為《Generative AI: A Creative New World》的文章,這會代表新一輪Paradigm shift(范式轉移)的開始嗎?
讓我們一同來看看這篇文章吧,原文作者是紅杉的兩位合伙人:Sonya Huang和Pat Grady,有意思的是在文章作者一欄,赫然還寫著GPT-3的大名,并且文章插圖也是用Midjourney生成的,這篇文章本身就是AIGC的一個落地表現。以下是原文的翻譯,希望可以給大家帶來新的發現和思考。
人類擅長分析事物,而機器在這方面甚至做得就更好了。機器可以分析一組數據,并在其中找到許多用例(use case)的模式,無論是欺詐還是垃圾郵件檢測,預測你的發貨時間或預測該給你看哪個TikTok視頻,它們在這些任務中變得越來越聰明。這被稱為“分析型AI(Analytical AI)”,或傳統AI。
但是人類不僅擅長分析事物,我們也擅長創造。我們寫詩,設計產品,制作游戲,編寫代碼。直到最近,機器還沒有機會在創造性工作上與人類競爭——它們被降格為只做分析和機械性的認知工作。但最近,機器開始嘗試創造有意義和美麗的東西,這個新類別被稱為“生成式AI(Generative AI)”,這意味著機器正在生成新的東西,而不是分析已經存在的東西。
生成式AI正在變得不僅更快、更便宜,而且在某些情況下比人類創造的更好。從社交媒體到游戲,從廣告到建筑,從編程到平面設計,從產品設計到法律,從市場營銷到銷售,每一個原來需要人類創作的行業都等待著被機器重新創造。某些功能可能完全被生成式AI取代,而其他功能則更有可能在人與機器之間緊密迭代的創作周期中蓬勃發展。但生成式AI應該在廣泛的終端市場上解鎖更好、更快、更便宜的創作。人們期待的夢想是:生成式AI將創造和知識工作的邊際成本降至零,產生巨大的勞動生產率和經濟價值,以及相應的市值。
紅杉資本推出規模為5-6億美元的加密貨幣投資基金:金色財經報道,風投公司紅杉資本正在為其首個特定行業的加密基金籌集 5 億至 6 億美元資金。該基金是該公司去年 10 月宣布進行重大重組后推出的首批子基金之一。
紅杉資本通過紅杉基金(Sequoia Fund)匯集所有投資,這是一個開放式流動性投資組合,由一組精選公司的公共頭寸組成。該基金將資金分配給一系列封閉式子基金。
此外,該公司還確認了一個 9 億至 9.5 億美元的生態系統子基金,允許投資組合公司的選定創始人投資于其他相關公司,以及一個 32 億至 35 億美元的擴展子基金,專注于成長階段的公司。(CoinDesk)[2022/2/17 9:59:08]
生成式AI可以處理的領域包括了知識工作和創造性工作,而這涉及到數十億的人工勞動力。生成式AI可以使這些人工的效率和創造力至少提高10%,它們不僅變得更快和更高效,而且比以前更有能力。因此,生成式AI有潛力產生數萬億美元的經濟價值。
生成式AI與更廣泛的AI有著相同的“為什么是現在(Why now)”的原因:更好的模型,更多的數據,更多的算力。這個類別的變化速度比我們所能捕捉到的要快,但我們有必要在大背景下回顧一下最近的歷史。
第1波浪潮:小模型(small models)占主導地位(2015年前),小模型在理解語言方面被認為是“最先進的”。這些小模型擅長于分析任務,可以用于從交貨時間預測到欺詐分類等工作。但是,對于通用生成任務,它們的表達能力不夠。生成人類級別的寫作或代碼仍然是一個白日夢。
第2波浪潮:規模競賽(2015年-至今),Google Research的一篇里程碑式的論文(Attention is All You Need https://arxiv.org/abs/1706.03762)描述了一種用于自然語言理解的新的神經網絡架構,稱為transformer,它可以生成高質量的語言模型,同時具有更強的并行性,需要的訓練時間更少。這些模型是簡單的學習者,可以相對容易地針對特定領域進行定制。
The Information:明年紅杉中國與其美國總部或將分道揚鑣,紅杉資本將轉變為開放式基金:12 月 29 日消息,據 he Information 預測,出于宏觀政策原因,2022 年紅杉中國與其在美國的總公司或將分道揚鑣,來自美國的資金可能逐漸撤離中國。屆時,美國以外地區(中東等)的風投 LP(有限合伙人)將至關重要,很多加密行業 VC(風投機構)將更多投資于主權基金。
The Information 預測,由于紅杉資本在今年 10 月開始對其美國業務進行大規模重組(紅杉中國和紅杉印度并未參與),疊加監管方面壓力,紅杉中國在本土的盈利能力或將逐漸收縮,甚至可能蒙受損失。同時,紅杉資本(美國)的合伙人 Doug Leone 比沈南鵬更有可能接管紅杉資本最高職位。
此外,紅杉資本的高管此前曾表示,該機構將改變慣用的從 LP(有限合伙人)處募集資金的傳統風投模式,而只提供一個開放式基金。紅杉資本還在美國 SEC 處進行了注冊工作,以持有更多股票及加密貨幣。[2021/12/30 8:13:15]
果不其然,隨著模型越來越大,它們開始可以輸出達到人類水平的結果,然后是超人的結果。從2015年到2020年,用于訓練這些模型的計算量增加了6個數量級,其結果在書寫、語音、圖像識別、閱讀和語言理解方面超過了人類的表現水平。OpenAI的GPT-3表現尤其突出:該模型的性能比GPT-2有了巨大的飛躍,并且從代碼生成到笑話編寫的任務中都提供了出色的Twitter demo來證明。
盡管所有的基礎研究都取得了進展,但這些模型并不普遍。它們龐大且難以運行(需要特別的GPU配置),不能被更多人廣泛觸達使用(不可用或只進行封閉測試),而且作為云服務使用成本昂貴。盡管存在這些限制,最早的生成式AI應用程序也已經開始進入競爭。
紅杉資本更新推特簡介,用DAO代替公司:12月8日,紅杉資本將推特簡介更改為“我們幫助有膽識的人打造傳奇DAO,將其想法變為現實。從創意到Token空投。讓我們一起沖吧!”
據悉,紅杉資本此前的簡介為“我們幫助有膽識的人打造傳奇公司,從創意到IPO”等。[2021/12/8 12:59:04]
第3波浪潮:更好、更快和更便宜(2022+),算力變得更便宜,新技術,如擴散模型(diffusion models),降低了訓練和運行所需的成本。研究人員繼續開發更好的算法和更大的模型。開發人員的訪問權限從封閉測試擴展到開放測試,或者在某些情況下擴展到開源。
對于那些渴望接觸LLMs(Large Language Model 大語言模型)的開發人員來說,探索和應用開發的閘門現在已經打開,應用開始大量涌現。
第4波浪潮:殺手級應用出現(現在),隨著平臺層的穩固,模型繼續變得更好、更快和更便宜,模型的獲取趨于免費和開源,應用層的創造力已經成熟。
正如移動設備通過GPS、攝像頭和網絡連接等新功能釋放了新類型的應用程序一樣,我們預計這些大型模型將激發生成式AI應用程序的新浪潮。就像十年前移動互聯網的拐點被一些殺手級應用打開了市場一樣,我們預計生成式AI的殺手級應用程序也會出現,比賽開始了。
下面是一個示意圖,說明了為每個類別提供動力的平臺層,以及將在其上構建的潛在應用程序類型。
模型
文本(Text)是最先進的領域,然而,自然語言很難被正確使用并且質量很重要。如今,這些模型在一般的中短篇形式的寫作中相當出色(但即便如此,它們通常用于迭代或初稿)。隨著時間的推移,模型變得越來越好,我們應該期望看到更高質量的輸出、更長形式的內容和更好的垂直領域深度。
紅杉資本計劃加大對加密貨幣的投資:金色財經報道,風險投資巨頭紅杉資本宣布,計劃在美國證券交易委員會(SEC)注冊為投資顧問,以便更多地投資于加密貨幣等替代資產。根據紅杉合伙人Roelof Botha發表的一份聲明,該公司正在努力組建一個基金,該基金將能夠在沒有“人工時間范圍”的情況下進行投資。Botha將傳統的VC模式描述為“過時”。[2021/10/27 20:59:56]
代碼生成(Code generation)可能會在短期內對開發人員的生產力產生很大的影響,正如GitHub CoPilot所表現的那樣。此外,代碼生成還將使非開發人員更容易創造性地使用代碼。
圖片(Images)是最近才出現的現象,但它們已經像病一樣傳播開來。在Twitter上分享生成的圖片比文本有趣得多!我們正在看到具有不同美學風格的圖像模型和用于編輯和修改生成圖像的不同技術在陸續出現。
語音合成(Speech synthesis)已經出現一段時間了,但消費者和企業應用才剛剛起步。對于像電影和播客這樣的高端應用程序來說,聽起來不機械的,具有人類質量的語音是相當高的門檻。但就像圖像一樣,今天的模型為進一步優化或實現應用的最終輸出提供了一個起點。
視頻和3D模型則遠遠落后,人們對這些模型的潛力感到興奮,因為它們可以打開電影、游戲、虛擬現實、建筑和實物產品設計等大型創意市場。我們應該期待在未來1-2年內看到基礎的3D和視頻模型的出現。
還有很多其他領域,比如從音頻和音樂到生物和化學等等,都在進行基礎模型的研發。下面這張圖是基本模型進展和相關應用程序成為可能的時間表,其中2025年及以后的部分只是一個猜測。
應用程序
紅杉資本起訴趙長鵬違反投資獨家協議:據彭博社報道,香港法院文件顯示,紅杉資本起訴幣安CEO趙長鵬違反投資獨家協議。根據香港法院的文件,趙長鵬與紅杉資本在去年八月開始討論對幣安的投資事宜,討論持續了幾個月,直至12月中旬談判破裂。12月4日,趙長鵬的團隊告知紅杉資本幣安現有股東認為估值過低,約同期,趙長鵬與IDG Capital開始談判。紅杉資本認為這違反了趙與其簽訂的獨家協議。香港法院4月24日宣布將進一步舉辦聽證會判定趙是否存在過錯。趙長鵬目前尚未回應該事件。[2018/4/25]
以下是一些讓我們感到興奮的應用,這僅僅只是一部分,實際上的應用要比我們所捕捉到的多得多,我們被創始人和開發人員所夢想的創造性應用程序所吸引。
文案(Copywriting):越來越多的人需要個性化的網頁和電子郵件內容來推動銷售和營銷策略以及客戶支持,這是語言模型的完美應用。這些文案往往形式簡單,并且都有固定的模版,加上這些團隊的時間和成本壓力,應該會大大推動對自動化和增強解決方案的需求。
垂直行業的寫作助手(Vertical specific writing assistants):現在大多數寫作助手都是通用型的,我們相信為特定的終端市場構建更好的生成式應用程序有著巨大機會,比如從法律合同編寫到劇本編寫。這里的產品差異化體現在針對特定工作流的模型和UX交互的微調。
代碼生成(Code generation):當前的應用程序推動了開發人員的發展,使他們的工作效率大大提高。在安裝了Copilot的項目中,它生成了近40%的代碼。但更大的機會可能是為C端消費者賦能編程開發能力,學習提示(learning to prompt)可能會成為最終的高級編程語言。
藝術生成(Art generation):整個藝術史和流行文化的世界現在都被編碼進了這些大型模型中,這將允許任何人隨意探索在以前可能需要花人一輩子的時間才能掌握的主題和風格。
游戲(Gaming):在這方面的夢想是使用自然語言創建復雜的場景或可操縱的模型,這個最終狀態可能還有很長一段路要走,但在短期內有更直接的選擇,如生成紋理和天空盒藝術(skybox art)。
媒體/廣告(Media/Advertising):想象一下自動化代理工作的潛力,為消費者實時優化廣告文案和創意。多模態生成的絕佳機會是將銷售信息與互補的視覺效果結合起來。
設計(Design):設計數字和實物產品的原型是一個勞動密集型的迭代過程,AI根據粗略的草圖和提示來制作高保真的效果圖已經成為現實。隨著3D模型的出現,生成設計的過程將從制造和生產延伸到實物,你的下一個iPhone APP或運動鞋可能是由機器設計的。
社交媒體和數字社區(Social media and digital communities):是否存在使用生成工具表達自我的新方式?隨著Midjourney等新應用學會了像人類一樣在社交網絡上創作,這將創造新的社交體驗。
生成式AI應用程序會是什么樣子?以下是一些預測:
智能和模型微調
生成式AI應用是建立在GPT-3或Stable Diffusion等大型模型之上的,隨著這些應用獲得更多的用戶數據,它們可以對模型進行微調,一方面針對特定的問題空間改進模型質量和性能,另外一方面減少模型的大小和成本。
我們可以把生成式AI應用看作一個UI層和位于大型通用模型“大大腦(big brain)”之上的“小大腦(little brain)”。
形成的因素
如今,生成式AI應用在很大程度上以插件的形式存在于現有的軟件生態系統中。比如代碼生成在你的IDE中,圖像生成在Figma或Photoshop中,甚至Discord機器人也是將生成AI放在數字社交社區里的工具。還有少量獨立的生成式AI Web應用,如在文案方面有Jasper和Copy.ai,在視頻剪輯方面有Runway,在做筆記方面有Mem。
插件的形式可能是生成式AI應用在早期比較好的切入點,它可以克服用戶數據和模型質量方面面臨的“先有雞還是先有蛋”的問題(這里具體指的是:一方面需要分發來獲得足夠多的使用數據,從而來改進模型,另外一方面又需要好的模型來吸引用戶)。我們已經看到這種策略在其他市場類別中取得了成功,如消費者和社交市場。
交互范式
如今,大多數生成式AI演示都是“一次性”的:你提供一個輸入,機器吐出一個輸出,你可以保留它或扔掉它,然后再試一次。未來,模型將會支持迭代,你可以使用輸出來修改、調整、升級和生成變化。
如今,生成式AI輸出被用作原型或初稿。應用程序非常擅長拋出多個不同的想法,以使創作過程繼續(比如一個logo或建筑設計的不同選項),它們也非常擅長給出初稿,但需要用戶最終潤色來定稿(比如博客帖子或代碼自動完成)。隨著模型變得越來越智能,同時部分借助于用戶數據,我們應該期待這些草稿會變得越來越好,直到它們足夠好,可以用作最終產品。
持續的行 業領導力
最好的生成式AI公司可以通過在用戶粘性、數據和模型性能之間形成的飛輪來產生可持續的競爭優勢。為了取得勝利,團隊必須通過以下方法來實現這個飛輪:
擁有出色的用戶粘性→將更多的用戶粘性轉化為更好的模型性能(及時改進、模型微調、把用戶選擇作為標記訓練數據)→使用出色的模型性能來推動更多的用戶增長和留存。
他們可能會專注于特定的領域(如代碼、設計和游戲),而不是試圖解決所有人的問題。他們可能首先將深度集成到現有的應用程序中,以便在此基礎上利用和分發自己的程序,然后嘗試用AI原生工作流替換現有的應用程序。用正確的方式構建這些應用來積累用戶和數據是需要時間的,但我們相信最好的應用將會是持久的,并有機會變得龐大。
盡管生成式AI具有巨大的潛力,但在商業模式和技術方面仍有許多問題需要解決。比如版權、信任、安全和成本等重要問題還亟待解決。
生成式AI仍然非常早期。平臺層剛剛有起色,而應用層領域才剛剛起步。
需要明確的是,我們不需要利用大型語言模型的生成式AI來編寫托爾斯泰小說。這些模型現在已經足夠好了,可以用來寫博客文章的初稿,以及生成logo和產品界面的原型,這在中短期內將會創造大量的價值。
生成式AI應用的第一波浪潮類似于iPhone剛出現時的移動應用場景——有些噱頭但比較單薄,競爭差異化和商業模式不明確。然而,其中一些應用程序提供了一個有趣的視角,讓我們可以一窺未來可能會發生什么。一旦你看到了機器可以產生復雜的功能代碼或精彩的圖片,你就很難想象未來機器在我們的工作和創造中不再發揮作用。
如果我們允許自己夢想幾十年后,那么很容易想象一個未來,生成式AI將深深融入我們的工作、創作和娛樂方式:備忘錄可以自己寫,3D打印任何你能想象的東西,從文字到皮克斯電影,像Roblox類似的游戲體驗來快速創造出豐富的世界。雖然這些在今天看起來像是科幻小說,但科技進步的速度是驚人的。從微小(narrow)的語言模型到代碼自動生成只用了幾年時間,如果我們繼續沿著這個變化的速度,并遵循“大模型摩爾定律(Large Model Moore's Law)”,那么這些遙不可及的場景就會變得觸手可及。
深潮TechFlow
個人專欄
閱讀更多
財經法學
成都鏈安
金色早8點
Bress
鏈捕手
PANews
Odaily星球日報
Tags:IONODEGENNERANewSolution 2.0YodeSwapNecessary Genuine KeyNext Generation Network
【0918 - 0924】周報概要:1、上周 NFT 市場成交量有所回落,較上周下降約 -9.7%;其中 X2Y2 周成交額持續位居榜首,份額占比 45.8%.
1900/1/1 0:00:00原文標題:《Nori,Web 3.0 自愿碳減排的積極實踐》撰文:shear-manman.eth2017 年,Nori 作為一家依托區塊鏈技術搭建碳清除市場的新創業公司.
1900/1/1 0:00:002022年,波譎云詭,在愁云慘淡的整頓潮、裁員潮中,Web3逆勢為大環境開辟了一條新的路。根據相關數據顯示,僅2022年一季度,Web3領域的投資額就達到了近百億美元,是去年同期水平的兩倍多.
1900/1/1 0:00:00來源:老雅痞 可能人就是有點犯賤,當給了指定的選題的時候,會想著被“束縛”了,當讓你自由發揮的時候,又會想著沒有選題,范圍太大,思前想后都下不了筆。以前我也喜歡沖圖狗,快進快出,跑得快就行.
1900/1/1 0:00:00作者:Chenglin Pua(馬來西亞)硅谷是許多高科技公司的誕生地。而在硅谷里,有那么一家頂尖的孵化器,專門為初創公司提供學習以及尋找融資的平臺,即Y Combinator.
1900/1/1 0:00:00美國眾議院提出穩定幣法案草案,認為發行和創建新的“內生抵押穩定幣”是非法的。在Terra/UST這一套算法穩定幣體系崩潰之后,美國加強了對穩定幣的關注.
1900/1/1 0:00:00