比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > MATIC > Info

文心一言 vs GPT-4實測 百度背水一戰交卷_ATG

Author:

Time:1900/1/1 0:00:00

GPT-4發布一天之后,壓力全部給到百度這邊。

就在剛剛,百度交卷。

文心一言,百度全新一代知識增強大語言模型,正式在百度總部會議室里發布。

在一片靜寂的氛圍里,李彥宏小步登場,語氣里帶著點緊張:

大家的期望值,是我們對標ChatGPT,對標GPT-4,這個門檻有點高。

十月懷胎,我們就帶大家來看看這個AI大模型文心一言長什么樣。

此前,有人狂轉meme圖把百度比作GPT-4旁邊的垃圾箱。

也有人鼓吹百度是全村的希望。

而在發布會進行的同時,百度港股市值大幅下跌,相關話題還沖上了微博熱搜。

但直播彈幕中也有網友點贊:

那么這個中國版ChatGPT到底實力如何?

咱們就用百度發布會演示的預錄制Demo,對比一下嶄新出爐的GPT-4,先憑實力說話。

文心一言vsGPT-4

和GPT-4一樣,文心一言是一個多模態大模型。

李彥宏開場就展示了文心一言具備的5種能力,包括文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成。

文心一言甚至還現場秀了一口接地氣的四川話,現場網友發出一片笑聲:

人民日報海外版:區塊鏈正在多領域大展身手:金色財經報道,《人民日報海外版》(2023年07月19日 第08版)刊文,近日,首個區塊鏈技術領域國家標準發布。區塊鏈在防偽溯源、供應鏈管理、司法存證、政務數據共享、民生服務等場景中正廣泛應用。專家認為,相關利好政策落地,給區塊鏈應用帶來更多發展機遇。

農產品“全鏈條追溯”,在山東省濰坊市坊安街道洼里村玉泉洼種植專業合作社的韭菜種植基地里,傳感器布滿田邊地角,攝像頭24小時不間斷運轉,將菜地數據實時傳輸“上鏈”。據介紹,“區塊鏈+韭菜”是濰坊市和農業農村部信息中心、中國電信集團有限公司探索的創新應用,由于區塊鏈具有不可篡改、不可偽造等特點,蔬菜生產、采摘、物流、銷售的每一步操作數據都留存在區塊鏈平臺上,全過程可追溯。[2023/7/31 16:07:43]

其他能力如何?我們具體展開來看。

文學創作

在文學創作上,李彥宏一開場就搬出了《三體》作者劉慈欣坐鎮。

先讓文心一言介紹一下大劉,畢竟我也是劉慈欣老鄉嘛:

看起來沒什么問題。同樣的問題問問GPT-4呢?

嗯???直接把劉慈欣的老家挪到了湖北省洪湖市。湖北人狂喜。

隨后,李彥宏又展示了從哲學的角度對這段文章進行續寫的demo:

看起來中規中矩,比較理性。老樣子,我們也來與GPT-4進行一波對比:

Polygon zkEVM聯創:Polygon zkEVM能夠以0.000058美元的費用證明一筆交易的真實性:金色財經報道,Polygon zkEVM聯合創始人 Nailwal 表示,Polygon zkEVM 能夠以 0.000058 美元的費用證明一筆交易的真實性。這使得其生態系統的成本對于 dApp 及其用戶而言幾乎可以忽略不計。所以你現在擁有非常便宜的成本 txns,到L1的出口時間小于5分鐘,無需等待 7 天。[2023/6/11 21:29:07]

這波你是想看GPT-4續寫的《三體》,還是文心一言的?

再來看看《三體》電視劇中扮演史強和汪淼的老搭檔,于和偉和張魯一,有什么共同點?

也沒什么問題。

就是看起來展示的速度有點快,比李彥宏的語速還要快上那么一點點。

商業文案創作

接下來,李彥宏又展示了一下文心一言在商業文案創作上的能力。

比如給新公司起個名字。

并且這個名字它還不是瞎起的:

再來看看GPT-4起名的效果?

看起來,GPT-4對中文的掌控能力相比之下還是少了一點精髓。

Web3游戲平臺NAGA計劃6月上線,已提供多鏈游戲庫:5月25日消息,Web3 游戲平臺 NAGA 計劃 6 月上線,已提供開放的多鏈游戲庫,支持 10 條公鏈,收錄 3000 多款游戲,包括鏈上游戲數據分析、Web3 游戲成就系統、內置游戲 NFT 市場、提供游戲市場的 Launchpad,并正計劃上線 Bitcoin Ordinals NFT 權益 Pass 卡。[2023/5/25 10:39:18]

至于寫個公司成立的新聞稿?對文心一言來說似乎也不成問題:

數理邏輯推算

數學能力,是考驗生成式大模型的一大難題。ChatGPT剛上線時,也翻了不少車。

不過在現場,文心一言處理的數學問題不算復雜,是小學數學競賽常見的雞兔同籠問題。

彩蛋是,李彥宏現場展示的第一題,引得文心一言說出了《狂飆》里高啟盛的經典臺詞:這題出得不對。

修改一下題目,OK,再扔給文心一言試試:

看起來,答案還算是有理有據,一步步邏輯推理出來的那種。

李彥宏表示,這些題不敢說百分之一百能做對,但至少體現了文心一言的思考歷程。

中文理解

接下來,李彥宏著重展示了一下文心一言對中文的理解能力,并特意強調:

審計機構Mazars:幣安比特幣儲備率達 101%:金色財經報道,據審計機構 Mazars 在網站發布的公告顯示,Mazars 于北京時間 2022 年 11 月 23 日 7:59:59,對幣安控制資產中的比特幣、以太坊上 BTCB 和 BNB Chain 上 BBTC 在比特幣區塊高度 764327 的持有情況進行了審計,結果為幣安持有的比特幣資產是其負債(客戶存入資產)的 101%,幣安的比特幣負債約 575742.4228 枚。Mazars 表示,本次審計考慮了以其他資產為抵押品借出以上三種資產的情況。[2022/12/7 21:29:09]

文心一言對中國文化的了解,理應超出任何一個預訓練大模型。

一上來就是一個成語,洛陽紙貴到底有多貴?

這是文心一言的效果展示:

還解釋了一下這個成語背后的經濟學原理:

那么,將這個問題拋給GPT-4呢?首先問問它,知不知道洛陽紙貴是什么意思:

接下來,再問問他對應的經濟學理論是什么:

這波看起來,GPT-4的中文理解似乎也不輸文心一言啊。

那么,再來看看二者寫藏頭詩的能力?

美股開盤,三大股指均上漲:金色財經報道,行情顯示,美股開盤,三大股指均高開上漲,道瓊斯指數7月18日(周一)開盤上漲271.80點,漲幅0.87%,報31560.06點;標普500指數7月18日(周一)開盤上漲30.70點,漲幅0.79%,報3893.86點;納斯達克綜合指數7月18日(周一)開盤上漲102.20點,漲幅0.89%,報11554.62點。[2022/7/18 2:21:09]

首先是文心一言的效果展示:

接下來,我們再看看GPT-4怎么說:

誒,看起來反而是GPT-4沒有真正理解藏頭詩的含義。

這波文化理解上,屬實是文心一言小勝一籌了。

不過在英文上,李彥宏也承認,雖然文心一言也能處理,但能力是顯著不如中文的。

這也和百度目前能用到的訓練數據有關。

多模態生成

最后,李彥宏還簡單展示了一下文心一言多模態生成的能力。

首先來看看,為即將到來的2023世界智能交通大會創作海報。

而除了前文展示過的文字轉四川話能力,文心一言還能文字轉視頻。

李彥宏一句指令,將以上內容生成視頻,很快啊,不到幾秒鐘,文心一言就把字幕和視頻做好了:

有些遺憾的是,在ChatGPT被頻頻稱贊的編程方面,文心一言并沒有現場展示相關能力。

但王海峰透露,文心一言的訓練數據中同樣包括代碼。

文心一言如何“跑通”?

正如ChatGPT脫胎于OpenAI的GPT系列,百度這次推出的文心一言,背后也正是基于文心大模型技術打造。

據王海峰介紹,文心一言主要脫胎于兩大模型:

百度ERNIE系列知識增強千億大模型,以及百度大規模開放域對話模型PLATO。

在此基礎上,主要采用了六項核心技術。

其中三個是廣為人知的大模型技術,包括有監督精調、人類反饋強化學習和提示構建。

p.s.人類反饋強化學習也是ChatGPT的關鍵技術。

另外三個,則是百度比較有特色的技術,包括知識增強、檢索增強和對話增強技術。

首先來看與ChatGPT類似的技術:有監督精調、RLHF和提示構建。

有監督精調,尤其指中文方面的數據精調。百度基于對中國語言文化和中國應用場景的理解,篩選了特定的數據來訓練模型。

至于人類反饋的強化學習和提示構建,操作上也與ChatGPT大差不差。

隨后是百度提出的、用于進一步改善模型效果的技術。

知識增強,包括知識內化和知識外用兩個部分。其中,知識內化即將知識滲透進模型參數中;知識外用指的是模型可以直接使用外部的知識。

檢索增強,則與百度搜索引擎積累的檢索技術有關。

百度將把檢索技術和生成技術結合起來,先對內容進行檢索后,將比較有用的部分用于生成,再整合輸出結果:

最后是對話增強部分,包括之前百度積累的記憶機制、上下文理解和對話規劃等技術:

概括來看,文心一言表現出的能力,被李彥宏稱為智能涌現:當參數達到千億量級,訓練語料達到足夠多的情況下,這種現象就會發生。

目前,百度擁有的AI技術可以分為四個部分,芯片、框架、模型和應用。

之所以軟硬件都要布局,百度稱,是為了降低成本:生成式AI需求的算力非常高,費用相當昂貴。

因此,如果在四層架構之間相互進行協同優化,就能讓它的效率比別人更高,從而顯著降低成本。

李彥宏認為,這也正是百度的優勢所在:四層都有領先產品的公司,絕無僅有。

這次文心大模型背后的硬件算力,也是通過百度智能云提供服務。

目前,文心一言已經接入百度搜索,目的在于提升搜索資源效率。

同時,包括小度和自動駕駛Apollo等產品,以及愛奇藝等公司也已經接入百度的文心一言模型。

網友:看來還不用提前退休

截至發稿,百度港股股價在一波明顯下跌之后,有所回彈。

發布會結束,網友反應最多的是提前錄制有點敗好感:

對于這一點,李彥宏的解釋是,給出的問題都比較長,為了節約現場時間,所以才用了提前錄制的形式。

還有不少網友對文心一言展示出的能力不太滿意。有人調侃,看完之后感覺提前退休的日子看起來還可以緩一緩:

離GPT-4還差了20個老胡。

還有網友感覺,文心一言的發布會像極了畢業答辯的自己:

不過也有網友表示,希望能給國產產品一點時間一點耐心。

發布會末尾,王海峰宣布,文心一言將從今天開始對外進行測試,包括個人用戶和企業用戶。

是騾子是馬,相信接下來,會得到更多驗證。

OneMoreThing

對了,有網友表示,已經拿到了文心一言的內測資格:

你好,感謝您體驗文心一言,體驗地址:https://yiyan.baidu.com/welcome,希望您在體驗當中給予更多意見,文心一言邀請碼:KFCVME50RMB,2023年3月16日24:00前有效。

嗯,萬物瘋狂星期四。

Tags:GPTCHACHATATG人工智能chatGPT下載blockchainBusiness官網chatcoin幣還有救嗎CATGE幣

MATIC
抄作業ENS 為何SpaceID發空投卻被罵翻天?_SPACE

別人家發空投,用戶都是載歌載舞,感謝爸爸,SpaceID發空投一片哀嚎,恨不得把項目方祖墳都刨了.

1900/1/1 0:00:00
我如何在Crypto中 3年1000倍to $10M?_CRYPT

原文作者:VINCERO我是如何進入?Crypto?的?2017?年,在?Bali,當時也算是個?Nomad,但是還不懂什么是?Crypto.

1900/1/1 0:00:00
如何將交互式的零知識證明(zk proof)協議改造為非交互式_PRO

前言 密碼學當中的零知識證明技術在web3世界有著廣泛的應用,包括進行隱私計算、zkRollup等等。其中Layer2項目FOX所使用的FOAKS就是一個零知識證明算法.

1900/1/1 0:00:00
以太坊正統性、EVM完全兼容 Layer2后來者Scroll能否彎道超車?_ROL

除了在EVM兼容方面的優秀表現,Scroll證明節點的去中心化和開源的社區經營都體現了以太坊的正統性,達到了價值觀層面的「兼容」,頂級硬件速度為Scroll注入了更大的潛力.

1900/1/1 0:00:00
2023空投指南:有望空投的4個潛力項目及參與方式_ARB

原文作者:veDAO?研究院空投作為Web3的一種激勵用戶參與和貢獻的方式,在過去的幾年里,我們已經見證了一些成功的Web3項目空投,如?Uniswap、1inch、Aptos等.

1900/1/1 0:00:00
去中心化金融(DeFi)讓金融不再武器化_DEF

在兩千多年前春秋戰國時代,我們的祖先就想明白了一個大道理,記錄在《左傳》當中:國之大事,在祀與戎。對一個國家來說,真正算得上大事的就是祭祀活動和軍事行動.

1900/1/1 0:00:00
ads