BTC/HKD+0.08%
HK$ 741065
$ 95118.1

ETH/HKD-0.58%
HK$ 13995
$ 1796.31

LTC/HKD-0.03%
HK$ 673.92
$ 86.5

DOT/HKD-0.82%
HK$ 33.27
$ 4.27

ADA/HKD-0.6%
HK$ 5.57
$ 0.715

SOL/HKD-1.23%
HK$ 1178
$ 151.195

XRP/HKD-0.47%
HK$ 17.07
$ 2.191

DOGE/US-0.97%
HK$ 1.41
$ 0.181

比特幣交易所最好的比特幣交易所

幣安

世界排名第一的比特幣交易所

URL：https://www.binance.com

火幣

成立於2013年的比特幣交易所

URL：https://www.huobi.com

歐易OKX

成立於2014年的比特幣交易所

URL：https://www.okx.com

一文了解 ChatGPT 等 LLMs 得到明顯改進的 3 個變化_GPT

Author：

Time：1900/1/1 0:00:00

原文作者：Tanya Malhotra

來源：Marktechpost

近年來，大型語言模型（Large Language Models，LLMs）在全世界受到了廣泛贊賞，并在自然語言處理領域備受歡迎。這使我們能夠使用比以往任何時候都更好、更清晰的語言理解來描述智能系統（Intelligent Systems）。

諸如 GPT-3、T5、PaLM 等 LLMs 的性能有了顯著提高，并且這些模型將繼續存在，因為它們可以完成從通過學習閱讀來模仿人類，到生成文本和總結長段落內容的所有工作。而根據一些深入的研究，如果 LLM 的規模很大，那么它的表現就會很好。通過在大量數據上訓練這些模型，它們可以理解人類語言的語法、語義和語用學。

Bitfinex公布儲備證明：135個冷、熱錢包地址總計持有超20萬枚BTC和超122萬枚ETH:11月12日消息，Bitfinex首席技術官Paolo Ardoino 在GitHub上公開了Bitfinex的儲備證明，他列出了總計135個冷錢包和熱錢包地址。為了免去查看地址信息的麻煩，Paolo Ardoino 重點說明了一些重要儲備資產，比如204338.17967717枚比特幣、1225600枚以太坊。據悉Paolo Ardoino 曾在2018年6月開放了一個名為“Antani”的開源庫，其中提供了償付能力證明、托管和鏈下委托投票證明，但并未引起重視。[2022/11/12 12:55:49]

由 OpenAI 開發的流行的大型語言模型 ChatGPT 之所以發展得如此之快，正是因為采用了人類反饋強化學習（RLHF）等先進技術。通過 RLHF，機器學習算法結合并使用人工輸入提高了模型的性能。它針對預訓練的 LLM 進行了微調，用于開發聊天機器人、虛擬助手等任務。

ULTA提交包括NFT在內的元宇宙商標申請:金色財經報道，據商標律師Mike Kondoudis在社交媒體上透露，美國化妝品零售商猶他美容 (Ulta Beauty)提交了一份NFT在內的元宇宙商標申請，計劃包括：NFT、虛擬商品的商店、虛擬現實游戲服務、虛擬化妝和美容院服務、由虛擬人物和/或為虛擬人物銷售的虛擬化妝品以及更多。[2022/10/26 11:45:25]

此外，ChatGPT 等 LLMs 所基于的預訓練基礎模型也得到了明顯的改進。這主要是由于三個方面的變化：

1.實踐證明，模型的擴展性（Scaling）對提高其性能很有幫助。以 Pathways 語言模型（Pathways Language Model，PaLM）為例，該模型通過擴展小樣本學習（few-shot learning）大大影響了其性能，小樣本學習可以減少根據具體應用調整模型所需的特定任務訓練實例的數量。

StarkNet主網升級至0.10.1版本，引入并行交易排序器提高交易處理速度:10月26日消息，StarkNet主網已升級至0.10.1版本，此前StarkNet于10月19日在Goerli測試網發布Alpha0.10.1版本，引入并行交易排序器，以提高交易處理速度。[2022/10/26 16:39:17]

通過使用 Pathways 語言模型在 6144 TPU v4 芯片上擴展和訓練 5400 億個參數，PaLM 展示了重復擴展的好處，其表現超過了各種傳統模型，并顯示出很大的進步。因此，深度和寬度的擴展都是提高基礎模型性能的一個重要因素。

可口可樂與數字時裝店DressX達成合作，將推出限量版Dreamworld元宇宙服裝:8月11日消息，可口可樂與數字時裝店DressX達成合作，該合作伙伴關系是創作部門Dreamland的一部分。同時推出新限量版Dreamworld口味將于8月15日在美發售。

此外，可口可樂還宣布與DressX達成合作打造數字空間夢境，為粉絲們創造受限量版Dreamworld啟發的服裝，供他們下載并在元宇宙中穿著。（福布斯）[2022/8/11 12:17:45]

2.另一個變化是在預訓練時增加標記數量的過程。像 Chinchilla 這樣的模型（開源語言模型）已經證明，通過增加預訓練數據，大型語言模型的表現會更好。

Chinchilla 是一個計算最優模型。在相同的計算預算下，在 70B 參數和比 Gopher 模型多四倍的數據上進行訓練，Chinchilla 的表現一致優于 Gopher，它甚至比 GPT-3、Jurassic-1 和 Megatron-Turing NLG 等 LLMs 效果更好。這清楚地描述了對于每一個計算最優的訓練，標記的數量應該相應地縮放——即模型大小的兩倍，因此訓練標記的數量應該是兩倍。

3.第三個變化是使用干凈和多樣化的預訓練數據。Galactica 的性能證明了這一點，它是一種存儲、混合和推理科學知識的大型語言模型。經過幾篇科學論文文本的訓練，Galactica 的表現優于 GPT-3、Chinchilla 等模型。另一個大型語言模型 BioMedLM 是一種針對生物醫學文本的特定領域 LLM，在針對特定領域數據進行訓練時，它表現出了巨大的性能提升。它清楚地表明，在特定領域的數據上進行的預訓練勝過在通用數據上的訓練。

LLMs 的成功無疑歸功于多種因素的混合，包括 RLHF 的使用和預訓練基礎模型的發展。這三個變化極大地影響了 LLMs 的性能。此外，GLaM（通用語言模型）通過使用稀疏激活的混合專家架構（Mixture-of-Experts architecture），以更少的訓練成本擴展模型的容量，從而顯著提高了性能。因此，這些變化為更高級的語言模型開辟了道路，而這些模型將繼續讓我們的生活變得輕松。

DeFi之道

個人專欄

閱讀更多

金色財經善歐巴

金色早8點

Odaily星球日報

歐科云鏈

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

澎湃新聞