3月22日,玩家和AI從業者又愛又恨的老黃帶著他的新“核彈”來了。可惜這顆新“核彈”與玩家關系不大,主要面向企業和工業市場。估計與玩家相關的RTX40系列最早要到9月份才會有消息。
好了,廢話不多說,看看老黃這次帶出了什么樣的“大寶貝”。首先是A100顯卡的繼任者。新一代計算卡H100登場。H100采用全新的Hopper架構和臺積電最新的4nm工藝。與上一代A100相比,各方面的參數都有明顯提升。
英偉達的超級服務器芯片Grace也再次曝光。與上次給出的數據相比,本次曝光的格雷斯芯片的性能有了驚人的提升。根據發布會的描述,英偉達似乎和蘋果走在了同一條路上。使用更多芯片來組裝處理器。
除了硬件產品的曝光和發布,NVIDIA還在軟件領域帶來了很多新的東西,比如OmniverseCloud,主打云端協同,讓多個用戶直接參與同一個媒體文件的編輯和渲染在云端。
英偉達宣布生成式AI引擎DGX GH200已投入量產,可支持萬億參數AI大模型訓練:5月29日消息,美東時間5月28日,英偉達創始人兼CEO黃仁勛在NVIDIA Computex 2023演講中宣布,生成式AI引擎NVIDIA DGX GH200現已投入量產。
英偉達官網顯示,NVIDIA DGX GH200是將256個NVIDIA Grace Hopper超級芯片完全連接到單個GPU中的新型AI超級計算機,支持萬億參數AI大模型訓練。能夠處理大規模推薦系統、生成式人工智能和圖形分析,并為巨型人工智能模型提供線性可擴展性。[2023/5/30 9:49:41]
此外,NVIDIA還展示了多個基于虛擬現實環境的工業和交通仿真案例,以及一套AI驅動的虛擬角色系統。系統可以通過深度學習進行動作訓練,訓練后無需額外的骨骼動作設計。操作可以根據指令做出相應的動作。這不僅是AI從業者的狂喜,也是電影和游戲從業者的狂喜。
不得不說,老黃這次帶來了很多東西,每一個都能給AI等行業的發展帶來明顯的變化。讓我們來詳細看看英偉達發布的內容。
英偉達市值突破8000億美元:11月19日消息,在近日的元宇宙熱潮以及四季度樂觀預期的推動下,芯片巨頭英偉達股價周四飆升12%,市值突破8000億美元大關,今年迄今已上漲一倍多,鞏固了其作為美國第七大市值公司的地位。同時,追蹤元宇宙領域的RoundHill Ball Metaverse ETF(META.P)上漲1.7%,創下新高。得益于對英偉達的最大持股份額,該ETF自10月4日觸及低點以來已上漲超20%。(路透社)[2021/11/19 6:59:28]
H100和Grace
從去年開始,就有消息稱英偉達今年將發布新一代計算卡,并將采用全新的Hopper架構。目前消息是準確的,不過大家都猜測新一代計算卡會采用臺積電的5nm工藝,但現在看來,英偉達一步步選擇了采用最新的4nm工藝。雖然本質上是5nm+,但就是功耗。它具有更好的性能,還可以集成更高的晶體管。
其實從H100的核心規格來看,不難理解為什么英偉達最終選擇了4nm,晶體管集成度高達800億,比上一代A100多了260億。核心數增加到16896,這是世界上核心數最多的芯片核心,也是上一代100的2.5倍。
英偉達新款RTX3060限制挖礦版國內上市時間推遲:4月25日,根據ChannelGate視博合聚的消息,英偉達再次延遲RTX3060新版本的上市時間。據了解,5月初各品牌才能分配到GPU,待工廠生產出來,基本最早也要5月下旬才能正式出貨。[2021/4/25 20:56:19]
夸張的內核參數提升帶來的性能提升也是極其夸張的。根據英偉達官方給出的數據,H100的浮點計算和張量核心計算能力將比上一代提升至少3倍,FP32最高可達60teraflops/秒。,而上一代A100為19.5teraflops。
H100也將率先支持PCIe5.0和HBM3,讓內存帶寬達到驚人的3TB/s。老黃說,目前全球網絡流量只有20臺H100可以處理。雖然聽上去有些夸張,但確實反映了H100夸大的性能參數。
強大的性能也伴隨著夸張的功耗。NVIDIA給出的H100功耗高達700W,相比上一代A100。功耗只有400W,換來的卻是兩倍的功耗。3倍的性能提升整體來說不算虧。
動態 | 英偉達推出基于區塊鏈的計算平臺:英偉達推出基于區塊鏈的計算平臺Clara Federated Learning,該平臺在英偉達的EGX Intelligent平臺上運行,可幫助醫療保健提供商將復雜3D模型的分析過程從數小時減少到數分鐘。[2019/12/3]
H100還針對AI訓練中用到的模型等進行針對性優化,配備Transformer優化引擎,使大型模型的訓練速度可以提高到原來的6倍,大大減少了大型模型所需的訓練人工智能模型時間,這個功能也呼應了下面將要討論的AI分身系統。
在NVIDIA給出的測試數據中,訓練一個1750億參數的GPT-3模型將時間從原來的一周縮短到僅19小時,一個3950億參數的Transforme模型只需21小時即可完成。訓練,效率提升近9倍。
雖然參數看起來很不錯,但實際表現還有待后續實際測試結果來揭曉。至少從RTX30系列和A100的體驗來看,最終的實際性能提升可能在2倍到2.5倍之間。,實現3倍的可能性不大,但即使只有2倍,也已經相當不錯了,至少在AI方面,已經徹底碾壓了AMD的計算卡。
英偉達首席財務官:第四季度數字貨幣采礦需求超過預期:Nvidia公司首席財務官今日表示,第四季度數字貨幣礦商對GPU的需求大于預期。首席財務官Colette Kress表示:“數字貨幣市場的強勁需求超出了我們的預期。”該公司發布了2017年第四季度財報。該公司的營收為29.1億美元,同比增長了34%。Kress說:“雖然數字貨幣挖礦業無對我們業務的貢獻難以量化,但可能比往年要高,但由于數字貨幣可能保持波動,我們仍然致力于游戲需求。”[2018/2/9]
此外,H100還引入了NVIDIA最新的NVIDIANVLink第四代互連技術,可以進一步提升多GPU串連的效率。在NVIDIA給出的數據中,串聯后的I/O帶寬可以擴展至900GB/s,比上一代提升50%。
再來看看英偉達的新“玩具”Grace,這是英偉達為服務器業務準備的超級服務器芯片。系列產品。Grace芯片采用了最新的ArmV9架構,Nvidia以此為基準構建了兩款超級芯片——GraceHopper和GraceCPU超級芯片。
其中,GraceHopper由一個GraceCPU和一個采用Hopper架構的GPU組成。兩者將組成一個完整的計算系統。只需要一個芯片就可以構建一個強大的計算服務器。芯片串聯起來形成更大的計算陣列。
GraceCPU超級芯片由兩顆GraceCPU組成,它們通過NVIDIANVLink-C2C技術互連,形成一個內置144個Arm核心和1TB/s內存帶寬的巨型芯片。
說實話,英偉達的GraceCPU超級芯片很難不讓人聯想到蘋果在春季發布會上發布的M1Ultra。它同樣基于Arm架構,同樣由兩顆芯片組成。它也有夸張的特點。內存帶寬和性能。
顯然,芯片互連與組裝技術已成為行業趨勢之一,AMD也透露類似技術的CPU正在研發中,最早將于2023年與大家見面。只能說性能發展單個芯片現在正在接近極限。如果想要有更大的提升,可能不得不使用類似的互連技術進行芯片堆疊。
不過,GraceCPU超級芯片的功耗并不低。NVIDIA官方給出的數據是500W,已經遠超傳統x86架構CPU。當然,考慮到格雷斯CPU超級芯片的夸張表現:SPECrate跑分740分,比第二名高出60%,這樣的功耗也不是不能接受的。
顯然,在Arm服務器領域,英偉達的野心非常大。
英偉達的虛擬世界
除了一堆高性能硬件,NVIDIA這次還展示了很多軟件演示案例,包括使用H100等硬件模擬虛擬現實環境進行各種測試和模擬。在英偉達的演示中,未來企業可以通過強大的英偉達硬件搭建逼真的虛擬測試環境,在其中測試自動駕駛、智能工廠運營等。
通過使用虛擬測試環境,研究人員可以更輕松地測試自動駕駛在面對各種突發事件時的反饋,并在測試過程中直接定位問題,降低整體測試成本。此外,可以構建1:1的“數字工廠”,提前模擬運營,尋找提高效率,發現可能出現的問題,降低工廠正式運營后出現問題的概率。
英偉達將這組應用稱為“數字孿生”,可以大大減少自動化工廠和自動駕駛方面的研究和測試投入。
OmniverseCloud是NVIDIA推出的全新云創建服務。通過OmniverseCloud,用戶可以隨時隨地訪問和編輯大型3D場景,無需等待大量數據的傳輸,還可以讓用戶直接在線協作構建3D模型。
過去,3D模型和3D場景的協同構建需要在服務器上進行。OmniverseCloud上線后,相關創作者可以通過任何支持OmniverseCloud的終端直接訪問協作空間并參與其中。大大提高了創作者的反應速度和工作自由度。
此外,NVIDIA還為創作者準備了第二個驚喜,一套AI驅動的虛擬角色系統,可以讓AI在短時間內完成訓練,學習各種指令對應的動作。比如一個簡單的砍殺動作,在正常的制作過程中,動作架構師首先需要一步步調整動作骨架,然后放到場景中進行測試。整個過程需要很多時間。并且每個不同的動作都需要重新調試。
借助這套AI虛擬角色系統,當你想讓虛擬模型做出斬擊動作時,只需要一個命令,AI就會從學習到的動作中找出關聯的動作并自動運行,直接保存儲蓄。大量的時間和人力,對于游戲開發者和視覺特效創作者來說,這個系統可以讓他們將更多的精力集中在其他地方。
雖然NVIDIA的發布會并沒有過多提及元宇宙,但從硬件到軟件,都是未來構建元宇宙的基礎。元宇宙目前無法成為現實的主要原因有兩個。一是硬件性能無法滿足我們的需求,二是軟件領域還不夠成熟,無法提供實時的真實環境模擬。技術的基礎。
在此之前,我們首先需要的是更強大的計算硬件和更智能的人工智能系統。Nvidia的H100,虛擬現實環境和AI虛擬角色系統的出現,將使我們離真正的元宇宙更近一步。
當前隨著BAYC、迪士尼等各種相關的事物持續破圈,互聯網世界、投資圈中最火的概念,恐怕就是NFT了.
1900/1/1 0:00:00大規模超金融化、反監管和人為稀缺的web3時代真的是馬克思主義的嗎?“我們現在都是凱恩斯主義者.
1900/1/1 0:00:00譯者前言:Pak巨鯨SH在年初發行了他自己的NFT項目”圖像=效用TheImageistheUtility“,以介紹ASH生態的單頁紙為NFT呈現方式,可謂創造了NFT呈現模式的一個創新.
1900/1/1 0:00:00盡管Opensea是目前NFT最主要的交易市場,但加密社區一直有個說法是,Opensea是一個web2.5的產品.
1900/1/1 0:00:00隱私權每個人的基本權利。1993年,埃里克·修斯在其著名的《朋克宣言》開頭變提出:Privacyisnecessaryforanopensocietyintheelectronicage.Pri.
1900/1/1 0:00:00周線級別看,目前BTCMACD快慢線金叉,不過20線死叉50線,前期歷史上一旦形成,后面BTC區間整理后往往還有探底的風險,并且這波反彈還未能有效突破上方0.5-0.618壓力帶.
1900/1/1 0:00:00