黃仁勛在COMPUTEX大會上說了什么？這里是最全的亮點

5月29日周一，英偉達CEO黃仁勛在COMPUTEX大會上拋出多個重磅信息，包括新的機器人設(shè)計、游戲功能、廣告服務(wù)和網(wǎng)絡(luò)技術(shù)。其中最為引人矚目的是，搭載256顆GH200 Grace Hopper超級芯片的新型DGX GH200人工智能超級計算機，堪稱“算力殺器”。

谷歌云、Meta和微軟是首批預(yù)計將獲得DGX GH200訪問權(quán)的客戶，以探索其在生成型AI工作負載方面的能力。值得注意的是，算力的突破，將使得AI應(yīng)用再次獲得巨大提升，AI賽道有望向下一個節(jié)點邁進。在周一的演講中，黃仁勛認為科技行業(yè)的傳統(tǒng)架構(gòu)的改進速度已不足以跟上復(fù)雜的計算任務(wù)。為了充分發(fā)揮AI 的潛力，客戶越來越多地轉(zhuǎn)向加速計算和英偉達制造的GPU。

黃仁勛說：

我們已到達生成式AI引爆點。從此，全世界的每個角落，都會有算力需求。

【資料圖】

有評論認為，一連串的發(fā)布凸顯了英偉達正在從一家GPU制造商轉(zhuǎn)變?yōu)橐患姨幱贏I熱潮中心的公司。

上周，由于對處理AI任務(wù)的數(shù)據(jù)中心芯片的強烈需求，英偉達大幅提高了對本季度的業(yè)績指引，比分析師的估計高出近40億美元。業(yè)績指引的提高使該股創(chuàng)下歷史新高，并使英偉達的估值接近1萬億美元，這還是芯片業(yè)中首次有公司市值達到這一高度。

在周一的會議上，黃仁勛發(fā)布的主要內(nèi)容包括：

英偉達面向游戲玩家的GForce RTX 4080 Ti GPU現(xiàn)已全面投產(chǎn)，并已經(jīng)開始量產(chǎn)。黃仁勛宣布推出適用于游戲的英偉達Avatar Cloud Engine（ACE），這是一種可定制的AI模型代工服務(wù)，為游戲開發(fā)人員提供預(yù)訓(xùn)練模型。它將通過AI支持的語言交互賦予非玩家角色更多個性。英偉達Cuda計算模型現(xiàn)在服務(wù)于400萬開發(fā)者和超過3000個應(yīng)用程序。Cuda的下載量達到了4000萬次，其中僅去年一年就達到了2500萬次。GPU服務(wù)器HGX H100的全面量產(chǎn)已經(jīng)開始，他補充說，這是世界上第一臺裝有變壓器引擎的計算機。黃仁勛將英偉達2019年以69億美元收購超級計算機芯片制造商Mellanox稱為其有史以來做出的“最偉大的戰(zhàn)略決策之一”。下一代 Hopper GPU的生產(chǎn)將于2024年8月開始，也就是第一代開始生產(chǎn)兩年后。英偉達的GH200 Grace Hopper現(xiàn)已全面投產(chǎn)。超級芯片提升了4 PetaFIOPS TE、72個通過芯片到芯片鏈路連接的Arm CPU、96GB HBM3和576 GPU內(nèi)存。黃仁勛將其描述為世界上第一個具有巨大內(nèi)存的加速計算處理器：“這是一臺計算機，而不是芯片?！?它專為高彈性數(shù)據(jù)中心應(yīng)用而設(shè)計。如果Grace Hopper的內(nèi)存不夠用，英偉達有解決方案——DGX GH200。它是通過首先將8個Grace Hoppers與3個NVLINK交換機以900GB傳輸速度的Pod連接在一起，再將32個這樣的組件連接在一起，再加上一層開關(guān)，連接總共256個Grace Hopper芯片。由此產(chǎn)生的 ExaFLOPS Transformer Engine具有144 TB的GPU內(nèi)存，可用作巨型GPU。黃仁勛說Grace Hopper速度非?？欤梢栽谲浖羞\行5G堆棧。谷歌云、Meta和微軟將是第一批獲得DGX GH200 訪問權(quán)限的公司，并將對其功能進行研究。英偉達和軟銀已建立合作伙伴關(guān)系，將Grace Hopper超級芯片引入軟銀在日本的新分布式數(shù)據(jù)中心。這些將能夠在多租戶通用服務(wù)器平臺中托管生成式人工智能和無線應(yīng)用程序，從而降低成本和能源。軟銀和英偉達的合作伙伴關(guān)系將基于英偉達MGX參考架構(gòu)，該架構(gòu)目前正在與一些公司合作使用。它為系統(tǒng)制造商提供了一個模塊化的參考架構(gòu)，幫助他們構(gòu)建100多個用于AI、加速計算和全方位用途的服務(wù)器變體。合作的公司包括ASRock Rack、Asus、Gigabyte、Pegatron、QCT和Supermicro。黃仁勛發(fā)布了Spectrum-X加速網(wǎng)絡(luò)平臺，以提高基于以太網(wǎng)的云的速度。它包括Spectrum 4交換機，它有128個端口，每秒400GB和每秒51.2TB的傳輸速度。黃仁勛說，該交換機旨在實現(xiàn)新型以太網(wǎng)，并設(shè)計為端到端以進行自適應(yīng)路由、隔離性能和進行結(jié)構(gòu)內(nèi)計算。它還包括Bluefield 3 Smart Nic，它連接到Spectrum 4交換機以執(zhí)行擁塞控制。世界上最大的廣告公司W(wǎng)PP已與英偉達Nvidia 合作開發(fā)基于英偉達Omniverse的內(nèi)容引擎。它將能夠制作用于廣告的照片和視頻內(nèi)容。WPP首席執(zhí)行官馬克·里德在一份聲明中表示：“生成式AI正以驚人的速度改變著廣告行業(yè)，這項新技術(shù)將改變知名品牌創(chuàng)建商業(yè)內(nèi)容的方式?！睋?jù)WPP稱，新平臺將使WPP的創(chuàng)意團隊能夠?qū)dobe和Getty Images等公司的內(nèi)容與生成式人工智能相結(jié)合，更高效、更大規(guī)模地制作廣告內(nèi)容。該公司補充說，這將使公司能夠制作大量的廣告內(nèi)容，如文本、圖片或視頻，實現(xiàn)量身定制，并更有沉浸感。機器人平臺英偉達Isaac ARM現(xiàn)在可供任何想要構(gòu)建機器人的人使用，并且是全棧的，從芯片到傳感器。Isaac ARM從名為 Nova Orin 的芯片開始，是第一個機器人全參考堆棧，Huang 說。

在發(fā)布會上，黃仁勛還展示了生成式AI以文字形式輸入然后以其他媒體輸出內(nèi)容的能力。他要求播放與清晨心情相配的音樂，而在另一篇文章中，他列出了一些歌詞，然后使用AI將這個想法轉(zhuǎn)化為一首活潑的流行歌曲：

現(xiàn)在每個人都是創(chuàng)作者。

值得注意的是，本次大會上，黃仁勛向傳統(tǒng)CPU服務(wù)器集群發(fā)起“挑戰(zhàn)”。他直言，認為在人工智能和加速計算這一未來方向上，GPU服務(wù)器有著更為強大的優(yōu)勢。

黃仁勛解釋稱，傳統(tǒng)上電腦或服務(wù)器最重要的 CPU，這個市場主要參與者包括英特爾和AMD。但隨著需要大量計算能力的AI應(yīng)用出現(xiàn)，GPU將成為主角，英偉達主導(dǎo)了當前全球AI GPU 市場。?

黃仁勛在演講上展示的范例，訓(xùn)練一個LLM大語言模型，將需要960個CPU組成的服務(wù)器集群，這將耗費大約1000萬美元，并消耗11千兆瓦時的電力。相比之下，同樣以1000萬美元的成本去組建GPU服務(wù)器集群，將以僅3.2千兆瓦時的電力消耗，訓(xùn)練44個LLM大模型。

如果同樣消耗11千兆瓦時的電量，那么GPU服務(wù)器集群能夠?qū)崿F(xiàn)150倍的加速，訓(xùn)練150個LLM大模型，且占地面積更小。而當用戶僅僅想訓(xùn)練一個LLM大模型時，則只需要一個40萬美元左右，消耗0.13千兆瓦時電力的GPU服務(wù)器即可。

換言之，相比CPU服務(wù)器，GPU服務(wù)器能夠以4%的成本和1.2%的電力消耗來訓(xùn)練一個LLM，這將帶來巨大的成本節(jié)省。

根據(jù)Trend Force的數(shù)據(jù)，2022年搭載GP GPU的AI服務(wù)器年出貨量占全部服務(wù)器的比重接近1%，2023年在ChatGPT等人工智能應(yīng)用加持下，AI服務(wù)器出貨量有望同比增長8%，2022~2026年出貨量CAGR有望達10.8%，以AI服務(wù)器用GPU，主要以公司H100、A100、A800（主要出貨中國）以及AMD MI250、MI250X系列為主，而英偉達與AMD的占比約8：2。

基于IDC預(yù)測2026年全球服務(wù)器出貨量1877萬臺、AI服務(wù)器的占比逐年提升1%，同時AI服務(wù)器中GPU的搭載數(shù)量逐年提升0.5個百分點、隨著GPU產(chǎn)品迭代，GPU單價逐年提升2000美元，國金證券基于上述基礎(chǔ)預(yù)測，2026年全球數(shù)據(jù)中心GPU市場規(guī)模有望達224億美元。

風險提示及免責條款市場有風險，投資需謹慎。本文不構(gòu)成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資，責任自負。

關(guān)鍵詞：