人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

黃仁勛在COMPUTEX大會上說了什么?這里是最全的亮點

5月29日周一,英偉達CEO黃仁勛在COMPUTEX大會上拋出多個重磅信息,包括新的機器人設(shè)計、游戲功能、廣告服務(wù)和網(wǎng)絡(luò)技術(shù)。其中最為引人矚目的是,搭載256顆GH200 Grace Hopper超級芯片的新型DGX GH200人工智能超級計算機,堪稱“算力殺器”。

谷歌云、Meta和微軟是首批預(yù)計將獲得DGX GH200訪問權(quán)的客戶,以探索其在生成型AI工作負載方面的能力。值得注意的是,算力的突破,將使得AI應(yīng)用再次獲得巨大提升,AI賽道有望向下一個節(jié)點邁進。在周一的演講中,黃仁勛認為科技行業(yè)的傳統(tǒng)架構(gòu)的改進速度已不足以跟上復(fù)雜的計算任務(wù)。 為了充分發(fā)揮AI 的潛力,客戶越來越多地轉(zhuǎn)向加速計算和英偉達制造的GPU。

黃仁勛說:

我們已到達生成式AI引爆點。從此,全世界的每個角落,都會有算力需求。


【資料圖】

有評論認為,一連串的發(fā)布凸顯了英偉達正在從一家GPU制造商轉(zhuǎn)變?yōu)橐患姨幱贏I熱潮中心的公司。

上周,由于對處理AI任務(wù)的數(shù)據(jù)中心芯片的強烈需求,英偉達大幅提高了對本季度的業(yè)績指引,比分析師的估計高出近40億美元。業(yè)績指引的提高使該股創(chuàng)下歷史新高,并使英偉達的估值接近1萬億美元,這還是芯片業(yè)中首次有公司市值達到這一高度。

在周一的會議上,黃仁勛發(fā)布的主要內(nèi)容包括:

英偉達面向游戲玩家的GForce RTX 4080 Ti GPU現(xiàn)已全面投產(chǎn),并已經(jīng)開始量產(chǎn)。黃仁勛宣布推出適用于游戲的英偉達Avatar Cloud Engine(ACE),這是一種可定制的AI模型代工服務(wù),為游戲開發(fā)人員提供預(yù)訓(xùn)練模型。它將通過AI支持的語言交互賦予非玩家角色更多個性。英偉達Cuda計算模型現(xiàn)在服務(wù)于400萬開發(fā)者和超過3000個應(yīng)用程序。Cuda的下載量達到了4000萬次,其中僅去年一年就達到了2500萬次。GPU服務(wù)器HGX H100的全面量產(chǎn)已經(jīng)開始,他補充說,這是世界上第一臺裝有變壓器引擎的計算機。黃仁勛將英偉達2019年以69億美元收購超級計算機芯片制造商Mellanox稱為其有史以來做出的“最偉大的戰(zhàn)略決策之一”。下一代 Hopper GPU的生產(chǎn)將于2024年8月開始,也就是第一代開始生產(chǎn)兩年后。英偉達的GH200 Grace Hopper現(xiàn)已全面投產(chǎn)。超級芯片提升了4 PetaFIOPS TE、72個通過芯片到芯片鏈路連接的Arm CPU、96GB HBM3和576 GPU內(nèi)存。黃仁勛將其描述為世界上第一個具有巨大內(nèi)存的加速計算處理器:“這是一臺計算機,而不是芯片?!?它專為高彈性數(shù)據(jù)中心應(yīng)用而設(shè)計。如果Grace Hopper的內(nèi)存不夠用,英偉達有解決方案——DGX GH200。 它是通過首先將8個Grace Hoppers與3個NVLINK交換機以900GB傳輸速度的Pod連接在一起,再將32個這樣的組件連接在一起,再加上一層開關(guān),連接總共256個Grace Hopper芯片。 由此產(chǎn)生的 ExaFLOPS Transformer Engine具有144 TB的GPU內(nèi)存,可用作巨型GPU。黃仁勛說Grace Hopper速度非??欤梢栽谲浖羞\行5G堆棧。 谷歌云、Meta和微軟將是第一批獲得DGX GH200 訪問權(quán)限的公司,并將對其功能進行研究。英偉達和軟銀已建立合作伙伴關(guān)系,將Grace Hopper超級芯片引入軟銀在日本的新分布式數(shù)據(jù)中心。這些將能夠在多租戶通用服務(wù)器平臺中托管生成式人工智能和無線應(yīng)用程序,從而降低成本和能源。軟銀和英偉達的合作伙伴關(guān)系將基于英偉達MGX參考架構(gòu),該架構(gòu)目前正在與一些公司合作使用。它為系統(tǒng)制造商提供了一個模塊化的參考架構(gòu),幫助他們構(gòu)建100多個用于AI、加速計算和全方位用途的服務(wù)器變體。合作的公司包括ASRock Rack、Asus、Gigabyte、Pegatron、QCT和Supermicro。黃仁勛發(fā)布了Spectrum-X加速網(wǎng)絡(luò)平臺,以提高基于以太網(wǎng)的云的速度。它包括Spectrum 4交換機,它有128個端口,每秒400GB和每秒51.2TB的傳輸速度。黃仁勛說,該交換機旨在實現(xiàn)新型以太網(wǎng),并設(shè)計為端到端以進行自適應(yīng)路由、隔離性能和進行結(jié)構(gòu)內(nèi)計算。它還包括Bluefield 3 Smart Nic,它連接到Spectrum 4交換機以執(zhí)行擁塞控制。世界上最大的廣告公司W(wǎng)PP已與英偉達Nvidia 合作開發(fā)基于英偉達Omniverse的內(nèi)容引擎。 它將能夠制作用于廣告的照片和視頻內(nèi)容。WPP首席執(zhí)行官馬克·里德在一份聲明中表示:“生成式AI正以驚人的速度改變著廣告行業(yè),這項新技術(shù)將改變知名品牌創(chuàng)建商業(yè)內(nèi)容的方式?!睋?jù)WPP稱,新平臺將使WPP的創(chuàng)意團隊能夠?qū)dobe和Getty Images等公司的內(nèi)容與生成式人工智能相結(jié)合,更高效、更大規(guī)模地制作廣告內(nèi)容。該公司補充說,這將使公司能夠制作大量的廣告內(nèi)容,如文本、圖片或視頻,實現(xiàn)量身定制,并更有沉浸感。機器人平臺英偉達Isaac ARM現(xiàn)在可供任何想要構(gòu)建機器人的人使用,并且是全棧的,從芯片到傳感器。Isaac ARM從名為 Nova Orin 的芯片開始,是第一個機器人全參考堆棧,Huang 說。

在發(fā)布會上,黃仁勛還展示了生成式AI以文字形式輸入然后以其他媒體輸出內(nèi)容的能力。他要求播放與清晨心情相配的音樂,而在另一篇文章中,他列出了一些歌詞,然后使用AI將這個想法轉(zhuǎn)化為一首活潑的流行歌曲:

現(xiàn)在每個人都是創(chuàng)作者。

值得注意的是,本次大會上,黃仁勛向傳統(tǒng)CPU服務(wù)器集群發(fā)起“挑戰(zhàn)”。他直言,認為在人工智能和加速計算這一未來方向上,GPU服務(wù)器有著更為強大的優(yōu)勢。

黃仁勛解釋稱,傳統(tǒng)上電腦或服務(wù)器最重要的 CPU,這個市場主要參與者包括英特爾和AMD。但隨著需要大量計算能力的AI應(yīng)用出現(xiàn),GPU將成為主角,英偉達主導(dǎo)了當前全球AI GPU 市場。?

黃仁勛在演講上展示的范例,訓(xùn)練一個LLM大語言模型,將需要960個CPU組成的服務(wù)器集群,這將耗費大約1000萬美元,并消耗11千兆瓦時的電力。相比之下,同樣以1000萬美元的成本去組建GPU服務(wù)器集群,將以僅3.2千兆瓦時的電力消耗,訓(xùn)練44個LLM大模型。

如果同樣消耗11千兆瓦時的電量,那么GPU服務(wù)器集群能夠?qū)崿F(xiàn)150倍的加速,訓(xùn)練150個LLM大模型,且占地面積更小。而當用戶僅僅想訓(xùn)練一個LLM大模型時,則只需要一個40萬美元左右,消耗0.13千兆瓦時電力的GPU服務(wù)器即可。

換言之,相比CPU服務(wù)器,GPU服務(wù)器能夠以4%的成本和1.2%的電力消耗來訓(xùn)練一個LLM,這將帶來巨大的成本節(jié)省。

根據(jù)Trend Force的數(shù)據(jù),2022年搭載GP GPU的AI服務(wù)器年出貨量占全部服務(wù)器的比重接近1%,2023年在ChatGPT等人工智能應(yīng)用加持下,AI服務(wù)器出貨量有望同比增長8%,2022~2026年出貨量CAGR有望達10.8%,以AI服務(wù)器用GPU,主要以公司H100、A100、A800(主要出貨中國)以及AMD MI250、MI250X系列為主,而英偉達與AMD的占比約8:2。

基于IDC預(yù)測2026年全球服務(wù)器出貨量1877萬臺、AI服務(wù)器的占比逐年提升1%,同時AI服務(wù)器中GPU的搭載數(shù)量逐年提升0.5個百分點、隨著GPU產(chǎn)品迭代,GPU單價逐年提升2000美元,國金證券基于上述基礎(chǔ)預(yù)測,2026年全球數(shù)據(jù)中心GPU市場規(guī)模有望達224億美元。

風險提示及免責條款 市場有風險,投資需謹慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責任自負。

關(guān)鍵詞: