- +1
黃仁勛攜Rubin架構(gòu)亮相CES,英偉達(dá)鐵了心要做“AI賣(mài)鏟人”

北京時(shí)間1月6日凌晨,英偉達(dá)CEO黃仁勛CES 2026的開(kāi)幕演講中,系統(tǒng)闡述了他對(duì)人工智能產(chǎn)業(yè)演進(jìn)的最新判斷,并正式發(fā)布了全新一代Vera Rubin計(jì)算架構(gòu)。這一架構(gòu)涵蓋CPU、GPU、互連、網(wǎng)絡(luò)、存儲(chǔ)與系統(tǒng)級(jí)設(shè)計(jì),被英偉達(dá)定義為面向“下一階段AI前沿”的基礎(chǔ)設(shè)施平臺(tái)。
在這場(chǎng)演講中,黃仁勛并未將重點(diǎn)放在某一具體應(yīng)用或模型能力上,而是反復(fù)強(qiáng)調(diào)一個(gè)核心命題:人工智能正在引發(fā)一次覆蓋整個(gè)計(jì)算產(chǎn)業(yè)的結(jié)構(gòu)性重置,而英偉達(dá)的角色,是為這場(chǎng)重置提供底層工具與系統(tǒng)能力。
AI走向“平臺(tái)化”,英偉達(dá)要做底層“賣(mài)鏟人”
黃仁勛對(duì)AI市場(chǎng)的判斷,延續(xù)了他一貫的“平臺(tái)論”視角。他表示,計(jì)算產(chǎn)業(yè)每隔10到15年就會(huì)發(fā)生一次底層重置:從大型機(jī)到PC,從互聯(lián)網(wǎng)到云計(jì)算,再到移動(dòng)計(jì)算。每一次重置,應(yīng)用形態(tài)都會(huì)隨之改變,產(chǎn)業(yè)價(jià)值鏈也會(huì)重新分配。

但AI的特殊之處在于,它并不是單一平臺(tái)的替代,而是兩次平臺(tái)遷移同時(shí)發(fā)生。
第一層遷移,是應(yīng)用本身的重構(gòu)。應(yīng)用不再是被“編寫(xiě)”的,而是被“訓(xùn)練”的;不再是預(yù)設(shè)流程,而是在運(yùn)行時(shí)根據(jù)上下文實(shí)時(shí)生成每一個(gè)token、每一個(gè)像素。AI不再是應(yīng)用,而是應(yīng)用賴(lài)以生存的底座。
第二層遷移,是整個(gè)計(jì)算棧都在被重寫(xiě)。軟件如何開(kāi)發(fā)、如何運(yùn)行、運(yùn)行在什么硬件之上,CPU不再是中心,GPU成為默認(rèn);推理不再是一次性輸出,而是一個(gè)持續(xù)“思考”的過(guò)程。
在這種背景下,黃仁勛反復(fù)強(qiáng)調(diào)一個(gè)數(shù)字:全球傳統(tǒng)計(jì)算體系規(guī)模約為10萬(wàn)億美元,而這部分基礎(chǔ)設(shè)施,正在被系統(tǒng)性地“現(xiàn)代化”為AI計(jì)算。AI投資的資金,并非憑空出現(xiàn),而是來(lái)自企業(yè)研發(fā)預(yù)算、風(fēng)險(xiǎn)投資和整個(gè)工業(yè)體系的遷移。
英偉達(dá)在這個(gè)市場(chǎng)中的定位,并非某一家AI應(yīng)用公司的競(jìng)爭(zhēng)者,而是為所有人提供新平臺(tái)的基礎(chǔ)設(shè)施公司。在這場(chǎng)淘金熱中,它選擇繼續(xù)扮演“賣(mài)鏟人”。
物理AI正迎來(lái)“ChatGPT時(shí)刻”
如果說(shuō)生成式AI解決的是語(yǔ)言與內(nèi)容問(wèn)題,那么黃仁勛在CES 2026上反復(fù)提到的“Physical AI(物理AI)”,則標(biāo)志著英偉達(dá)試圖將智能推入現(xiàn)實(shí)世界。

他將AI能力的演進(jìn)分為幾個(gè)階段:預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)、測(cè)試時(shí)推理,再到具備規(guī)劃與執(zhí)行能力的代理系統(tǒng)(Agentic Systems)。當(dāng)AI開(kāi)始“思考”,并且可以調(diào)用工具、分解任務(wù)時(shí),問(wèn)題的邊界已經(jīng)不再局限于數(shù)字空間。
真正的挑戰(zhàn)在于,物理世界的數(shù)據(jù)是有限的、昂貴的,且不可窮舉。這也是英偉達(dá)長(zhǎng)期投入仿真與合成數(shù)據(jù)的原因。
在演講中,黃仁勛重點(diǎn)介紹了NVIDIA Cosmos“世界基礎(chǔ)模型”,用于理解物理規(guī)律、生成物理一致的場(chǎng)景數(shù)據(jù),并在閉環(huán)中訓(xùn)練AI行動(dòng)能力。這不是一個(gè)簡(jiǎn)單的視頻生成模型,而是一個(gè)理解物理、重力、摩擦力和慣性的世界模型。它不僅能生成視頻,還能模擬物理反饋,解決AI在現(xiàn)實(shí)世界中因缺乏“常識(shí)”而產(chǎn)生的幻覺(jué)。這套體系并不只是服務(wù)于研究,而是直接指向自動(dòng)駕駛與機(jī)器人。
在應(yīng)用層面,他發(fā)布了全球首個(gè)具備推理能力的自動(dòng)駕駛AI——Alpamayo與傳統(tǒng)的規(guī)則驅(qū)動(dòng)或簡(jiǎn)單的端到端模型不同,Alpamayo在駕駛過(guò)程中會(huì)實(shí)時(shí)“思考”并口述其決策邏輯。黃仁勛宣布,搭載該系統(tǒng)的梅賽德斯-奔馳CLA將于2026年第一季度正式上路。

這種從“數(shù)字大腦”向“物理實(shí)體”的跨越,不僅體現(xiàn)在自動(dòng)駕駛上,還延伸到了名為“格魯”(音譯)的人形機(jī)器人系統(tǒng)。黃仁勛透露,NVIDIA正在通過(guò)合成數(shù)據(jù)生成來(lái)解決物理世界數(shù)據(jù)匱乏的難題。通過(guò)Cosmos模型,NVIDIA可以將計(jì)算轉(zhuǎn)化為數(shù)據(jù),訓(xùn)練機(jī)器人應(yīng)對(duì)各種長(zhǎng)尾場(chǎng)景。
這種“三臺(tái)計(jì)算機(jī)”架構(gòu)——一臺(tái)用于訓(xùn)練,一臺(tái)用于仿真模擬(Omniverse),一臺(tái)用于邊緣推理——構(gòu)成了NVIDIA在工業(yè)與機(jī)器人領(lǐng)域的堅(jiān)實(shí)護(hù)城河。
Rubin架構(gòu):賣(mài)鏟人的“新鏟子”
如果說(shuō)前半場(chǎng)是戰(zhàn)略判斷,那么Rubin架構(gòu)的發(fā)布,才是這場(chǎng)演講真正的技術(shù)核心。
這一架構(gòu)的設(shè)計(jì)起點(diǎn)非?,F(xiàn)實(shí):摩爾定律放緩,而模型規(guī)模以每年10倍的速度增長(zhǎng),推理階段的token生成量以每年5倍的速度增加,單純依靠晶體管數(shù)量已經(jīng)無(wú)法支撐性能需求。
因此,英偉達(dá)選擇在這一代“推倒重來(lái)”。
黃仁勛表示,Vera Rubin并不是一顆芯片,而是一個(gè)由6顆芯片組成、通過(guò)極端協(xié)同設(shè)計(jì)形成的系統(tǒng)級(jí)架構(gòu)。它被定位為專(zhuān)為智能體AI(Agentic AI)和物理AI(Physical AI)設(shè)計(jì)的算力底座。

Vera Rubin系統(tǒng)由定制的Vera CPU與Rubin GPU組成,兩者從設(shè)計(jì)之初就被定義為雙向一致、低延遲的數(shù)據(jù)共享結(jié)構(gòu)。Vera CPU擁有88個(gè)物理核心,通過(guò)空間多線(xiàn)程(Spatial Multi-Threading)技術(shù)實(shí)現(xiàn)176線(xiàn)程滿(mǎn)速運(yùn)行,強(qiáng)調(diào)在功耗受限環(huán)境下的性能密度。同時(shí)為了解決大規(guī)模集群的通信瓶頸,Rubin平臺(tái)搭載了NVLink 6,提供了高達(dá)3.6T/s的雙向帶寬。
Rubin GPU在浮點(diǎn)性能上超過(guò)Blackwell,而晶體管數(shù)量?jī)H為后者的1.6倍。這背后依賴(lài)的是全新的張量核心與Transformer Engine設(shè)計(jì),而非單純堆疊規(guī)模。

在系統(tǒng)層面,Rubin真正的突破來(lái)自“陣列化”。
一個(gè)Vera Rubin計(jì)算托盤(pán)中集成2顆Vera CPU、4顆Rubin GPU,配合BlueField-4 DPU與ConnectX-9網(wǎng)絡(luò)。通過(guò)第六代NVLink交換系統(tǒng),18個(gè)計(jì)算節(jié)點(diǎn)可以被連接為一個(gè)整體,最多實(shí)現(xiàn)72顆Rubin GPU協(xié)同運(yùn)行,像一顆“巨型GPU”一樣工作。
在完整的MVL72機(jī)架中,英偉達(dá)集成了6類(lèi)全新芯片、18個(gè)計(jì)算托盤(pán)、9個(gè)NVLink交換托盤(pán),總計(jì)約220萬(wàn)億晶體管,整機(jī)重量接近兩噸。
在數(shù)據(jù)中心層面,Rubin引入了多個(gè)關(guān)鍵改動(dòng)。其一是上下行帶寬,每顆GPU可獲得1.6TB/s的Scale-out帶寬;其二是上下文內(nèi)存體系,通過(guò)BlueField-4將KV Cache與上下文管理放入機(jī)架內(nèi)部,為每顆GPU額外提供最高16TB的可擴(kuò)展內(nèi)存空間。
網(wǎng)絡(luò)部分,Spectrum-X以太網(wǎng)交換機(jī)首次引入Silicon Photonics技術(shù),提供512個(gè)200Gb端口,能夠?qū)⒊汕先f(wàn)機(jī)架連接為“AI工廠(chǎng)”。
在能效層面,該陣列在單機(jī)架內(nèi)的計(jì)算密度提升了約3倍。在處理類(lèi)似Cosmos這種涉及物理規(guī)律模擬的復(fù)雜模型時(shí),六卡陣列能夠?qū)崿F(xiàn)跨芯片的內(nèi)存池共享,極大地減少了模型切分帶來(lái)的性能損耗。黃仁勛特別提到,這套陣列采用了全集成的液冷方案,能在消耗更低能耗的同時(shí)Rubin的功耗約為上一代Grace Blackwell的兩倍,這一設(shè)計(jì)有望為全球數(shù)據(jù)中心節(jié)省約6%的能耗。
同時(shí),Rubin在系統(tǒng)級(jí)實(shí)現(xiàn)了全鏈路加密,覆蓋PCIe、NVLink及GPU互聯(lián),并正式支持加密計(jì)算,為模型托管與跨組織部署提供安全基礎(chǔ)。
這個(gè)六卡陣列也是英偉達(dá)向業(yè)界發(fā)出的一個(gè)信號(hào):未來(lái)的算力單元不再是以“塊”計(jì)算,而是以“陣列”和“機(jī)架”為最小單位。通過(guò)這種設(shè)計(jì),英偉達(dá)進(jìn)一步鎖定了數(shù)據(jù)中心和主權(quán)AI實(shí)驗(yàn)室的采購(gòu)偏好——你買(mǎi)的不只是一張顯卡,而是一套不可分割的、高度協(xié)同的算力體(英偉達(dá)也能因此創(chuàng)造更多收入)。
算力競(jìng)爭(zhēng)格局再升級(jí)
從更宏觀的角度看,黃仁勛在CES 2026的演講,并不是為了宣布某一項(xiàng)技術(shù)領(lǐng)先,而是試圖給整個(gè)行業(yè)一個(gè)坐標(biāo)系。
在這個(gè)坐標(biāo)系中,AI不再是少數(shù)公司的專(zhuān)屬能力,而是一種會(huì)“滲透到每一個(gè)國(guó)家、每一個(gè)行業(yè)、每一家企業(yè)”的基礎(chǔ)設(shè)施;應(yīng)用不再是固定形態(tài),而是由Agent驅(qū)動(dòng)的交互系統(tǒng);競(jìng)爭(zhēng)不再只是模型參數(shù)之爭(zhēng),而是算力、數(shù)據(jù)、模擬、系統(tǒng)工程能力的綜合博弈。
而英偉達(dá)選擇的位置,依然是那個(gè)看似樸素、卻至關(guān)重要的“賣(mài)鏟人”。它既是平臺(tái)的建設(shè)者,也是規(guī)則的塑造者;既推動(dòng)開(kāi)放,又牢牢掌握最核心的工程能力。
隨著AI開(kāi)始從數(shù)字空間走向物理世界,這場(chǎng)算力競(jìng)賽的格局正在被重新劃分。對(duì)于全球各方的參與者而言,Rubin架構(gòu)的出現(xiàn)不僅是一次技術(shù)挑戰(zhàn),更是一條更加清晰的競(jìng)爭(zhēng)分界線(xiàn):在全棧集成的“暴力美學(xué)”面前,傳統(tǒng)的、零散的硬件邏輯正面臨降維打擊。為全球AI產(chǎn)業(yè)提出新的挑戰(zhàn)與新的思路。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪(fǎng)問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




