黃仁勛攜Rubin架構(gòu)亮相CES，英偉達(dá)鐵了心要做“AI賣(mài)鏟人”

2026-01-06 12:27

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

北京時(shí)間1月6日凌晨，英偉達(dá)CEO黃仁勛CES 2026的開(kāi)幕演講中，系統(tǒng)闡述了他對(duì)人工智能產(chǎn)業(yè)演進(jìn)的最新判斷，并正式發(fā)布了全新一代Vera Rubin計(jì)算架構(gòu)。這一架構(gòu)涵蓋CPU、GPU、互連、網(wǎng)絡(luò)、存儲(chǔ)與系統(tǒng)級(jí)設(shè)計(jì)，被英偉達(dá)定義為面向“下一階段AI前沿”的基礎(chǔ)設(shè)施平臺(tái)。

在這場(chǎng)演講中，黃仁勛并未將重點(diǎn)放在某一具體應(yīng)用或模型能力上，而是反復(fù)強(qiáng)調(diào)一個(gè)核心命題：人工智能正在引發(fā)一次覆蓋整個(gè)計(jì)算產(chǎn)業(yè)的結(jié)構(gòu)性重置，而英偉達(dá)的角色，是為這場(chǎng)重置提供底層工具與系統(tǒng)能力。

AI走向“平臺(tái)化”，英偉達(dá)要做底層“賣(mài)鏟人”

黃仁勛對(duì)AI市場(chǎng)的判斷，延續(xù)了他一貫的“平臺(tái)論”視角。他表示，計(jì)算產(chǎn)業(yè)每隔10到15年就會(huì)發(fā)生一次底層重置：從大型機(jī)到PC，從互聯(lián)網(wǎng)到云計(jì)算，再到移動(dòng)計(jì)算。每一次重置，應(yīng)用形態(tài)都會(huì)隨之改變，產(chǎn)業(yè)價(jià)值鏈也會(huì)重新分配。

但AI的特殊之處在于，它并不是單一平臺(tái)的替代，而是兩次平臺(tái)遷移同時(shí)發(fā)生。

第一層遷移，是應(yīng)用本身的重構(gòu)。應(yīng)用不再是被“編寫(xiě)”的，而是被“訓(xùn)練”的；不再是預(yù)設(shè)流程，而是在運(yùn)行時(shí)根據(jù)上下文實(shí)時(shí)生成每一個(gè)token、每一個(gè)像素。AI不再是應(yīng)用，而是應(yīng)用賴(lài)以生存的底座。

第二層遷移，是整個(gè)計(jì)算棧都在被重寫(xiě)。軟件如何開(kāi)發(fā)、如何運(yùn)行、運(yùn)行在什么硬件之上，CPU不再是中心，GPU成為默認(rèn)；推理不再是一次性輸出，而是一個(gè)持續(xù)“思考”的過(guò)程。

在這種背景下，黃仁勛反復(fù)強(qiáng)調(diào)一個(gè)數(shù)字：全球傳統(tǒng)計(jì)算體系規(guī)模約為10萬(wàn)億美元，而這部分基礎(chǔ)設(shè)施，正在被系統(tǒng)性地“現(xiàn)代化”為AI計(jì)算。AI投資的資金，并非憑空出現(xiàn)，而是來(lái)自企業(yè)研發(fā)預(yù)算、風(fēng)險(xiǎn)投資和整個(gè)工業(yè)體系的遷移。

英偉達(dá)在這個(gè)市場(chǎng)中的定位，并非某一家AI應(yīng)用公司的競(jìng)爭(zhēng)者，而是為所有人提供新平臺(tái)的基礎(chǔ)設(shè)施公司。在這場(chǎng)淘金熱中，它選擇繼續(xù)扮演“賣(mài)鏟人”。

物理AI正迎來(lái)“ChatGPT時(shí)刻”

如果說(shuō)生成式AI解決的是語(yǔ)言與內(nèi)容問(wèn)題，那么黃仁勛在CES 2026上反復(fù)提到的“Physical AI（物理AI）”，則標(biāo)志著英偉達(dá)試圖將智能推入現(xiàn)實(shí)世界。

他將AI能力的演進(jìn)分為幾個(gè)階段：預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)、測(cè)試時(shí)推理，再到具備規(guī)劃與執(zhí)行能力的代理系統(tǒng)（Agentic Systems）。當(dāng)AI開(kāi)始“思考”，并且可以調(diào)用工具、分解任務(wù)時(shí)，問(wèn)題的邊界已經(jīng)不再局限于數(shù)字空間。

真正的挑戰(zhàn)在于，物理世界的數(shù)據(jù)是有限的、昂貴的，且不可窮舉。這也是英偉達(dá)長(zhǎng)期投入仿真與合成數(shù)據(jù)的原因。

在演講中，黃仁勛重點(diǎn)介紹了NVIDIA Cosmos“世界基礎(chǔ)模型”，用于理解物理規(guī)律、生成物理一致的場(chǎng)景數(shù)據(jù)，并在閉環(huán)中訓(xùn)練AI行動(dòng)能力。這不是一個(gè)簡(jiǎn)單的視頻生成模型，而是一個(gè)理解物理、重力、摩擦力和慣性的世界模型。它不僅能生成視頻，還能模擬物理反饋，解決AI在現(xiàn)實(shí)世界中因缺乏“常識(shí)”而產(chǎn)生的幻覺(jué)。這套體系并不只是服務(wù)于研究，而是直接指向自動(dòng)駕駛與機(jī)器人。

在應(yīng)用層面，他發(fā)布了全球首個(gè)具備推理能力的自動(dòng)駕駛AI——Alpamayo與傳統(tǒng)的規(guī)則驅(qū)動(dòng)或簡(jiǎn)單的端到端模型不同，Alpamayo在駕駛過(guò)程中會(huì)實(shí)時(shí)“思考”并口述其決策邏輯。黃仁勛宣布，搭載該系統(tǒng)的梅賽德斯-奔馳CLA將于2026年第一季度正式上路。

這種從“數(shù)字大腦”向“物理實(shí)體”的跨越，不僅體現(xiàn)在自動(dòng)駕駛上，還延伸到了名為“格魯”（音譯）的人形機(jī)器人系統(tǒng)。黃仁勛透露，NVIDIA正在通過(guò)合成數(shù)據(jù)生成來(lái)解決物理世界數(shù)據(jù)匱乏的難題。通過(guò)Cosmos模型，NVIDIA可以將計(jì)算轉(zhuǎn)化為數(shù)據(jù)，訓(xùn)練機(jī)器人應(yīng)對(duì)各種長(zhǎng)尾場(chǎng)景。

這種“三臺(tái)計(jì)算機(jī)”架構(gòu)——一臺(tái)用于訓(xùn)練，一臺(tái)用于仿真模擬（Omniverse），一臺(tái)用于邊緣推理——構(gòu)成了NVIDIA在工業(yè)與機(jī)器人領(lǐng)域的堅(jiān)實(shí)護(hù)城河。

Rubin架構(gòu)：賣(mài)鏟人的“新鏟子”

如果說(shuō)前半場(chǎng)是戰(zhàn)略判斷，那么Rubin架構(gòu)的發(fā)布，才是這場(chǎng)演講真正的技術(shù)核心。

這一架構(gòu)的設(shè)計(jì)起點(diǎn)非?，F(xiàn)實(shí)：摩爾定律放緩，而模型規(guī)模以每年10倍的速度增長(zhǎng)，推理階段的token生成量以每年5倍的速度增加，單純依靠晶體管數(shù)量已經(jīng)無(wú)法支撐性能需求。

因此，英偉達(dá)選擇在這一代“推倒重來(lái)”。

黃仁勛表示，Vera Rubin并不是一顆芯片，而是一個(gè)由6顆芯片組成、通過(guò)極端協(xié)同設(shè)計(jì)形成的系統(tǒng)級(jí)架構(gòu)。它被定位為專(zhuān)為智能體AI（Agentic AI）和物理AI（Physical AI）設(shè)計(jì)的算力底座。

Vera Rubin系統(tǒng)由定制的Vera CPU與Rubin GPU組成，兩者從設(shè)計(jì)之初就被定義為雙向一致、低延遲的數(shù)據(jù)共享結(jié)構(gòu)。Vera CPU擁有88個(gè)物理核心，通過(guò)空間多線(xiàn)程（Spatial Multi-Threading）技術(shù)實(shí)現(xiàn)176線(xiàn)程滿(mǎn)速運(yùn)行，強(qiáng)調(diào)在功耗受限環(huán)境下的性能密度。同時(shí)為了解決大規(guī)模集群的通信瓶頸，Rubin平臺(tái)搭載了NVLink 6，提供了高達(dá)3.6T/s的雙向帶寬。

Rubin GPU在浮點(diǎn)性能上超過(guò)Blackwell，而晶體管數(shù)量?jī)H為后者的1.6倍。這背后依賴(lài)的是全新的張量核心與Transformer Engine設(shè)計(jì)，而非單純堆疊規(guī)模。

在系統(tǒng)層面，Rubin真正的突破來(lái)自“陣列化”。

一個(gè)Vera Rubin計(jì)算托盤(pán)中集成2顆Vera CPU、4顆Rubin GPU，配合BlueField-4 DPU與ConnectX-9網(wǎng)絡(luò)。通過(guò)第六代NVLink交換系統(tǒng)，18個(gè)計(jì)算節(jié)點(diǎn)可以被連接為一個(gè)整體，最多實(shí)現(xiàn)72顆Rubin GPU協(xié)同運(yùn)行，像一顆“巨型GPU”一樣工作。

在完整的MVL72機(jī)架中，英偉達(dá)集成了6類(lèi)全新芯片、18個(gè)計(jì)算托盤(pán)、9個(gè)NVLink交換托盤(pán)，總計(jì)約220萬(wàn)億晶體管，整機(jī)重量接近兩噸。

在數(shù)據(jù)中心層面，Rubin引入了多個(gè)關(guān)鍵改動(dòng)。其一是上下行帶寬，每顆GPU可獲得1.6TB/s的Scale-out帶寬；其二是上下文內(nèi)存體系，通過(guò)BlueField-4將KV Cache與上下文管理放入機(jī)架內(nèi)部，為每顆GPU額外提供最高16TB的可擴(kuò)展內(nèi)存空間。

網(wǎng)絡(luò)部分，Spectrum-X以太網(wǎng)交換機(jī)首次引入Silicon Photonics技術(shù)，提供512個(gè)200Gb端口，能夠?qū)⒊汕先f(wàn)機(jī)架連接為“AI工廠(chǎng)”。

在能效層面，該陣列在單機(jī)架內(nèi)的計(jì)算密度提升了約3倍。在處理類(lèi)似Cosmos這種涉及物理規(guī)律模擬的復(fù)雜模型時(shí)，六卡陣列能夠?qū)崿F(xiàn)跨芯片的內(nèi)存池共享，極大地減少了模型切分帶來(lái)的性能損耗。黃仁勛特別提到，這套陣列采用了全集成的液冷方案，能在消耗更低能耗的同時(shí)Rubin的功耗約為上一代Grace Blackwell的兩倍，這一設(shè)計(jì)有望為全球數(shù)據(jù)中心節(jié)省約6%的能耗。

同時(shí)，Rubin在系統(tǒng)級(jí)實(shí)現(xiàn)了全鏈路加密，覆蓋PCIe、NVLink及GPU互聯(lián)，并正式支持加密計(jì)算，為模型托管與跨組織部署提供安全基礎(chǔ)。

這個(gè)六卡陣列也是英偉達(dá)向業(yè)界發(fā)出的一個(gè)信號(hào)：未來(lái)的算力單元不再是以“塊”計(jì)算，而是以“陣列”和“機(jī)架”為最小單位。通過(guò)這種設(shè)計(jì)，英偉達(dá)進(jìn)一步鎖定了數(shù)據(jù)中心和主權(quán)AI實(shí)驗(yàn)室的采購(gòu)偏好——你買(mǎi)的不只是一張顯卡，而是一套不可分割的、高度協(xié)同的算力體（英偉達(dá)也能因此創(chuàng)造更多收入）。

算力競(jìng)爭(zhēng)格局再升級(jí)

從更宏觀的角度看，黃仁勛在CES 2026的演講，并不是為了宣布某一項(xiàng)技術(shù)領(lǐng)先，而是試圖給整個(gè)行業(yè)一個(gè)坐標(biāo)系。

在這個(gè)坐標(biāo)系中，AI不再是少數(shù)公司的專(zhuān)屬能力，而是一種會(huì)“滲透到每一個(gè)國(guó)家、每一個(gè)行業(yè)、每一家企業(yè)”的基礎(chǔ)設(shè)施；應(yīng)用不再是固定形態(tài)，而是由Agent驅(qū)動(dòng)的交互系統(tǒng)；競(jìng)爭(zhēng)不再只是模型參數(shù)之爭(zhēng)，而是算力、數(shù)據(jù)、模擬、系統(tǒng)工程能力的綜合博弈。

而英偉達(dá)選擇的位置，依然是那個(gè)看似樸素、卻至關(guān)重要的“賣(mài)鏟人”。它既是平臺(tái)的建設(shè)者，也是規(guī)則的塑造者；既推動(dòng)開(kāi)放，又牢牢掌握最核心的工程能力。

隨著AI開(kāi)始從數(shù)字空間走向物理世界，這場(chǎng)算力競(jìng)賽的格局正在被重新劃分。對(duì)于全球各方的參與者而言，Rubin架構(gòu)的出現(xiàn)不僅是一次技術(shù)挑戰(zhàn)，更是一條更加清晰的競(jìng)爭(zhēng)分界線(xiàn)：在全棧集成的“暴力美學(xué)”面前，傳統(tǒng)的、零散的硬件邏輯正面臨降維打擊。為全球AI產(chǎn)業(yè)提出新的挑戰(zhàn)與新的思路。

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪(fǎng)問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#英偉達(dá)#GPU #人工智能