用戶名: 密碼: 驗(yàn)證碼:

GTC 2026前瞻:NVIDIA如何用LPX、CPO與Rubin,重新定義AI基礎(chǔ)設(shè)施

摘要:GTC 2026 英偉達(dá)將展 AI 算力基建全新藍(lán)圖,含 LPX 推理機(jī)架、Rubin 系列算力平臺(tái),推光互連替代銅互連,還將攻克材料、散熱等系統(tǒng)難題,重構(gòu) AI 工廠基礎(chǔ)設(shè)施體系。

  ICC訊   當(dāng)生成式AI與大語(yǔ)言模型的參數(shù)規(guī)模以指數(shù)級(jí)膨脹,一場(chǎng)圍繞數(shù)據(jù)中心基礎(chǔ)設(shè)施的靜默革命早已拉開(kāi)帷幕。2024年,Blackwell平臺(tái)以其GB200 NVL72機(jī)架震驚業(yè)界,將72顆GPU與36顆CPU塞進(jìn)單個(gè)機(jī)柜。然而,這僅僅是序幕。

  據(jù)SemiVision的前瞻報(bào)告,在即將到來(lái)的GTC 2026大會(huì)上,NVIDIA將展示更為激進(jìn)的藍(lán)圖——一個(gè)涵蓋從超低延遲推理到超大規(guī)模訓(xùn)練,從銅互連到光互連,從芯片到系統(tǒng)材料的全面重構(gòu)。

  這不僅是硬件的迭代,更是對(duì)“AI工廠”這一概念的徹底實(shí)踐。本文基于SemiVision 的報(bào)告,前瞻NVIDIA在GTC 2026上可能揭曉的核心技術(shù),窺探未來(lái)AI算力基礎(chǔ)設(shè)施的形態(tài)。


  推理專業(yè)化:LPX機(jī)架與分層推理架構(gòu)的崛起

  AI工作負(fù)載正從單純的訓(xùn)練,向復(fù)雜、多樣化的推理場(chǎng)景深刻演變。NVIDIA的應(yīng)對(duì)策略不再是“一刀切”的通用GPU,而是構(gòu)建一個(gè)分層推理架構(gòu)。在這一戰(zhàn)略中,全新的LPX推理機(jī)架將扮演顛覆性角色。

  LPX的核心源于NVIDIA對(duì)Groq LPU(語(yǔ)言處理單元)技術(shù)的授權(quán)與吸收。與依賴外部HBM的GPU不同,LPU將海量SRAM內(nèi)存直接集成在芯片上,并通過(guò)確定性執(zhí)行模式,在編譯時(shí)即調(diào)度所有計(jì)算與數(shù)據(jù)移動(dòng),從而徹底消除了運(yùn)行時(shí)內(nèi)存帶寬爭(zhēng)用,實(shí)現(xiàn)了毫秒級(jí)的超低延遲token生成。

  GTC 2026上,NVIDIA預(yù)計(jì)將發(fā)布增強(qiáng)型LPX機(jī)架,從初代的64個(gè)LPU擴(kuò)展到256個(gè)LPU。通過(guò)Groq的RealScale無(wú)交換網(wǎng)絡(luò),這256個(gè)LPU能夠像一個(gè)共享內(nèi)存空間般協(xié)同工作,實(shí)現(xiàn)近乎線性的擴(kuò)展。這種架構(gòu)特別適合具有長(zhǎng)程依賴關(guān)系的大語(yǔ)言模型和混合專家模型。

  LPX的定位并非取代GPU,而是與之互補(bǔ)。 NVIDIA的遠(yuǎn)景是:當(dāng)模型較小且需要極致實(shí)時(shí)性時(shí)(如實(shí)時(shí)語(yǔ)音交互、機(jī)器人控制),由LPX處理;當(dāng)模型需要巨大的內(nèi)存容量來(lái)處理長(zhǎng)上下文時(shí),則由基于HBM4的Rubin GPU或基于GDDR7的CPX GPU接手。這種“分工協(xié)作”的混合AI工廠,將成為高效推理的新范式。

  Rubin時(shí)代:從NVL72到NVL576的算力躍遷

  作為Blackwell的繼任者,Vera Rubin平臺(tái)將把AI算力密度推向新的高度。

  1. VR200 NVL72:承上啟下的性能巨獸

  Rubin NVL72機(jī)架集成72顆Rubin GPU和36顆Vera CPU。借助新的NVFP4精度,其推理性能較Blackwell提升高達(dá)5倍,訓(xùn)練性能提升3.5倍。HBM4內(nèi)存的引入不僅帶來(lái)了20.7TB的總?cè)萘亢?,580TB/s的總帶寬,其能效提升也使得在算力大幅躍進(jìn)的同時(shí),整機(jī)柜功耗僅從Blackwell NVL72的約140kW增長(zhǎng)到190-230kW(取決于Max Q或Max P配置)。升級(jí)的微通道冷板和模塊化組裝設(shè)計(jì),則支撐著這一“算力熱密度”的挑戰(zhàn)。

  2. CPX與NVL144:長(zhǎng)上下文推理的性價(jià)比之選

  為應(yīng)對(duì)百萬(wàn)token長(zhǎng)上下文推理的挑戰(zhàn),NVIDIA將推出Rubin架構(gòu)的變體——CPX GPU。它采用單芯片設(shè)計(jì)搭配成本更優(yōu)的GDDR7內(nèi)存,雖帶寬遠(yuǎn)低于HBM4,但憑借高性價(jià)比和96GB的容量,在需要加載整個(gè)上下文進(jìn)行“預(yù)填充”的計(jì)算階段優(yōu)勢(shì)顯著。據(jù)報(bào)道,其在預(yù)填充工作負(fù)載上的性能可達(dá)GB300 NVL72的3倍。

  NVL144 CPX機(jī)架將集成144顆Rubin GPU和144顆CPX GPU,采用無(wú)纜化的模塊化設(shè)計(jì),通過(guò)大面積PCB中背板連接,將機(jī)柜組裝時(shí)間從2小時(shí)銳減至約5分鐘,為未來(lái)向更高級(jí)互連的過(guò)渡鋪平道路。

  3. Rubin Ultra NVL576:正交背板與CPO的拐點(diǎn)之戰(zhàn)

  真正的“怪獸”是計(jì)劃于2027年下半年亮相的Rubin Ultra NVL576(代號(hào)Kyber)。單個(gè)機(jī)柜容納576顆GPU,功耗達(dá)600kW,提供5 EFLOPS的FP8訓(xùn)練算力。支撐此等規(guī)模的關(guān)鍵,在于兩種互連方案的對(duì)決:

  ● 正交背板:用一塊面積約1平方米、多達(dá)78層的M9/PTFE混合材料PCB,取代超過(guò)2萬(wàn)根銅纜,實(shí)現(xiàn)GPU卡與NVSwitch卡間的垂直與水平連接。這雖大幅簡(jiǎn)化了組裝,但對(duì)PCB的層壓、鉆孔、鍍孔工藝提出了“細(xì)胞核級(jí)別”的精密要求。

  ● 共封裝光學(xué):更革命性的方案是CPO,將光子引擎與交換芯片直接封裝在一起,將1.6T可插拔光模塊的功耗從約30W降至9W,能效提升3.5倍。NVL576可能采用“Scale-up”(機(jī)柜內(nèi)NVLink互聯(lián))與“Scale-out”(機(jī)柜間網(wǎng)絡(luò)互聯(lián))雙管齊下的CPO策略,預(yù)計(jì)單個(gè)機(jī)柜將用到近800個(gè)光子引擎。

  GTC 2026有望披露這兩種方案的詳細(xì)對(duì)比,客戶將在“背板設(shè)計(jì)的可靠性”與“CPO的極致能效”之間做出選擇。

  光進(jìn)銅退:網(wǎng)絡(luò)通信的終極進(jìn)化

  超大規(guī)模AI工廠對(duì)網(wǎng)絡(luò)帶寬和能效的渴求,正驅(qū)動(dòng)互連技術(shù)從電到光的根本性轉(zhuǎn)變。

  1. NVLink的持續(xù)演進(jìn):從Rubin平臺(tái)的NVLink 6(1.6 Tb/s/鏈路)到未來(lái)的NVLink 7/8,帶寬持續(xù)翻倍,并支持與CPU的內(nèi)存一致性訪問(wèn),使CPU、GPU、LPU能形成統(tǒng)一的共享計(jì)算池。

  2. Spectrum-X與Quantum-X的CPO化:GTC 2026上,NVIDIA預(yù)計(jì)將正式發(fā)布基于CPO的光以太網(wǎng)交換機(jī)Spectrum-X Photonics(最高409.6 Tb/s帶寬)和InfiniBand交換機(jī)Quantum-X800 CPO(115 Tb/s帶寬)。通過(guò)CPO技術(shù),這些交換機(jī)端口功耗大幅降低,可靠性和部署速度顯著提升,且支持在數(shù)據(jù)中心內(nèi)熱插拔,為構(gòu)建數(shù)萬(wàn)顆GPU規(guī)模的光學(xué)AI工廠奠定基礎(chǔ)。

  系統(tǒng)級(jí)挑戰(zhàn):材料、散熱與供應(yīng)鏈

  這一切宏偉架構(gòu)的背后,是無(wú)數(shù)系統(tǒng)級(jí)工程的突破。

  ● 材料革命:支撐256個(gè)LPU或正交背板的核心,是如M9級(jí)覆銅板(使用Q玻璃,介電常數(shù)低至3.0)這樣的尖端PCB材料。它們確保了在56G-112G乃至448G SerDes高速信號(hào)下的低損耗傳輸。

  ● 散熱攻堅(jiān):從Rubin的100μm微通道冷板,到應(yīng)對(duì)600kW機(jī)柜的混合液冷方案,散熱設(shè)計(jì)直接決定了系統(tǒng)的穩(wěn)定與性能上限。

  ● 供應(yīng)鏈安全:M9、PTFE等先進(jìn)材料,以及CPO所需的光子引擎、激光器,其供應(yīng)鏈的穩(wěn)定性和地緣政治因素,將成為影響未來(lái)AI算力擴(kuò)張速度的關(guān)鍵變量。

  展望GTC 2026:不止于發(fā)布

  GTC 2026將不僅僅是新產(chǎn)品的展示臺(tái),更是NVIDIA完整AI基礎(chǔ)設(shè)施愿景的宣言。我們預(yù)期看到:

  ● LPX、CPX/NVL144、Rubin Ultra NVL576 等平臺(tái)的詳細(xì)規(guī)格與上市路徑。

  ● 正交背板與CPO方案 的正面比較與客戶導(dǎo)向策略。

  ● Spectrum-X/Quantum-X CPO 交換機(jī)的商業(yè)化落地。

  ● 圍繞AI工廠解決方案的更多生態(tài)系統(tǒng)合作案例。

  結(jié)語(yǔ):重新定義競(jìng)爭(zhēng)維度

  從LPX到Rubin Ultra,NVIDIA展現(xiàn)的是一條超越單純芯片算力競(jìng)賽的路徑。未來(lái)的競(jìng)爭(zhēng),是跨領(lǐng)域整合能力的競(jìng)爭(zhēng)——涵蓋芯片、光電子、先進(jìn)材料、封裝、散熱與系統(tǒng)設(shè)計(jì)的全方位對(duì)決。AI服務(wù)器正在成為一個(gè)高度復(fù)雜、快速迭代(約每?jī)赡暌淮纹脚_(tái)革新)的集成系統(tǒng)。

  GTC 2026在即,我們即將見(jiàn)證的,不僅是一系列硬件參數(shù)的飆升,更是一套定義下一個(gè)AI計(jì)算時(shí)代的、完整的基礎(chǔ)設(shè)施哲學(xué)正式登上舞臺(tái)。對(duì)于整個(gè)產(chǎn)業(yè)而言,理解并融入這場(chǎng)由系統(tǒng)創(chuàng)新驅(qū)動(dòng)的變革,將是抓住下一波人工智能浪潮機(jī)遇的關(guān)鍵。

內(nèi)容來(lái)自:AI產(chǎn)業(yè)鏈研究
本文地址:http://n2software.net//Site/CN/News/2026/03/10/20260310085720007577.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:GTC 2026前瞻:NVIDIA如何用LPX、CPO與Rubin,重新定義AI基礎(chǔ)設(shè)施
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right