ICC訊 當憑借驅(qū)動AI的專用GPU賺得盆滿缽滿的英偉達宣布“看好CPU賽道的潛力?!碑擵era Rubin平臺帶著36顆Vera CPU與72顆GPU的配置亮相,當國際機構(gòu)集體預(yù)判CPU供需缺口將持續(xù)擴大,一個明確的信號已然浮現(xiàn):AI算力的核心敘事邏輯,正在從“GPU單極主導(dǎo)”向“CPU+GPU協(xié)同共生”演進。
01 CPU的重要性,不亞于GPU
黃仁勛對CPU的押注,絕非臨時起意,在過去很長一段時間中,英偉達都對PC市場充滿渴望。
早在2011 年的CES上,英偉達正式公布Project Denver(丹佛計劃),宣布基于 ARM 架構(gòu)開發(fā)定制CPU 核心。之后在2014年與2018年,英偉達陸續(xù)發(fā)布移動處理器Tegra K1、用于自動駕駛與邊緣計算Carmel CPU 核心等。
2021年4月英偉達發(fā)布基于Arm架構(gòu)的Grace CPU,標志著這家GPU巨頭正式殺入服務(wù)器CPU戰(zhàn)場。Grace并非傳統(tǒng)意義上的通用處理器,而是專為AI、HPC(高性能計算)和大規(guī)模數(shù)據(jù)處理而設(shè)計的“加速型CPU”。
近日,Meta宣布與英偉達公司達成新的采購協(xié)議,將購買數(shù)百萬顆英偉達下一代Vera Rubin圖形處理器和同等數(shù)量的Grace中央處理器,以支持其人工智能發(fā)展戰(zhàn)略。據(jù)悉,Meta已經(jīng)是英偉達最大的客戶之一,多年來一直在使用英偉達的GPU,但這項新協(xié)議表明兩家公司將建立更深層次的合作伙伴關(guān)系。值得注意的是,Meta還承諾大量采購英偉達的Grace CPU,并將其作為獨立芯片部署,而不是與GPU配合使用。
英偉達表示,Meta將成為首家獨立部署Grace CPU的公司,從明年開始,還將部署下一代Vera CPU。值得注意的是,Vera CPU是英偉達推出的新一代AI芯片,屬于其自研Arm架構(gòu)CPU系列,于2026年1月6日在CES 2026上官宣,并預(yù)計于2026年3月16日至19日在GTC 2026上正式發(fā)布,計劃于2026年下半年開始向微軟等首批客戶交付。該芯片旨在為下一代大模型訓(xùn)練與推理提供支持 。
在此前的拉斯維加斯消費電子展上,黃仁勛還表示:"英偉達躋身全球頂級CPU制造商行列不會令人意外。"
在AI算力被GPU刷屏的這幾年,市場很容易形成一個慣性認知:AI = GPU。但走到2026年,一個被云廠商、大模型公司用真金白銀驗證的結(jié)論正在成為共識:CPU在數(shù)據(jù)中心的重要性,絲毫不亞于GPU。
為什么過去幾年行業(yè)只追捧GPU,卻把CPU當成 “配角”?核心原因很簡單:AI還處在 “訓(xùn)練為王” 的階段。2023—2025年,行業(yè)重心是把大模型 “訓(xùn)出來”,比拼的是極致并行算力、矩陣乘法效率,GPU憑借架構(gòu)優(yōu)勢,天然成為訓(xùn)練階段的絕對主角。此時CPU只承擔基礎(chǔ)調(diào)度、數(shù)據(jù)搬運等輔助工作,自然不被輿論聚焦。
但從2025下半年到2026年,AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換:從訓(xùn)練為主,轉(zhuǎn)向推理、執(zhí)行、規(guī)?;涞貫橹?/strong>。Agent、RAG、工具調(diào)用、多模態(tài)交互、強化學習環(huán)境搭建…… 這些商用化場景,不再是單純的并行計算,而是大量邏輯判斷、串行執(zhí)行、系統(tǒng)調(diào)度、I/O 管控、內(nèi)存調(diào)度、任務(wù)分發(fā)。這些恰恰是GPU的短板、CPU的主場。
行業(yè)數(shù)據(jù)已經(jīng)給出答案:在典型 Agent 工作流中,CPU處理延遲占比高達90%,成為端到端性能的頭號瓶頸。過去“堆 GPU 就能提效” 的邏輯徹底失效 ——CPU跟不上,GPU利用率就上不去;CPU規(guī)格不夠,集群就開不滿。2026 年開年Intel、AMD服務(wù)器CPU集體漲價、產(chǎn)能被搶空,正是這一趨勢的直接體現(xiàn)。
目前英特爾和AMD的CPU普遍缺貨,服務(wù)器CPU交貨周期最長可達6個月,消費級CPU也面臨延遲和漲價。英偉達選在這個節(jié)點重兵投入服務(wù)器CPU,既是補全自身全棧算力版圖,也是直擊 x86 陣營的供給軟肋。它的邏輯非常清晰:
● 不做通用CPU,而是為AI集群量身定制,和GPU、DPU、高速互聯(lián)深度協(xié)同;
● 解決行業(yè)最痛的問題:CPU瓶頸導(dǎo)致GPU利用率上不去、集群跑不滿;
● 用一體化方案,對沖當前x86 CPU缺貨、交付不穩(wěn)定的風險。
這也意味著,數(shù)據(jù)中心算力競爭正式從“單芯片比拼” 進入 “全系統(tǒng)較量”。
02 CPU缺貨了,格局也變了
再看一下當前服務(wù)器CPU市場的競爭格局。
過去二十年,服務(wù)器CPU市場幾乎被英特爾和AMD牢牢掌控。憑借成熟的x86指令集、龐大的軟件生態(tài)以及與操作系統(tǒng)、中間件的高度兼容性,x86架構(gòu)成為企業(yè)級市場的默認選擇。尤其在通用計算、數(shù)據(jù)庫、虛擬化等場景中,x86 CPU的綜合優(yōu)勢無可替代。
但這一雙寡頭格局正加速生變,英特爾長期以來的主導(dǎo)地位持續(xù)承壓,AMD 則憑借技術(shù)突破實現(xiàn)份額穩(wěn)步攀升。
上圖顯示,截至2025年,AMD在服務(wù)器市場的出貨份額已接近30%,而英特爾雖仍占據(jù)主導(dǎo)地位,但份額較高峰期有所回落。這一變化源于多重產(chǎn)業(yè)因素,而非單一技術(shù)優(yōu)劣。
業(yè)內(nèi)人士向半導(dǎo)體產(chǎn)業(yè)縱橫表示:
首先,客戶需求正在分化。
超大規(guī)模云服務(wù)商對高核數(shù)、高能效、高I/O帶寬的需求快速上升。AMD自EPYC系列起采用Chiplet(小芯片)架構(gòu),結(jié)合臺積電先進制程,在96核以上產(chǎn)品上實現(xiàn)較快落地,契合了部分云廠商對“每瓦性能”和橫向擴展能力的偏好。但這并不意味著AMD毫無短板。該人士表示:“AMD的Chiplet小芯片架構(gòu),雖然能快速堆核心數(shù),但不同小芯片之間的通信延遲偏高,這是它一直以來的問題?!睒I(yè)內(nèi)人士補充道,而英特爾的優(yōu)勢恰恰在這里——核電通信延遲低,再加上多年積累的軟件和硬件生態(tài),適配性更好,這也是它在當前AI浪潮中能穩(wěn)住份額的關(guān)鍵。
其次,價格策略,則成為AMD撬動市場的另一把“鑰匙”。
“整體來看,AMD的服務(wù)器CPU價格會比英特爾略低,尤其是在渠道市場,AMD的策略更激進?!睒I(yè)內(nèi)人士透露,AMD對老型號產(chǎn)品會給出大幅折扣,導(dǎo)致市場上充斥著高性價比的舊款A(yù)MD CPU,而英特爾則堅持穩(wěn)健的價格控制,不輕易降價。這種價格差異,也讓不同客戶群體做出了不同選擇?;ヂ?lián)網(wǎng)大廠和主流服務(wù)器廠商,更看重技術(shù)迭代,會緊跟英特爾的新品節(jié)奏,優(yōu)先采購最新款或上一代產(chǎn)品;而廣大中小客戶、渠道裝機市場,更在意性價比,大量選用AMD的舊型號產(chǎn)品。除此之外,工控、IoT、邊緣端等細分領(lǐng)域,雖有部分客戶仍在使用老舊產(chǎn)品,但這部分市場對整體格局的影響相對有限。
最后,供應(yīng)鏈策略差異也正在顯現(xiàn)。
作為長期占據(jù)行業(yè)龍頭的英特爾,曾憑借自主制造體系(IDM模式)穩(wěn)穩(wěn)握住技術(shù)主動權(quán),但2021年前后,其制程工藝的迭代突然“慢了下來”。從而導(dǎo)致新品推出節(jié)奏明顯脫節(jié),比AMD慢了半拍甚至一拍,很多客戶等不及,就轉(zhuǎn)頭選擇了AMD的新品?!睒I(yè)內(nèi)人士解釋道。
反觀AMD,走了一條與英特爾截然不同的路——放棄自主制造,全部交由臺積電代工。這一選擇恰好踩中了先進制程的風口,從7nm到如今的3nm,AMD緊跟臺積電的工藝節(jié)奏,產(chǎn)品性能和能效比一路提升。不過近幾年,英特爾 18A 制程工藝日趨成熟,正逐步削弱制程層面帶來的性能差距。
對于市場普遍關(guān)注的“未來5-10年,AMD是否能拿下半數(shù)的數(shù)據(jù)中心x86 CPU市場”的疑問,業(yè)內(nèi)人士給出了明確答案:“大概率不會?!痹谒磥?,雙方的優(yōu)勢領(lǐng)域已經(jīng)形成互補,且難以相互替代。
“AMD的高核心數(shù)適合云計算、大數(shù)據(jù)這類規(guī)?;瘓鼍埃⑻貭柕牡脱舆t和成熟生態(tài),在AI、金融科技等高端領(lǐng)域不可替代?!彼M一步分析,如今英特爾的制程已經(jīng)基本回歸先進水平,短板主要在產(chǎn)品設(shè)計上,目前也在不斷優(yōu)化產(chǎn)品理念,應(yīng)對AMD的競爭;而AMD則需要解決延遲問題,同時補齊軟件生態(tài)的短板,才能進一步提升份額。
03 CPU市場的變量,不止英偉達
除卻英偉達,CPU底層架構(gòu)的博弈正悄然重塑服務(wù)器市場的長期格局。
此前x86架構(gòu)在全球服務(wù)器CPU市場占有率同樣高達90%,然而根據(jù)市場研究機構(gòu)Dell'Oro Group最新報告,2025年第二季度,ARM架構(gòu)處理器在服務(wù)器CPU市場份額已達到25%,相比去年同期的15% 大幅提升了10個百分點。 這一顯著增長主要得益于英偉達基于ARM架構(gòu)的Grace平臺的大規(guī)模交付,以及大型科技企業(yè)定制芯片的加速部署。
比如,亞馬遜網(wǎng)絡(luò)服務(wù)憑借其Graviton系列開創(chuàng)了超大規(guī)模ARM服務(wù)器處理器,首次發(fā)布于2018年。該公司認識到,在其數(shù)據(jù)中心運行的大部分工作負載不需要x86處理器提供的最大單線程性能,但將從改進的能效和成本效益中獲益巨大。到2024年,AWS表示其大約一半的新CPU部署使用Graviton處理器而不是x86芯片。
谷歌隨后推出了其Axion處理器,于2024年宣布,聲稱與同類x86處理器相比功耗降低百分之六十,同時為典型云工作負載提供同等性能。
究其原因,首先,傳統(tǒng)x86架構(gòu)在高負載下往往伴隨顯著的能源消耗,而ARM通過精簡指令集與更高效的芯片設(shè)計,在同等算力下大幅降低單位能耗,為云服務(wù)提供商節(jié)省了持續(xù)性的運營成本。其次,其靈活的許可模式則徹底打破了芯片授權(quán)的壟斷邏輯——云廠商無需支付高額授權(quán)費用,即可自由定制處理器架構(gòu),深度適配自身工作負載,將算力從"通用適配"升級為"場景定制"。這種模式不僅重構(gòu)了芯片創(chuàng)新的參與門檻,更讓云服務(wù)從"購買硬件"轉(zhuǎn)向"定義算力",真正實現(xiàn)按需優(yōu)化。最后,低成本優(yōu)勢則進一步消除了算力普及的障礙,使云服務(wù)在經(jīng)濟性上更具競爭力。
不止是ARM架構(gòu),基于 RISC-V 架構(gòu)的服務(wù)器 CPU 也在迅速“破圈”。RISC-V架構(gòu)有著開源、指令精簡和可擴展的優(yōu)勢,在注重能效比的物聯(lián)網(wǎng)領(lǐng)域收獲頗豐。不過,這并不意味著RISC-V無法進軍有更高性能要求的PC和服務(wù)器市場。
關(guān)于RISC-V 架構(gòu)的優(yōu)勢,筆者總結(jié)主要有四點:
第一點,它是開源的,這意味著它自主可控。第二點,它是可定制化的,如此便十分契合專用服務(wù)器的定制化需求。第三點,它的成本更低,目前RISC-V IP核的授權(quán)費和版稅只有ARM的1/3-1/4。如果采用RISC-V方案,能很大程度降低芯片、服務(wù)器廠商的成本。第四點,RISC-V存在一些獨特的性能優(yōu)勢,比如其有能力在單位面積上提供更高性能和核數(shù),這使其在有著高效能需求的AI等應(yīng)用中更加高效。
如今,已有多家公司的RISC-V架構(gòu)服務(wù)器CPU芯片亮相。比如阿里巴巴的玄鐵RISC-V CPU,以及睿思芯科的全自研高性能RISC-V服務(wù)器芯片等。
阿里云無影事業(yè)部總裁張獻濤曾表示“我覺得經(jīng)過5-8年的發(fā)展,未來在服務(wù)器里面的大規(guī)模應(yīng)用應(yīng)該是不成問題的。很多公司對它的期待很高,一定會加速進程往前發(fā)展的。RISC-V架構(gòu)從低功耗IoT終端大規(guī)模應(yīng)用到數(shù)據(jù)中心,大概5-8年內(nèi)就能實現(xiàn)?!?
微核芯CEO郇丹丹表示高性能計算場景才是打開RISC-V市場空間的關(guān)鍵。“過去RISC-V大多都是面向AIoT領(lǐng)域,低成本低性能領(lǐng)域已經(jīng)是紅海市場,作為新興指令集的RISC-V產(chǎn)業(yè)要想發(fā)展壯大,只有伴隨著數(shù)據(jù)中心在高性能領(lǐng)域(服務(wù)器、AI計算)的新興應(yīng)用成長才是打開市場空間的關(guān)鍵。”
如今,英偉達攜Grace、Vera CPU重兵入局,ARM架構(gòu)憑高能效與定制化優(yōu)勢快速崛起,RISC-V則以開源之力打破壟斷壁壘,曾經(jīng)由x86雙寡頭主導(dǎo)的格局被徹底打破。隨著AI產(chǎn)業(yè)從“訓(xùn)練為王”轉(zhuǎn)向“推理落地”,CPU的核心價值愈發(fā)凸顯,算力競爭也從單芯片比拼升級為全系統(tǒng)較量。