ICC訊 Arista Networks首席執(zhí)行官兼董事長(zhǎng)Jayshree Ullal表示,在數(shù)據(jù)中心內(nèi)部,以太網(wǎng)已經(jīng)將InfiniBand推到一旁,并正在鞏固這一成果。
Ullal稱,這是2026年數(shù)據(jù)中心網(wǎng)絡(luò)因AI需求而面臨的若干變化之一。這些變化還包括從訓(xùn)練到推理的需求轉(zhuǎn)變,以及對(duì)遙測(cè)和智能體AI維持運(yùn)營(yíng)的依賴性增強(qiáng)。
以太網(wǎng)正迅速成為向上擴(kuò)展、向外擴(kuò)展和跨域網(wǎng)絡(luò)擴(kuò)展的標(biāo)準(zhǔn)。Ullal預(yù)測(cè),在2026年的數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域,以太網(wǎng)相對(duì)于InfiniBand將繼續(xù)保持發(fā)展勢(shì)頭。
“以太網(wǎng)始終是最終的贏家和均衡器,”Ullal說(shuō)。
2025年:以太網(wǎng)的關(guān)鍵之年
Ullal表示,以太網(wǎng)在2025年取得了實(shí)質(zhì)性進(jìn)展,其里程碑包括超以太網(wǎng)聯(lián)盟(UEC)于6月發(fā)布的1.0規(guī)范,這為AI和HPC時(shí)代重新定義了以太網(wǎng)。此外,向上擴(kuò)展網(wǎng)絡(luò)以太網(wǎng)(ESUN)于10月在OCP峰會(huì)上推出,而英偉達(dá)和思科都發(fā)布了用于跨域網(wǎng)絡(luò)擴(kuò)展的基于以太網(wǎng)的新產(chǎn)品。
UEC 1.0規(guī)范旨在滿足AI和高性能計(jì)算的需求,其目標(biāo)是通過(guò)多供應(yīng)商集成,為網(wǎng)絡(luò)棧所有層面(包括網(wǎng)卡、交換機(jī)、光模塊和電纜)提供高性能、可擴(kuò)展和可互操作的解決方案。UEC得到了AMD、Arista、博通、思科、HPE、Meta、微軟等公司的支持。
而由開(kāi)放計(jì)算項(xiàng)目基金會(huì)于10月推出的ESUN,旨在為向上擴(kuò)展架構(gòu)提供改進(jìn)的吞吐效率與延遲,并具備無(wú)損、節(jié)能和高性價(jià)比的設(shè)計(jì)。ESUN得到了AMD、Arista、ARM、博通、思科、HPE Networking、Meta、微軟、英偉達(dá)、OpenAI等公司的支持。
Ullal指出,超以太網(wǎng)和ESUN為AI的向上和向外擴(kuò)展網(wǎng)絡(luò)優(yōu)化了以太網(wǎng)?!斑@一點(diǎn),結(jié)合云巨頭對(duì)多供應(yīng)商規(guī)模擴(kuò)展的偏好,正推動(dòng)向通用硬件平臺(tái)和網(wǎng)絡(luò)操作系統(tǒng)的遷移,這些系統(tǒng)能夠覆蓋前端和后端的AI網(wǎng)絡(luò),”這位Arista負(fù)責(zé)人表示?!皩S泻蛦喂?yīng)商鎖定的技術(shù)棧已成過(guò)往!”她補(bǔ)充道。
(“云巨頭”是Arista對(duì)大多數(shù)人稱之為超大規(guī)模公司——亞馬遜AWS、谷歌、微軟等企業(yè)的內(nèi)部稱謂。這些公司貢獻(xiàn)了Arista近半的收入。)
迅速轉(zhuǎn)型
Ullal表示,預(yù)計(jì)2025年以太網(wǎng)在AI后端網(wǎng)絡(luò)中的收入將超過(guò)InfiniBand,且這一趨勢(shì)可能會(huì)加速。
向以太網(wǎng)的轉(zhuǎn)型非常迅速。根據(jù)Dell‘Oro集團(tuán)7月的報(bào)告,InfiniBand在2023年末在AI后端網(wǎng)絡(luò)中占據(jù)80%的市場(chǎng)份額,但“以太網(wǎng)目前在這些高性能部署中已穩(wěn)固確立超越InfiniBand的勢(shì)頭”。到12月,Dell’Oro報(bào)告稱,以太網(wǎng)在當(dāng)季及該年前三季度AI后端網(wǎng)絡(luò)的數(shù)據(jù)中心交換機(jī)銷售中占比超過(guò)三分之二,高于去年同期的不足一半。
但I(xiàn)nfiniBand并不會(huì)消失。它仍然是大規(guī)模AI訓(xùn)練的黃金標(biāo)準(zhǔn),提供了可預(yù)測(cè)性、將計(jì)算任務(wù)從昂貴的GPU卸載到交換機(jī)的網(wǎng)絡(luò)內(nèi)計(jì)算能力,以及與英偉達(dá)技術(shù)的深度集成。
從訓(xùn)練到推理
盡管如此,AI工作負(fù)載正在從大規(guī)模集中訓(xùn)練轉(zhuǎn)向廣泛分布的推理。網(wǎng)絡(luò)架構(gòu)需要改變以應(yīng)對(duì)邊緣的海量推理流量,而這種轉(zhuǎn)變需要關(guān)鍵指標(biāo)的改變。Ullal指出,對(duì)于訓(xùn)練,關(guān)鍵指標(biāo)是作業(yè)完成時(shí)間——即從訓(xùn)練作業(yè)被提交到GPU集群到訓(xùn)練運(yùn)行結(jié)束之間的時(shí)間。對(duì)于推理,關(guān)鍵指標(biāo)則不同——它是指首令牌時(shí)間和延遲——即從用戶提交查詢到收到第一個(gè)響應(yīng)所需的時(shí)間。
向推理的轉(zhuǎn)變意味著流量模式從以服務(wù)器到服務(wù)器的東西向流量為主,轉(zhuǎn)變?yōu)楦嘤脩糁g及跨分布式數(shù)據(jù)中心的南北向流量。她指出,骨干、主干和邊緣-葉網(wǎng)絡(luò)的建設(shè)規(guī)模正在擴(kuò)展到數(shù)百太字節(jié)級(jí)別。
Ullal繼續(xù)表示,突發(fā)且不可預(yù)測(cè)的智能體AI流量對(duì)網(wǎng)絡(luò)遙測(cè)提出了新要求。諸如狀態(tài)流網(wǎng)絡(luò)遙測(cè)等技術(shù),能夠?qū)崟r(shí)提供所需的細(xì)粒度網(wǎng)絡(luò)指標(biāo),以洞察AI網(wǎng)絡(luò)效率,這超越了簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)和輪詢等傳統(tǒng)網(wǎng)絡(luò)監(jiān)控手段。
Ullal稱,網(wǎng)絡(luò)操作系統(tǒng)需要實(shí)施基于狀態(tài)的架構(gòu),以充分利用這些技術(shù),消費(fèi)實(shí)時(shí)數(shù)據(jù)并進(jìn)行長(zhǎng)期存儲(chǔ),從而獲得最大的AI洞察力。她認(rèn)為,這正是Arista的AVA(自主虛擬助手)的目標(biāo)。
AI協(xié)助運(yùn)維應(yīng)對(duì)挑戰(zhàn)
為了滿足日益苛刻的數(shù)據(jù)中心網(wǎng)絡(luò)需求,運(yùn)營(yíng)商正轉(zhuǎn)向自動(dòng)化——但人類仍然扮演著角色。Ullal表示,AI在2026年的作用將日益增強(qiáng),但人類將監(jiān)督整個(gè)過(guò)程。
“從手動(dòng)操作轉(zhuǎn)向自動(dòng)化網(wǎng)絡(luò)運(yùn)維,對(duì)于通常風(fēng)險(xiǎn)厭惡的企業(yè)來(lái)說(shuō)是一大步,”她說(shuō)?!笆紫畔⒐賯兠媾R著人員短缺和手動(dòng)配置過(guò)多的挑戰(zhàn)。在一個(gè)‘爬-走-跑’的分階段方法中,我們相信真正的‘助手’模式,即利用AI技術(shù)幫助網(wǎng)絡(luò)運(yùn)營(yíng)商更高效地工作。隨著自主網(wǎng)絡(luò)運(yùn)維變得更加可靠、安全和可用,Arista AVA旨在提供人力參與更少的輔助網(wǎng)絡(luò)運(yùn)維。”
Arista在高速數(shù)據(jù)中心交換領(lǐng)域處于領(lǐng)導(dǎo)地位,其截至9月30日的第三季度收入為23.08億美元,同比增長(zhǎng)27.5%。分析師預(yù)計(jì)其今年收入將達(dá)到100億美元。
然而,Arista的競(jìng)爭(zhēng)對(duì)手并未止步。根據(jù)IDC 6月的一份報(bào)告,英偉達(dá)的Spectrum-X數(shù)據(jù)中心交換平臺(tái)增長(zhǎng)“驚人”,同比增長(zhǎng)760.3%,達(dá)到14.6億美元。英偉達(dá)正在侵蝕Arista在超大規(guī)模公司中的主導(dǎo)地位,獲得了Meta和甲骨文作為Spectrum-X客戶。思科預(yù)計(jì)其2026財(cái)年AI相關(guān)收入將超過(guò)30億美元,這主要得益于其Silicon One架構(gòu)和Acacia光模塊技術(shù)。