用戶名: 密碼: 驗證碼:

三套萬卡超集群!中國正在種自己的雨林

摘要:光合組織牽頭落地全國最大三萬卡國產 AI 算力池,聯(lián)合多方啟動攻關,以開放架構破解適配、孤島、算力缺位難題,推動國產 AI 從單點突破邁向生態(tài)協(xié)同。

  ICC訊   如果把全球AI產業(yè)比作一片超級雨林,這里物種豐富、生態(tài)完備——海外巨頭憑借數(shù)十年積累,構建了從算力架構到開發(fā)工具的閉環(huán)體系,成為雨林規(guī)則的制定者。而當國產大模型團隊帶著算法創(chuàng)新與場景需求沖進這片“雨林”時,卻陷入了一場尷尬的困境。算力、框架、工具鏈依賴外部供給,規(guī)則與技術標準由他人主導,硬件底座與框架支撐的自主話語權也嚴重缺失。

  或許,真正的破局之路從來不是“當更好的客人”,而是帶著我們自己培育的“熱帶雨林”去全球AI賽道會師。

  2月10日,由光合組織牽頭的“國產萬卡算力賦能大模型發(fā)展研討會暨聯(lián)合攻關啟動儀式”正式啟幕——全國最大單體國產AI算力池的落地,不僅標志著國產AI算力規(guī)模的里程碑式突破,更宣告中國AI產業(yè)從“單點突圍”邁入“生態(tài)協(xié)同”的關鍵階段。會上,光合組織攜手模型廠商、模型加速廠商及重點行業(yè)用戶,共同啟動“國產大算力+國產大模型聯(lián)合攻關專項計劃”并向專項企業(yè)授牌。

  當海外巨頭以垂直閉環(huán)體系主導行業(yè)規(guī)則時,中國 AI 產業(yè)正依托光合組織這類生態(tài)協(xié)同平臺,聚集中科曙光等龍頭企業(yè),用開放架構打造共建共生的產業(yè)生態(tài),讓創(chuàng)新力量在兼容共生的土壤中自然生長。

  01三套萬卡超集群,最大單體國產AI算力池啟用

  自主生態(tài)的根基,永遠是硬核的算力支撐。對于AI產業(yè)而言,算力就如同農業(yè)時代的耕地、工業(yè)時代的能源,是所有創(chuàng)新的前提與基礎;而超算互聯(lián)網作為“一體化的算力調度網絡、算力領域的生態(tài)協(xié)作網絡”,則是連接算力服務供給與產業(yè)需求的關鍵——二者共同構成了國產AI生態(tài)的“雙引擎”。

  中國信通院人工智能研究所軟硬件與創(chuàng)新生態(tài)部主任李論表示,大模型時代,模型原始創(chuàng)新與底層軟硬件高度耦合,底層設施的重要性愈發(fā)凸顯。智算已從“堆數(shù)量”轉向“以應用為導向的精細化發(fā)展”,未來將走向行業(yè)細分化、信推一體化。

  國家超算互聯(lián)網核心節(jié)點的三萬卡算力池正是這一轉型的典型實踐。2月5日,國家超算互聯(lián)網核心節(jié)點在鄭州正式上線試運行,節(jié)點部署三套高效耦合的曙光scaleX萬卡超集群系統(tǒng)。該系統(tǒng)是中科曙光面向萬億參數(shù)大模型、科學智能等復雜任務場景,打造的大規(guī)模智能算力基礎設施解決方案。值得注意的是,2025年12月,曙光scaleX萬卡集群在光合組織HAIC大會完成首次真機展示;時隔不到兩個月,該系統(tǒng)便實現(xiàn)三萬卡規(guī)模的工程化落地與運行。

  國家超算互聯(lián)網核心節(jié)點運維主任安磊表示,核心節(jié)點已完成數(shù)百個應用的深度適配,覆蓋23個行業(yè)領域,形成了多元化的應用落地格局。在應用規(guī)模層級上,平臺實現(xiàn)了全棧覆蓋:近百個應用通過千卡級測試,數(shù)十個應用完成萬卡級測試,還儲備了5個具備戈登貝兒獎潛力的重大高端應用,實現(xiàn)了從中小規(guī)模到超大規(guī)模計算任務的全場景支撐。國家超算互聯(lián)網的生態(tài)賦能,進一步拓寬了這些應用的落地場景。目前,超算互聯(lián)網應用商城已吸引600多家服務商入駐,發(fā)布7200多款算力服務商品,累計完成近20萬次服務交付,逐步構建起類“京東、淘寶”平臺模式的算力供需對接生態(tài)。同時,超算互聯(lián)網AI社區(qū)已上線、適配近1100個開源大模型和240多個智能體應用,為各行業(yè)開發(fā)者提供了豐富的技術資源與支撐,吸引超32000位開發(fā)者。截至2026年2月,超算互聯(lián)網平臺已接入包括核心節(jié)點在內的30+計算中心下,整合形成400萬核心與25萬加速卡的全國最大異構算力資源池,用戶規(guī)模超110萬,日均處理與調度作業(yè)超25萬,單日作業(yè)峰值突破110萬;自超算互聯(lián)網成立以來,累計完成作業(yè)數(shù)超2億條,平臺月均訪問量突破1100萬次。

  當前業(yè)內也有不少企業(yè)推出了萬卡集群概念或方案。曙光萬卡集群與其他萬卡集群方案的核心差異,在于開放架構與包容生態(tài)。曙光聚焦算力底座,其萬卡集群可兼容多款主流國產AI芯片,支持異構算力混合部署與統(tǒng)一調度,相較以多數(shù)以單一芯片為核心構建萬卡集群的方案,這種跨品牌兼容的模式賦予萬卡集群部署落地和未來擴展更高彈性。曙光依托高密度設計、高速無損互聯(lián)與液冷技術,具備大規(guī)模擴展與高效運行能力,更適配多元算力需求場景。

  豐富的應用場景,都建立在全國產化的硬件基礎之上。三萬卡算力的落地,不僅是此次研討會最核心的亮點,更是國產算力生態(tài)從“能用”走向“好用、規(guī)?;谩钡年P鍵一躍。

  02三重關隘,擋在萬卡落地前

  在通往大規(guī)模智能化的征途上,國產算力生態(tài)并非一帆風順。在萬卡級算力落地成為現(xiàn)實之前,產業(yè)界普遍面臨著三重亟待攻克的系統(tǒng)性關隘,它們相互交織,構成了制約創(chuàng)新的系統(tǒng)性瓶頸。

  第一個痛點,技術面的層層壁壘。業(yè)內人士向半導體產業(yè)縱橫表示,“大模型,尤其是萬億參數(shù)級別的訓練與推理,是一項對底層軟硬件協(xié)同要求極高的系統(tǒng)工程。長期以來,國產AI芯片與主流AI框架、復雜模型之間,存在著一道深深的‘適配鴻溝’。這并非單純是芯片算力指標的問題,更在于整個軟件棧的成熟度。國際巨頭憑借其長達十數(shù)年的迭代,構建了從芯片指令集、驅動程序、編譯器到高度優(yōu)化的算子庫(如CUDA)的完整垂直生態(tài),為開發(fā)者提供了相對統(tǒng)一且穩(wěn)定的開發(fā)環(huán)境?!?

  反觀國產生態(tài),該人士進一步補充:“芯片廠商眾多,架構各異,其配套的算子庫往往聚焦于特定場景或常用算子,對于千億、萬億參數(shù)模型訓練所需的復雜、定制化算子支持不足。這導致科研機構或企業(yè)在將成熟模型遷移至國產平臺時,常常面臨‘功能缺失’、‘精度損失’或‘性能驟降’的困境,更進一步的形成‘硬件發(fā)布-缺乏應用-無法迭代’的負向循環(huán)。”

  第二個痛點,產業(yè)鏈“孤島化”。技術壁壘的背后,是更深層次的產業(yè)協(xié)同困境。業(yè)內人士向半導體產業(yè)縱橫表示,過去幾年國產AI算力產業(yè)鏈的“孤島化”現(xiàn)象十分突出:“芯片設計公司專注于提升單卡性能,服務器廠商致力于硬件集成,軟件框架團隊優(yōu)化算法效率,而最終用戶則疲于在不同技術路線間進行選擇和整合。各方之間缺乏統(tǒng)一的技術接口、互聯(lián)標準和性能評測體系?!边@種“煙囪式”的發(fā)展模式,導致大量重復性適配工作,資源嚴重內耗,整體生態(tài)效能不僅遠低于“1+1+1”的簡單疊加,甚至呈現(xiàn)出“1+1+1<3”的尷尬局面。標準割裂成為阻礙產業(yè)形成合力的關鍵枷鎖。

  第三個痛點,高端算力的缺位。萬億參數(shù)規(guī)模大模型訓練、千億級數(shù)據實時推理等前沿技術探索,對算力集群的并行處理能力、高速互連效率、持續(xù)穩(wěn)定運行提出嚴苛要求,必須依托萬卡級及以上高端算力集群作為基礎支撐。但在此前的產業(yè)發(fā)展階段,國產算力基礎設施普遍停留在千卡級部署規(guī)模,高端算力供給形成明顯斷層,使得許多前沿研究機構和頭部企業(yè),在源頭創(chuàng)新上便受到制約?!案叨怂懔Φ娜蔽唬寚aAI在源頭創(chuàng)新階段就陷入被動?!痹摌I(yè)內人士向半導體產業(yè)縱橫表示,“缺少自主的萬卡級算力支撐,國內科研團隊在開展超大模型訓練、前沿算法驗證時,往往受限于算力規(guī)模,無法進行全周期、高強度的迭代試驗,創(chuàng)新節(jié)奏與技術深度均受到直接影響?!?

  03從技術突破,到生態(tài)共生

  破解上述三重困境,從來不是單一企業(yè)的“單點突圍”,而是需要以開放架構為紐帶、以系統(tǒng)攻關為路徑的生態(tài)協(xié)同 —— 這正是光合組織自 2025 年 9 月提出開放架構理念、成立 AI 計算開放架構聯(lián)合實驗室的核心初衷,而曙光 scaleX 萬卡超集群的規(guī)?;涞?,正是這場生態(tài)重構的關鍵實踐。

  在技術架構層面,面對高端算力缺位與性能損耗的痛點,曙光scaleX萬卡超集群創(chuàng)新實現(xiàn)“算、存、網、電、冷、管、軟”一體化緊耦合設計,搭載自主研發(fā)的原生RDMA高速網絡,相較傳統(tǒng)IB網絡性能直接提升2.33倍,同時將網絡建設成本降低30%,實現(xiàn)“高性能與低成本”的雙重突破;通過存儲、計算、傳輸全鏈路深度協(xié)同優(yōu)化,AI加速卡資源利用率大幅提升55%。

  在生態(tài)兼容層面,針對技術壁壘與產業(yè)鏈“孤島化”困境,曙光以開放架構重構產業(yè)協(xié)同邏輯。作為國內首個AI計算開放架構的牽頭者,曙光scaleX萬卡超集群全面兼容CUDA等主流軟件生態(tài),讓開發(fā)者無需大幅重構代碼即可完成模型遷移,顯著降低開發(fā)門檻;通過“軟硬解耦+統(tǒng)一算子庫+中間件適配”的創(chuàng)新方案,化解不同國產芯片的“適配鴻溝”,打破“硬件發(fā)布-缺應用-難迭代”的負向循環(huán),讓多元芯片都能快速接入生態(tài)、發(fā)揮價值。

  如果說開放架構的兼容性為生態(tài)奠定了技術底座,產業(yè)協(xié)同網絡為創(chuàng)新鋪就了連接路徑,那么這兩者共同積蓄的勢能,最終必然指向對強大、自主的高端算力的迫切需求。而破解高端算力斷層痛點,關鍵在于打造共建共生的萬卡級及以上高端算力集群,掌握高端算力的定義權與供給權。

  在高端算力落地層面,國產布局萬卡級集群的核心邏輯,并非簡單追求數(shù)量優(yōu)勢,而是基于中國產業(yè)特色與算力需求痛點,走出的一條差異化創(chuàng)新路徑,為滿足中國市場“大規(guī)模、普惠化、高彈性”的算力剛需而生。此次全球最大單體算力池的落地,便是最好的詮釋。其不僅實現(xiàn)了高端算力的國產化,更通過開放生態(tài)讓更多企業(yè)能低成本使用。而算力使用過程中產生的場景反饋,又能反向推動國產核心硬件的技術迭代,形成“算力供給-場景應用-技術優(yōu)化”的正向循環(huán),讓國產高端算力不斷向價值鏈高端躍升。

  04三萬卡的落地,只是序章

  雨林不會一夜長成。但當?shù)谝黄~子開始進行光合作用,整片森林就有了可能。

  中國AI產業(yè)的自主化之路,注定不是對現(xiàn)有巨頭的簡單模仿與替代,而是一場關于產業(yè)組織范式、技術發(fā)展和生態(tài)建設邏輯的深刻探索。以曙光scaleX萬卡超集群和國家超算互聯(lián)網為代表的全國一體化算力網實踐,正在描繪一條以開放架構打破壁壘、以系統(tǒng)協(xié)同凝聚合力、以場景驅動加速迭代的特色路徑。

  這場征程的目標,不是建造一個整齊劃一、僅供觀賞的精致花園,而是開墾一片肥沃、開放、遵循自然法則的“產業(yè)雨林”。

  三萬卡算力的落地,是這片科技雨林破土新生的開篇之章。它預示著,在中國自主的科技土壤上,一場基于多元共生、開放協(xié)同的AI生態(tài)演進,已然按下加速鍵。未來,這片雨林能長多高、能有多茂盛,取決于無數(shù)參與者的智慧、耐心與協(xié)作。但唯一可以確定的是,只有根植于自主土壤的森林,才能無懼風雨,生生不息。

內容來自:半導體產業(yè)縱橫
本文地址:http://n2software.net//Site/CN/News/2026/02/13/20260213065822805973.htm 轉載請保留文章出處
關鍵字:
文章標題:三套萬卡超集群!中國正在種自己的雨林
1、凡本網注明“來源:訊石光通訊網”及標有原創(chuàng)的所有作品,版權均屬于訊石光通訊網。未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載我方內容的單位,也必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、免責聲明,凡本網注明“來源:XXX(非訊石光通訊網)”的作品,均為轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。因可能存在第三方轉載無法確定原網地址,若作品內容、版權爭議和其它問題,請聯(lián)系本網,將第一時間刪除。
聯(lián)系方式:訊石光通訊網新聞中心 電話:0755-82960080-168   Right

相關新聞

暫無相關新聞