據(jù)tomshardware消息,美國AI芯片初創(chuàng)公司Neurophos宣布,最新研發(fā)的光處理單元(OPU)在FP4/INT4計算負(fù)載下的運(yùn)算性能,較Nvidia最新Vera Rubin NVL72 AI超級計算芯片提升十倍,而功耗卻與之相當(dāng)。據(jù)Register報道,該公司通過采用更大規(guī)模的矩陣和大幅提升的時鐘頻率實現(xiàn)了這一突破。
Neurophos接受過比爾?蓋茨旗下Gates Frontier 基金的投資,公司CEO Patrick Bowen在接受媒體采訪時表示:“這款芯片內(nèi)置一枚 1000×1000 規(guī)格的光子傳感器”,這一尺寸約為多數(shù)人工智能圖形處理器(GPU)所采用的常規(guī) 256×256 矩陣的 15 倍。盡管矩陣規(guī)模大幅提升,該公司卻將光晶體管的體積做到了現(xiàn)有產(chǎn)品的萬分之一左右。目前硅光子工廠生產(chǎn)的光晶體管體積十分龐大,長度約2毫米,根本無法在芯片上集成足夠數(shù)量的光晶體管,以實現(xiàn)能與當(dāng)下數(shù)字互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)技術(shù)比肩的計算密度?!?
Neurophos第一代加速芯片將集成一枚 “光等效” 張量核心(Tensor Core),面積約 25 平方毫米。據(jù)悉,Nvidia的Vera Rubin芯片搭載了 576 枚張量核心,兩相比較差距顯著,而核心差異在于 Neurophos 對光子芯片(photonic die)的使用方式。除了采用 1000×1000的大規(guī)格矩陣單元,Neurophos推出的首款光處理單元 —— Tulkas T100能實現(xiàn)56 GHz的低功耗運(yùn)行,這一頻率遠(yuǎn)超Intel酷睿 i9-14900KF 創(chuàng)下的 9.1 GHz世界紀(jì)錄,也高于Nvidia RTX Pro 6000 顯卡 2.6GHz的加速頻率。這一技術(shù)優(yōu)勢,讓這款紙面上看似配置不足的芯片,在運(yùn)算性能上超越了Nvidia的人工智能圖形處理器。