作者 |??ZeR0,編輯?|??漠影
放棄訓(xùn)練,專注推理。
芯東西5月9日?qǐng)?bào)道,據(jù)EETimes報(bào)道,美國(guó)AI芯片獨(dú)角獸SambaNova Systems近期宣布將裁員77人,約占其500名員工的15%。此次裁員正值該公司偏離最初目標(biāo),放棄做AI訓(xùn)練,轉(zhuǎn)向完全專注于AI推理。
SambaNova成立于2017年,總部位于美國(guó)加州,曾希望為訓(xùn)練和推理打造基于統(tǒng)一架構(gòu)的AI芯片,2023年發(fā)布了一款專為大語(yǔ)言模型微調(diào)和推理設(shè)計(jì)的芯片。其上一輪融資是2021年的D輪融資,使其融資總額超過(guò)11億美元(約合人民幣80億元),估值超過(guò)50億美元(約合人民幣362億元)。SambaNova發(fā)言人稱,該公司做出了一些調(diào)整,以適應(yīng)當(dāng)前的市場(chǎng)狀況以及從模型訓(xùn)練到微調(diào)和推理的轉(zhuǎn)變。
SambaNova已迅速轉(zhuǎn)向?qū)W⒂谔峁┰苾?yōu)先解決方案,幫助企業(yè)和開發(fā)者大規(guī)模部署開源模型。在AI訓(xùn)練市場(chǎng),英偉達(dá)的統(tǒng)治地位難以撼動(dòng)。相對(duì)而言,在AI推理市場(chǎng)收獲客戶可能性更大。隨著大模型服務(wù)日益普及,模型推理亟需更高性價(jià)比的算力基礎(chǔ)設(shè)施,這使得數(shù)據(jù)中心AI推理芯片市場(chǎng)規(guī)模被空前看好。數(shù)據(jù)中心領(lǐng)域的AI芯片和硬件創(chuàng)企已轉(zhuǎn)向通過(guò)云端提供對(duì)開源大語(yǔ)言模型的API訪問(wèn)。SambaNova的目標(biāo)客戶群是企業(yè)市場(chǎng),他們正嘗試通過(guò)云服務(wù)部署基于大語(yǔ)言模型的應(yīng)用程序來(lái)進(jìn)入推理領(lǐng)域,去年9月首次推出SambaNova Cloud。該公司的軟件棧SambaNova Studio面向企業(yè)AI,并隨SambaNova機(jī)架式硬件一起提供,用于本地集群和云端。
近幾個(gè)月來(lái),AI芯片獨(dú)角獸SambaNova、Cerebras、Groq,通過(guò)自有硬件提供大語(yǔ)言模型token服務(wù)。這三家公司最初都專注于為其他云服務(wù)提供商和本地AI計(jì)算銷售硬件系統(tǒng),其中SambaNova和Cerebras仍在銷售硬件系統(tǒng)。SambaNova平臺(tái)搭載其第四代處理器SN40L。SN40L采用數(shù)據(jù)流架構(gòu)和三層內(nèi)存架構(gòu),提高了AI推理效率。通過(guò)整合超大內(nèi)存,單個(gè)SambaNova系統(tǒng)即可容納數(shù)TB的模型。
根據(jù)獨(dú)立AI基準(zhǔn)測(cè)試公司Artificial Analysis的測(cè)試結(jié)果,SambaNova在DeepSeek R1 671B上平均每秒每位用戶可交付250個(gè)token,而使用GPU的提供商平均每秒每位用戶僅交付19個(gè)token,這意味著SambaNova的推理性能平均比GPU驅(qū)動(dòng)的系統(tǒng)快10倍以上。盡管多家AI芯片創(chuàng)企曾披露“超越英偉達(dá)”的雄心,并試圖通過(guò)提供更具競(jìng)爭(zhēng)力的價(jià)格來(lái)打動(dòng)客戶,但芯片市場(chǎng)競(jìng)爭(zhēng)非常殘酷,英偉達(dá)的生態(tài)影響力難以撼動(dòng),其他在AI芯片市場(chǎng)上有所作為的供應(yīng)商也以芯片大廠居多。精簡(jiǎn)團(tuán)隊(duì)、聚焦主線,是近期多家芯片企業(yè)為改善業(yè)績(jī)、增強(qiáng)競(jìng)爭(zhēng)力的主要手段。隨著企業(yè)適應(yīng)不斷變化的行業(yè)競(jìng)爭(zhēng)和經(jīng)濟(jì)狀況,2025年科技行業(yè)的裁員名單預(yù)計(jì)會(huì)變得更長(zhǎng)。
來(lái)源:SambaNova,EETimes