日前,據(jù)《The Information》報道,阿里巴巴與百度已開始使用自主研發(fā)的AI芯片訓(xùn)練模型,以部分替代英偉達芯片。
阿里云在2023年披露自研AI芯片計劃。“zhenwu ”定位為云端AI訓(xùn)練與推理加速器,強調(diào)高帶寬內(nèi)存(HBM)與能效比平衡。
The Information稱,2025年初起,使用“zhenwu處理單元”訓(xùn)練小型AI模型,而未進入超大規(guī)模主力任務(wù),說明量產(chǎn)與生態(tài)適配仍在探索期。
百度自2018年推出昆侖系列,P800是新一代產(chǎn)品,采用自研XPU架構(gòu),在FP16/INT8推理場景下具備較強性價比。
《The Information》報道,百度P800已進入Ernie訓(xùn)練實驗階段,但是否能承擔大規(guī)模分布式訓(xùn)練仍需驗證。
百度方面表示,昆侖芯片已在多個內(nèi)部業(yè)務(wù)中部署,目標是構(gòu)建自主AI算力底座。
這一變化的背后,是美國對中國高性能AI芯片出口的限制不斷升級,以及“國產(chǎn)替代”的不斷推進。
《The Information》此前還報道,DeepSeek已使用華為昇騰AI芯片,訓(xùn)練其部分模型。
另有報道指出,DeepSeek遇到訓(xùn)練穩(wěn)定性、多卡互聯(lián)帶寬不足等問題,導(dǎo)致模型發(fā)布時間推遲。
但 DeepSeek 正不斷在推進與國產(chǎn) AI 芯片的適配進度。
日前, DeepSeek 微信公眾號推送的一句留言稱,“UE8M0 FP8 是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計”。
相關(guān)閱讀:國產(chǎn)GPU芯片 DeepSeek 時刻:單日1.7 萬億市值狂飆背后
中信建投有報告指出,DeepSeek表示新精度格式針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計,表明未來基于DeepSeek模型的訓(xùn)練與推理有望更多應(yīng)用國產(chǎn)AI芯片,助力國產(chǎn)算力生態(tài)加速建設(shè)。
種種跡象表明,國產(chǎn) AI 芯片正走出實驗室,盡可能的應(yīng)用到大模型場景中,尤其在“中小規(guī)模”和推理部署方面已經(jīng)具備一定競爭力,比如成本可控、接入更友好等。
相關(guān)閱讀:?H20解禁即退場,華為昇騰910B已達H20同等性能
但在超大規(guī)模訓(xùn)練方面,短期內(nèi)仍難與英偉達生態(tài)脫鉤。
這種“混合使用、分場景部署”的狀態(tài),短期內(nèi)應(yīng)該是主流。
這既是妥協(xié),也是務(wù)實。
2020 年《國家十四五規(guī)劃》明確提出,到?2025 年國產(chǎn)芯片自給率要達到 70%,為產(chǎn)業(yè)發(fā)展指明方向、注入動力。