
作者|史慧芳??
編輯|六耳
來源|創頭條
2023年亞布力論壇夏季高峰會于8月24日-27日在深圳召開,科大訊飛創始人、董事長劉慶峰出席并演講。
劉慶峰表示,中國人工智能算法已經不受制于國外,算力方面也有好消息,“華為的GPU能力現在已經跟英偉達一樣”。
-1-
“華為GPU已與英偉達A100相當”
據劉慶峰介紹,華為的GPU技術現在已經與英偉達A100相當,但由于算子庫不全,因此整體效率與英偉達相比仍存在差距。但任正非非常重視這個問題。“華為的三位董事作為聯系工作組到科大訊飛,我們成立了一個專班工作,目前已經可以媲美英偉達A100,這是非常了不起的。” 劉慶峰稱。
“以前百模大戰,基本都是由英偉達訓練的。企業內部只能進行微小的調優和訓練,而基本的訓練模型是比較困難的。”劉慶峰表示,這次基本上解決了這個問題。
據了解,華為這款已經與英偉達A100旗鼓相當的GPU產品應該與昇騰910相關。
大模型的研發過程,需要可以支撐千億參數規模大模型并行訓練的算力和框架,還需要幾千張芯片同時連續運行。基于此,系統架構以及并行訓練的集群能力成為大模型研發的關鍵。
今年8月15日,在星火認知大模型發布會上劉慶峰表示,科大訊飛與華為共同發布一款用于企業構建專屬大模型的軟硬件一體化設備“星火一體機”,讓所有企業都可以在國產自主創新的平臺上自主、安全、可控地私有化部署大模型。
據劉慶峰介紹:“星火一體機可用于大模型的訓練和推理,企業拎回去,開箱即可用。每一家企業,每一個行業、每一個學校、每個醫院都可以有機會構建自己的專屬大模型。”
據第一財經報道,星火一體機使用的是華為尚未官方對外發布的昇騰910B人工智能芯片。
一位業內人士在接受采訪時稱,“華為昇騰910B芯片的性能從未對外公布,但最近華為在業內大力推廣這一平臺,而且它的性能與上一代的910相比,應該絕對不是一個量級。”
據了解,星火一體機也是910B芯片首個對外商業化應用產品。
此外,科大訊飛和華為已在聯合攻關算力卡脖子的問題。
劉慶峰在發布會上表示,正在與華為打造面向超大規模參數大模型訓練的國產算力的集群,對標英偉達的A100芯片。A100是目前在大模型訓練市場上應用最廣泛的芯片。
劉慶峰表示:“華為與科大訊飛將共同在生成式軟硬件平臺上,把高算力、高性能的算子庫,多卡的高速互聯以及分布式存儲結合起來,尤其是聯合針對人工智能所需要的最重要的算子庫進行甄別和打磨,在此基礎上架構科大訊飛的訓練和數據閉環的全流程設計,以及訓練和推理一體化設計的自研的大模型訓練平臺。”
早在今年7月,科大訊飛就與華為宣布,打造基于中國自主創新的通用智能新底座。一方面,訊飛星火認知大模型基于訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業落地應用和迭代;另一方面,以昇騰AI為核心,軟硬件協同優化,構建算力集中、性能優越、供給穩定、數據安全的大模型訓練集群。?
-2-
高端GPU亟需國產替代
國產大模型已形成群模亂舞、百模大戰的局面。
大模型的發展需要算法、算力、數據三大重要因素的支撐,算力是大模型訓練的重要能量引擎,也是目前國內發展大模型產業的一大壁壘。
正所謂“無芯片,不AI”。芯片能力直接影響著高算力訓練效果和速度。
當前大模型浪潮風起云涌,大模型的算力需求飆升,AI芯片迎來了重要商機。
作為目前全球人工智能算力最大“軍火商”,英偉達在高性能GPU方面的技術領先地位。
為了支持大型語言模型推理,英偉達發布了一系列圍繞AI領域的產品和服務,其旗下的A100、H100、A800和 H800等高性能GPU芯片成為搶手貨,一“芯”難求,且價格一路飆升。
盡管國產大模型產品頻出,但從其背后支持的芯片來看,所有這些平臺使用的要么是英偉達 A100、H100 GPU,要么是去年禁令后英偉達專門推出的減配版 A800、H800。
“國內大模型企業基本上很難拿得到這些芯片。整個市場需大于求,缺貨非常厲害。”某電子元器件采購供應商坦言:“今年,這類GPU芯片從原來的12萬人民幣左右,變成了現在是25萬甚至30萬,甚至有高達50萬一片”。
如今國內頭部科技企業在AI和云計算方面投入較大。與此同時,中國科技大廠還在進行新一輪的采購競爭。
前不久,有報道稱,國內各互聯網大公司也紛紛向英偉達下大單,百度、阿里、字節等向英偉達訂購了數十億美元的GPU。
從大模型產品芯片供應情況來看,在AI大模型訓練上,現在A100、H100及其特供中國的減配版A800、H800找不到替代品。
在如此瘋炒以及中國大科技公司對于采購GPU非常急迫之下,中國急需中國版的“英偉達”出現,打破“缺芯”局面,實現國產替代。?
.END.
圖片來源|網絡