8 月 22-24 日, 2025 中國算力大會在山西大同成功舉辦。中國算力大會是由工業(yè)和信息化部主辦的中國規(guī)格最高的算力大會,2025 年本屆大會由山西省人民政府、山西省工業(yè)和信息化廳承辦,以“算網(wǎng)筑基 智引未來”為主題,齊聚基礎電信企業(yè)、芯片企業(yè)、算力企業(yè)、科研機構、高等院校等單位代表及行業(yè)專家。本屆大會聚焦算力基礎設施構建、智算融合發(fā)展與綠色低碳創(chuàng)新,全方位展示我國算力產業(yè)最新成果。
中昊芯英作為國內 TPU 架構 AI 算力的核心推動者,深度參與本屆大會。聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋在開幕式主論壇發(fā)表《攻堅 AI 軟硬件協(xié)同效能:國產自研TPU芯片軟件棧的優(yōu)化實踐與生態(tài)構建》主題演講;中昊芯英展區(qū)以“算力硬件—云服務—解決方案”三維場景全面展示 TPU AI 基座,并憑借全自研的 TPU 架構 AI 專用算力芯片“剎那®”獲評“創(chuàng)新先鋒案例”;同期,中昊芯英首席架構師平曉峰在大會重榜活動“星耀之夜”發(fā)表《基于 GPTPU 架構的國產高性能智算平臺》主題分享,中昊芯英解決方案架構師顧立程在智能計算創(chuàng)新發(fā)展論壇中發(fā)表《TPU AI 專用算力芯片:大模型基礎設施的突破之路》主題演講。
開幕式主論壇:聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋闡釋軟硬件協(xié)同創(chuàng)新,定義國產算力新路徑
中昊芯英聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋受邀在大會的開幕式主論壇發(fā)表《攻堅 AI 軟硬件協(xié)同效能:國產自研 TPU 芯片軟件棧的優(yōu)化實踐與生態(tài)構建》主題演講。面對當前 AI 算力規(guī)??焖贁U張與系統(tǒng)效能瓶頸之間的突出矛盾,他指出軟硬件協(xié)同設計作為突破算力性能約束的關鍵路徑,并深度闡釋國產 GPTPU 架構 AI 芯片全棧軟件生態(tài)的協(xié)同創(chuàng)新模式。
鄭瀚尋以中昊芯英自研的 GPTPU 架構 AI 專用算力芯片“剎那®”為核心,詳細解析了針對先進大模型全生命周期性能優(yōu)化的關鍵技術路徑,通過算子優(yōu)化、KV融合與訪存優(yōu)化、計算圖拓撲重構與系統(tǒng)級優(yōu)化(io_uring)等軟硬件協(xié)同設計關鍵技術,實現(xiàn) Attention 層耗時降低、 token 延遲減少、讀寫效率提升、系統(tǒng)通信性能優(yōu)化等系統(tǒng)級優(yōu)化,顯著提升大模型訓練與推理任務的執(zhí)行效率。這些軟件棧的系統(tǒng)級創(chuàng)新成果在 DeepSeek 等國產主流大模型的適配中得到充分驗證,并成為全國首批通過由中國信通院、人工智能軟硬件測試驗證中心、中國人工智能產業(yè)發(fā)展聯(lián)盟聯(lián)合權威發(fā)布的“DeepSeek 大模型適配通過名單”的 8 家企業(yè)之一,展現(xiàn)了中昊芯英從技術追趕到產業(yè)引領的戰(zhàn)略轉型決心。
獲評 2025 中國算力大會“創(chuàng)新先鋒案例”,TPU 架構 AI 專用算力芯片獲權威認可
在大會創(chuàng)新成果發(fā)布與頒獎環(huán)節(jié),中昊芯英憑借全自研的 TPU 架構 AI 專用算力芯片“剎那®”獲評“創(chuàng)新先鋒案例”,該芯片擁有完全自主可控的 IP 核、全自研指令集與計算平臺,AI 算力性能超越海外著名 GPU 產品近 1.5 倍,能耗降低 30%,單位計算成本降低近 50%。同時,采用 Chiplet 技術與 2.5D 封裝,實現(xiàn)同等制程工藝下的性能躍升。支持 1024 片芯片高速片間互聯(lián),系統(tǒng)級性能比傳統(tǒng) GPU 集群提升數(shù)倍,為構建千卡、萬卡規(guī)模超算集群奠定基礎。基于“剎那®”芯片構建的“泰則®”GPTPU 人工智能服務器與計算集群系統(tǒng),單集群最大浮點運算能力在 TF32 計算精度及稀疏算力技術下可達 400P 以上,有力支撐包括超千億參數(shù) AIGC 大模型運算、高級無人駕駛模型訓練、蛋白質結構精密預測等各類高強度 AI 運算場景。該方案在算力性能、能效比、兼容性等方面表現(xiàn)突出,目前已應用于多個大型智算中心,支持大模型訓練、推理及行業(yè) AI 應用落地。
中昊芯英在核心展區(qū)打造 69 平方米特裝展位,以“算力硬件—云服務—解決方案”三維場景全面展示 TPU AI 基座?,F(xiàn)場重點展出全自研 TPU 架構 AI 芯片“剎那®”及人工智能服務器“泰則®”,并部署多臺服務器設置交互體驗環(huán)節(jié),實機運行 DeepSeek 等國產大模型,吸引大量專業(yè)觀眾駐足交流。
分論壇及專題活動分享,多維展現(xiàn)國產 TPU 的架構創(chuàng)新、集群實踐與生態(tài)共建
在大會同期重磅活動“算力中國·星耀之夜”,中昊芯英首席架構師平曉峰發(fā)表《基于 GPTPU 架構的國產高性能智算平臺》主題分享。該活動由工業(yè)和信息化部新聞宣傳中心副主任趙榮貴、山西省工業(yè)和信息化廳副廳長劉勇、大同市委常委兼大同經(jīng)開區(qū)黨工委書記寧文鑫等重要領導出席并致辭。平曉峰在演講中系統(tǒng)闡述了公司從自主芯片研發(fā)到全棧服務布局的技術體系,重點介紹了基于 GPTPU 架構的高性能智算平臺建設成果與產業(yè)實踐。并結合與深圳聯(lián)通、天津移動等伙伴共建智算中心的落地案例,以及在金融、法律、創(chuàng)新創(chuàng)業(yè)等多領域的 AI 垂直大模型融合應用,呈現(xiàn)中昊芯英以全棧自主、生態(tài)兼容的 GPTPU 架構云平臺推動國產算力底座建設與行業(yè)智能化轉型的核心價值與實施路徑。
在智能計算創(chuàng)新發(fā)展論壇中,中昊芯英解決方案架構師顧立程發(fā)表《TPU AI 專用算力芯片:大模型基礎設施的突破之路》主題演講?;仡?GPU 架構變化歷史,發(fā)現(xiàn) Tensor Core 的架構革新對 GPU 算力性能提升顯著,而 TPU 本質上是獨立出來的 Tensor core,為 AI 大模型訓練而生。中昊芯英 TPU 架構 AI 芯片在大規(guī)模計算單元調度、能效優(yōu)化及千卡集群構建方面的核心技術突破,“泰則®”智算系統(tǒng)與千卡級集群能力,全面展示了中昊芯英在算力效能、能效比和軟硬件協(xié)同方面的顯著優(yōu)勢,為傳統(tǒng)行業(yè)智能化轉型提供可復用的算力支撐。
本屆大會見證了我國算力產業(yè)的蓬勃生機。中昊芯英憑借在自研 TPU 架構、千卡集群與全棧軟件生態(tài)上的系統(tǒng)性突破,充分展現(xiàn)了國產算力支撐大模型創(chuàng)新與行業(yè)智能化轉型的實力與決心。未來,公司將繼續(xù)深化軟硬件協(xié)同創(chuàng)新,攜手產業(yè)伙伴共促智算融合與自主創(chuàng)新,為構建自主可控、高效綠色的智能算力基石持續(xù)貢獻力量。