深圳新聞網(wǎng)2026年6月1日訊(深圳特區(qū)報記者 焦子宇 許依妍)當今人工智能時代,基于國產(chǎn)算力的大模型高效訓練和推理是國家發(fā)展戰(zhàn)略的大問題。近日,深圳河套學院聯(lián)合多家單位開展技術(shù)攻關(guān),依托昇騰910C國產(chǎn)AI算力集群,完成1.6萬億參數(shù)大模型DeepSeek-V4-Pro全流程訓練。此次實踐為全球第三方機構(gòu)在國產(chǎn)算力平臺上完成該級別模型訓練的相關(guān)探索積累了重要經(jīng)驗,也印證了國產(chǎn)AI芯片可支撐世界級超大參數(shù)模型訓練工作。
DeepSeek-V4-Pro在效率和性能方面是業(yè)界大模型的杰出代表。DeepSeek-V4-Pro已經(jīng)成功完成在國產(chǎn)算力上推理部署,但訓練還未完全實現(xiàn)國產(chǎn)算力化。在此背景下,深圳河套學院AI訓練平臺項目團隊,聯(lián)合哈爾濱工業(yè)大學(深圳)、深圳大數(shù)據(jù)研究院、華為GTS(全球技術(shù)服務(wù))、計算產(chǎn)品線、2012實驗室,協(xié)同深智城AI算力平臺,面向國產(chǎn)算力大模型訓練開展聯(lián)合攻關(guān)。
項目采用千卡級算力集群開展訓練,運行全程穩(wěn)定、未出現(xiàn)中斷情況,各項指標達到工業(yè)運行標準,進一步檢驗了國產(chǎn)算力對不同類型超大參數(shù)模型的適配與承載能力。目前,僅用1個月時間,項目已基于昇騰910C國產(chǎn)算力集群實現(xiàn)DeepSeek-V4-Pro全參數(shù)續(xù)訓練/SFT穩(wěn)定運行,完成長穩(wěn)訓練1500+步,訓練MFU超30%,關(guān)鍵訓練算子效率提升14%,是業(yè)界首個由第三方機構(gòu)基于國產(chǎn)算力集群完成的DeepSeek-V4-Pro全參數(shù)后訓練工程實踐。
在同等參數(shù)量下,業(yè)界公開的國產(chǎn)算力全參數(shù)后訓練案例幾乎為零。而該項目將一個1.6T MoE模型,在千卡集群上以27秒/步的穩(wěn)定節(jié)奏,連續(xù)奔跑1500余步。項目通過三大關(guān)鍵技術(shù)突破,實現(xiàn)了從“能跑”到“能訓、訓穩(wěn)、訓優(yōu)”。
本次攻關(guān)的另一個獨特價值,在于它是一次人才培養(yǎng)模式的范式實驗。
深圳河套學院將萬億級模型訓練攻關(guān)作為“練兵場”,把學生直接嵌入國產(chǎn)算力真實訓練場景。截至目前,項目已培養(yǎng)學生42名,形成了由青年教師指導、博士生核心攻堅、工程團隊支撐的協(xié)同培養(yǎng)機制。
下一階段,深圳河套學院將繼續(xù)聯(lián)合合作伙伴,在現(xiàn)有全參數(shù)續(xù)訓練/SFT鏈路基礎(chǔ)上,持續(xù)優(yōu)化訓練框架與關(guān)鍵算子,力爭實現(xiàn)訓練效率再突破,超長上下文訓練,強化學習后訓練閉環(huán),并持續(xù)完善“國產(chǎn)算力支撐、真實任務(wù)牽引、學生團隊實戰(zhàn)、工程能力沉淀”的培養(yǎng)路徑。