【環(huán)球網(wǎng)科技報道 記者 林迪】2025年被稱為大模型落地元年。不過,企業(yè)要實現(xiàn)AI有效落地,必須突破三重壁壘:異構(gòu)算力供給的動態(tài)平衡難題、模型迭代的可控性挑戰(zhàn)和技術(shù)與業(yè)務(wù)的融合斷層。面對這些挑戰(zhàn),新華三給出了系列技術(shù)答案:以開放姿態(tài)、工程能力與長期主義,破解當(dāng)下AI基礎(chǔ)設(shè)施“效率、供給、普惠”三大痛點。
在接受記者采訪時,新華三集團(tuán)高級副總裁、云與計算存儲產(chǎn)品線總裁徐潤安直言這是WAIC史上最火的一屆,“機器人滿地走”折射產(chǎn)業(yè)加速度。在他看來,論壇內(nèi)容“很干”,場景落地密集,標(biāo)志著AI從“看熱鬧”進(jìn)入“看門道”。
與過去 IT 產(chǎn)業(yè)發(fā)展路徑不同,當(dāng)前 AI 領(lǐng)域的創(chuàng)新呈現(xiàn)全鏈條爆發(fā)態(tài)勢。“過去從 IT 角度來說,跟著傳統(tǒng)CPU和GPU大廠路線走就可以了。但現(xiàn)在,每個環(huán)節(jié)、每個層次都在進(jìn)行創(chuàng)新,GPU 廠商、整機廠商、操作系統(tǒng)廠商等都在各自領(lǐng)域深耕,這種突破原有邊界的創(chuàng)新活力,是前所未有的。” 徐潤安強調(diào)。
多元算力與云邊端協(xié)同成基礎(chǔ)設(shè)施發(fā)展核心趨勢
在 AI 走向“技術(shù)摸高”和工程創(chuàng)新并重的階段,AI 基礎(chǔ)設(shè)施的發(fā)展方向成為焦點。徐潤安指出,多元算力泛在協(xié)同與云邊端一體化是兩大核心趨勢。“算力結(jié)構(gòu)在向集中式訓(xùn)練、邊緣推理的架構(gòu)進(jìn)化,智算中心也從簡單粗放的堆算力,轉(zhuǎn)向追求效率,因為只有效率提升,才能實現(xiàn)商業(yè)閉環(huán)。”
為適應(yīng)多元算力需求,新華三推出了豐富的產(chǎn)品形態(tài),從服務(wù)器到整機柜超節(jié)點,涵蓋多種 GPU 算力產(chǎn)品。“理論上服務(wù)器應(yīng)追求規(guī)?;?biāo)準(zhǔn)化,但現(xiàn)在不同 GPU 在性能、功耗等方面特點各異,為適配更多 GPU 并提升算力效率,必須推出更多形態(tài)的產(chǎn)品。” 徐潤安解釋道。
網(wǎng)絡(luò)層面,高帶寬、低延時、高可靠的傳輸成為關(guān)鍵,以太網(wǎng)技術(shù)在此方面的優(yōu)勢比較明顯。“包括傳統(tǒng)GPU大廠,也在發(fā)展以太網(wǎng)技術(shù),我們發(fā)現(xiàn)以太網(wǎng)的傳輸性能非常高,通過架構(gòu)的創(chuàng)新還能夠顯著提升千卡、萬卡規(guī)模集群的計算效率。” 徐潤安補充。存儲方面,高性能與綠色化并重,多協(xié)議融合、秒級加載能力、高 IOPS 要求成為核心指標(biāo),新華三 Polaris 存儲產(chǎn)品正是為此而生,通過高 I/O 支持和多協(xié)議融合,為算力釋放提供關(guān)鍵支撐。
開放生態(tài)構(gòu)建:從硬件適配到協(xié)同創(chuàng)新
新華三在生態(tài)建設(shè)上秉持開放態(tài)度,已適配超過 80 張 GPU 卡,覆蓋國內(nèi)主流 GPU 廠商。“我們不僅是將他們的卡放進(jìn)服務(wù)器,更在芯片未出時就聯(lián)合設(shè)計規(guī)格,共同開發(fā)關(guān)鍵組件。” 徐潤安表示,這種深度合作源于國產(chǎn) GPU 廠商的創(chuàng)新活力,“他們的創(chuàng)新倒逼我們優(yōu)化服務(wù)器體系架構(gòu)”。
在體系架構(gòu)層面,新華三超節(jié)點分為 S 系列和 F 系列,S系列強調(diào)高密單機與交換互聯(lián)結(jié)合,F(xiàn)系列強調(diào)靈活拓?fù)洌С?16、32、64 等細(xì)顆粒度擴展。“這些架構(gòu)設(shè)計不是簡單整合 GPU 卡,而是從一開始就與 GPU 廠商對齊思路,共同定義技術(shù)路徑。” 徐潤安透露,隨著下一代 GPU 推出,整機形態(tài)將迎來更多變化。
軟件平臺與業(yè)務(wù)模式創(chuàng)新同樣重要。新華三通過產(chǎn)業(yè)模式創(chuàng)新的圖靈小鎮(zhèn)平臺,匯聚 GPU 廠商算力與行業(yè)應(yīng)用場景,讓 ISV 在平臺上測試不同算力的適配性與性價比。同時,提供培訓(xùn)與咨詢服務(wù),提升客戶 IT 團(tuán)隊的 AI 應(yīng)用能力,“現(xiàn)在客戶從‘買算力’轉(zhuǎn)向‘用算力’,需要知道 AI 如何提升生產(chǎn)效率、改變業(yè)務(wù),這正是我們賦能的重點。”徐潤安強調(diào)。
超節(jié)點 AI 集群:提升效率與適配多元場景
新華三超節(jié)點的核心價值在于提升卡間通信效率,進(jìn)而優(yōu)化訓(xùn)練與推理性能。“通過工程化優(yōu)化,即便不做調(diào)優(yōu),推理效率也能提升 15%-20%。” 徐潤安介紹,全液冷設(shè)計不僅支持 GPU 超頻,還能降低數(shù)據(jù)中心能耗,提升整體性價比。
超節(jié)點在大規(guī)模訓(xùn)練場景中優(yōu)勢顯著,尤其適用于 AI for science、自動駕駛、手機端大模型訓(xùn)練等需求明確的領(lǐng)域。“通信效率提升直接帶來訓(xùn)練效率躍升,像手機端的 AI 應(yīng)用,都需要這樣的高性能集群支撐。”
對于開放與標(biāo)準(zhǔn)化,新華三集團(tuán)云與計算存儲產(chǎn)品線 智慧計算產(chǎn)品市場部總監(jiān)湯濤強調(diào):“封閉生態(tài)不利于產(chǎn)業(yè)發(fā)展,我們的超節(jié)點堅持算力多元化與接口標(biāo)準(zhǔn)化,支持國內(nèi)主流 GPU 廠商,并基于 PCIe 做協(xié)議創(chuàng)新,解決多端互聯(lián)難題。”未來還將推出應(yīng)用商城,實現(xiàn)模型快速推送與安裝,構(gòu)建從硬件到軟件的生態(tài)共榮。
平衡短期需求與長期布局,推動 AI 普惠
面對 DeepSeek 一體機引發(fā)的短期需求與企業(yè)長期算力規(guī)劃的平衡問題,徐潤安分析:“互聯(lián)網(wǎng)大客戶需求明確,運營商、電網(wǎng)等有長期策略,而中小企業(yè)更多是通過一體機降低門檻,解決‘想做但不會做’的困境。” 他認(rèn)為,這種需求并非純粹短期,“只是之前大家不知道如何落地,一體機讓門檻驟降,原有需求得以釋放”。
為推動 AI 普惠,新華三推出的一體機產(chǎn)品實現(xiàn)開箱即用,大幅縮短部署時間。“有些客戶自己搭建開源模型,一個月都沒成功,一體機幫他們快速啟動應(yīng)用。” 湯濤介紹,針對 30 萬預(yù)算以下的企業(yè)、教育機構(gòu)等,一體機提供高性價比選擇,“比如支持 200B 推理的小盒子,價格約 3 萬元,兩臺互聯(lián)可支持 400B 模型,讓更多中小客戶用得起 AI”。
未來展望:存算網(wǎng)協(xié)同與場景爆發(fā)
徐潤安指出:“GPU 已顛覆傳統(tǒng)算力,接下來 AI 如何用網(wǎng)絡(luò)、用存儲,是亟待研究的課題。” 新華三作為網(wǎng)絡(luò)、計算、存儲全棧廠商,正加強這三方面的協(xié)同規(guī)劃,推出 DDC 數(shù)據(jù)中心網(wǎng)絡(luò)產(chǎn)品對標(biāo) IB 效率;并成為英偉達(dá)在中國唯一認(rèn)證的 AIDP 合作伙伴,通過存儲性能提升實現(xiàn)與DPU、交換機的高效互聯(lián)。
對于未來場景,徐潤安看好物理世界數(shù)字化與具身智能,“這不僅涉及大語言模型,還需要更多性能相關(guān)的集群支撐”。教育、科研、金融、電力等行業(yè)將成為算力需求大戶,“一旦某個場景爆發(fā),算力消耗將大幅增長,這正是產(chǎn)業(yè)機遇所在”。
當(dāng)AI進(jìn)入“大模型技術(shù)摸高與工程創(chuàng)新并重”階段,新華三選擇把難題留給自己,把選擇權(quán)交給客戶:用開放架構(gòu)兼容多元算力,用工程化能力縮短交付周期,用標(biāo)準(zhǔn)化接口降低切換成本。正如徐潤安所言,“為了極致的AI體驗,一切嘗試和創(chuàng)新都值得”,在這場沒有標(biāo)準(zhǔn)答案的AI長跑中,新華三正試圖成為那條最穩(wěn)的“跑道”。