AI大模型的爆發(fā)式增長,正推動數(shù)據中心進入智算時代。從ChatGPT到各類智能Agent應用,算力需求呈指數(shù)級攀升,單機柜功率從傳統(tǒng)15kW躍升至50kW甚至200kW,對數(shù)據中心的供電、制冷、架構與運維提出了前所未有的挑戰(zhàn)。

華為中國數(shù)字能源數(shù)據中心能源拓展部部長石憶
對此,華為中國數(shù)字能源數(shù)據中心能源拓展部部長石憶表示:“在智算時代加速到來的背景下,華為以‘安全可靠(Reliable)、彈性敏捷(Agile)、綠色低碳(Sustainable)’的RAS理念為核心,通過一系列技術創(chuàng)新與全棧解決方案,為智算中心建設提供系統(tǒng)性答案,目前已在政務、金融、能源等多個行業(yè)落地驗證,正加速推動產業(yè)高質量發(fā)展。”
智算中心四大核心痛點亟待破解
智算時代的到來,讓數(shù)據中心建設面臨著多重嚴峻挑戰(zhàn),這些痛點已成為制約產業(yè)發(fā)展的關鍵瓶頸。
安全性方面,智算中心密度持續(xù)提升,一個10MW智算中心的算力相當于傳統(tǒng)通算數(shù)據中心的100多倍,故障半徑隨之擴大,而故障響應時間卻需從2分鐘縮短至30秒甚至更短,對系統(tǒng)可靠性提出極致要求。“高密化帶來的不僅是算力提升,更是安全風險的放大,任何局部故障都可能引發(fā)系統(tǒng)性問題,這就要求我們必須構建更精細化、更具韌性的安全保障體系。”石憶強調。
快速交付成為競爭關鍵,OTT客戶普遍要求6-12個月內完成數(shù)據中心上線,而傳統(tǒng)建設模式18-24個月的周期已完全無法滿足AI業(yè)務“贏者通吃”的市場節(jié)奏。IT演進速度的加快帶來新的適配難題,芯片迭代從摩爾時代的2年1代縮短至后摩爾時代的1年1代,服務器與機柜功率持續(xù)攀升至未來600kW+,傳統(tǒng)基礎設施難以支撐3代IT設備的演進需求。“現(xiàn)在的基礎設施不僅要滿足當下的算力需求,更要具備前瞻性,能夠適配未來幾年IT設備的快速迭代,這對基礎設施的兼容性和擴展性提出了極高要求。
資源約束問題日益凸顯,據國際能源署(IEA)統(tǒng)計預測,2024年全球數(shù)據中心總耗電量達4150億度,2030年將飆升至一萬億度,能源、水資源、土地等資源的供需矛盾正嚴重制約產業(yè)發(fā)展。“數(shù)據中心作為高耗能產業(yè),若不能實現(xiàn)綠色低碳發(fā)展,必將面臨資源瓶頸的制約,這也是我們將綠色低碳作為核心發(fā)展方向的重要原因。
華為RAS理念:三維發(fā)力構建智算底座
面對行業(yè)痛點,華為創(chuàng)新提出RAS智算中心建設理念。石憶介紹:“我們從安全可靠、彈性敏捷、綠色低碳三大維度構建全生命周期的智算底座,通過技術創(chuàng)新將看似矛盾的需求轉化為同步實現(xiàn)的目標,為客戶創(chuàng)造長期價值。”
安全可靠是智算中心運行的核心基石,華為通過產品、架構、智能化管理與專業(yè)化運維的全鏈條保障實現(xiàn)系統(tǒng)性可靠。在產品層面,從設計、來料、生產到測試的每個環(huán)節(jié)都嚴格把控可靠性,華為UPS可靠性達到業(yè)界2倍,鋰電可靠性為業(yè)界4倍,下一代鋰電更是可以實現(xiàn)10倍于業(yè)界的可靠性,這是我們安全保障的基礎。架構設計上,采用分布式架構最小化故障域,推行隔離式備電方案,將鋰電拉遠部署,規(guī)避熱失控風險。“我們去年以來一直倡導隔離式備電,就是要在享受鋰電優(yōu)點的同時,規(guī)避其安全風險帶來的損害,有效防止次生災害擴大。” 智能化管理方面,華為投入海量資源優(yōu)化算法,鋰電上電即上云實現(xiàn)Pack級故障主動監(jiān)測,查全率90%,查準率80%。“我們建設數(shù)據中心服務于AI,同時也利用AI來保障安全,通過算法優(yōu)化讓故障監(jiān)測更精準、更及時。”石憶表示。專業(yè)運維通過AI核查手段,對項目交付過程進行全流程質量管控,確保部署無隱患,“所有項目交付都會有AI核查,將現(xiàn)場結果通過圖片和視頻回傳系統(tǒng),通過AI識別是否滿足質量要求,從交付環(huán)節(jié)筑牢安全防線。”
彈性敏捷通過“四化”策略破解交付與適配難題。子系統(tǒng)解耦化將IT、供配電、制冷等系統(tǒng)分離,實現(xiàn)并行施工提升建設速度;功能模塊化將供配電系統(tǒng)拆分為柴發(fā)、中壓、低壓模塊,制冷系統(tǒng)分為冷卻塔、集成冷站等模塊,支持靈活部署與彈性擴容;模塊預制化將設備安裝、集成、調試轉移至工廠完成,以標準化生產確保高質量與高效率;高密融合化打造3.2MW室外電力模塊,實現(xiàn)風液同源、風液比可調的散熱方案,適配不同類型IT設備需求。
綠色低碳從供電、制冷、系統(tǒng)協(xié)同與算電協(xié)同四個層面實現(xiàn)能效提升。供電側,華為UPS單機效率達97.5%,并機效率97.3%,S-ECO模式下系統(tǒng)效率更是高達99.1%;制冷側,推動風冷與液冷系統(tǒng)融合統(tǒng)一,通過AI進行系統(tǒng)級能效調優(yōu);系統(tǒng)層面打通L1能源基礎設施與L2算力基礎設施的信息流,實現(xiàn)負載波動下的快速調節(jié);算電協(xié)同則通過綠電直供、負荷平衡與削峰填谷,既降低數(shù)據中心碳足跡,又助力新能源消納與電網穩(wěn)定。在液冷普及的趨勢下,供電效率成為關鍵,華為通過全鏈路高效設計,讓每一度電都能產生更多算力。
技術創(chuàng)新:破解高密智算核心難題
針對高密智算帶來的核心難題,華為通過一系列技術創(chuàng)新給出解決方案。石憶介紹:“我們聚焦供電、制冷、模塊化等關鍵領域,以技術突破應對高密化、快迭代帶來的挑戰(zhàn),為智算中心提供堅實支撐。”
針對供電挑戰(zhàn),華為推出FusionPower智能供電解決方案,秉持“前置規(guī)劃、模塊預制、全鏈融合”的設計理念,以電力模塊為核心集成變壓器、UPS、饋線等部件,實現(xiàn)系統(tǒng)重構與融合。同時備電方案采用智能鋰電的“拉遠+隔離”部署,配合三層BMS與AI預測技術,保障電池全生命周期安全S-ECO模式下系統(tǒng)效率高達97.8%。在國家氣象局風云三號數(shù)據中心項目中,1.2MW超融合電力模塊節(jié)省8個柜位空間,支持1000kW負載20分鐘備電,助力數(shù)據中心PUE值低于1.3,充分驗證了方案的可靠性與高效性。
制冷領域,華為創(chuàng)新采用風液兼容散熱架構,通過熱管理控制器TMU、間接蒸發(fā)冷卻EHU,密閉通道結構設計等不同的產品組合,實現(xiàn)制冷系統(tǒng)的彈性適配。“面對高密AI算力帶來的高熱密度挑戰(zhàn),我們的間接蒸發(fā)冷卻解決方案不僅利用自然冷源大幅降低PUE,更采用模塊化設計架構,確保極致節(jié)能的同時,制冷系統(tǒng)可靠性絲毫未減。”石憶表示。在中國移動呼和浩特數(shù)據中心,EHU間接蒸發(fā)冷卻與iCooling@AI能效調優(yōu)解決方案的應用,使制冷能耗降低10%,配電面積節(jié)省40%,PUE低至1.15;華為貴安數(shù)據中心采用AHU散熱技術與AI能效調優(yōu),實際運行PUE僅1.12,每年減少碳排放81萬噸,相當于種植3567萬棵樹。
模塊化預制技術的深度應用也大幅提升了建設效率。東莞濱海灣新區(qū)數(shù)據中心采用華為智能微模塊6.0,工廠預制、現(xiàn)場安裝實現(xiàn)7天快速交付,單柜功率最高支持50kW,可混合部署智算和通算服務器;賽力斯超級工廠數(shù)據中心通過華為智能微模塊的一體化集成,7天完成部署并依托43英寸智慧大屏實現(xiàn)可視化管理,UPS5000-H保障高可靠供電。
全棧優(yōu)勢:端到端賦能產業(yè)升級
華為的核心競爭力源于其業(yè)界少有的全棧能力。石憶強調:“華為是業(yè)界極少數(shù)同時具備從底層硬件到上層云服務、從業(yè)務咨詢到產品與解決方案交付的全棧能力的廠商,這種優(yōu)勢讓我們能夠為客戶提供端到端的價值保障。”
在解決方案層面,華為自有計算產品線與基礎設施團隊在產品規(guī)劃初期便深度協(xié)同,確保供電、溫控等基礎設施與AI服務器等計算產品的完美匹配,實現(xiàn)能效與性能最優(yōu)。在AI服務器等計算產品的規(guī)劃初期,華為的基礎設施團隊就深度參與,從產品定義階段就實現(xiàn)協(xié)同,確保基礎設施與AI算力需求完美匹配。每一代新的AIDC計算產品推出前,都會在華為云上進行大規(guī)模部署驗證,將運維一線需求反向融入研發(fā),使產品具備經過實踐檢驗的可靠性與運維便利性。
在能力層面,華為具備覆蓋業(yè)務戰(zhàn)略、規(guī)劃設計、產品研發(fā)、生態(tài)合作與交付服務的全鏈條專業(yè)能力,能夠將客戶AI戰(zhàn)略精準轉化為最優(yōu)設計與產品方案。依托數(shù)十年全球大型數(shù)據中心建設經驗與對AI芯片、服務器技術趨勢的深入研究,華為已輸出21個AI數(shù)據中心標準參考設計,可為客戶提供量身定制的專項方案。“我們的專業(yè)咨詢設計團隊融合了全球建設經驗與技術趨勢研究,能夠為客戶提供定制化方案,確保每個項目在可靠性、能效和TCO上都處于行業(yè)領先水平。”石憶說道。
眾多標桿案例充分驗證了華為解決方案的領先性能。上交所金橋數(shù)據中心通過部署華為iCooling@AI能效解決方案,年均PUE降低0.25,節(jié)能比例13%,年省電累計240萬度,榮獲“2022年云計算中心科技獎卓越獎”;粵港澳大灣區(qū)博大數(shù)據前海智算中心采用華為電力模塊3.0,節(jié)省占地40%,全鏈效率提升至97.8%,一期項目即可提供40000P算力,成為區(qū)域“算力大糧倉”;
“AI時代的算力競爭,本質上是智算基礎設施的競爭。”石憶總結道,“華為以RAS理念為引領,通過技術創(chuàng)新破解行業(yè)痛點,以全棧能力提供端到端解決方案,用模塊化、智能化、綠色化的技術實踐,為智算中心建設打造安全可靠、彈性敏捷、低碳高效的‘黑土地’。未來,我們將持續(xù)迭代技術與方案,推動智算中心建設進入高質量發(fā)展的新階段,為數(shù)字經濟的蓬勃發(fā)展注入強勁動力。”
11 月 18 日,以 “釋放數(shù)據潛能,加速智能涌現(xiàn)” 為主題的 2025 中國數(shù)據與存儲峰會將在北京啟幕。屆時,我們將與行業(yè)同仁共探 AI 時代數(shù)據基礎設施演進、存儲技術創(chuàng)新與智能應用實踐,一同把握智能浪潮下的新機遇,誠邀您的蒞臨!
