
开云体育(中国)官方网站
前不久,华为发布的《智能宇宙 2035》和《巨匠数智化指数 2025》求教中指出,跟着大模子的发展,AI 智能体将从引申用具演进为决策伙伴,驱动产业翻新。到 2035 年,全社会的算力总量将增长 10 万倍,算力增长的背后,是对新一代算力基础设施产业发展的挑战,但在这经由中,通常也伴跟着不小的机遇。
AI 需求暴增,数据中心建筑面对挑战
算力需求的激增照旧不单是是停留在测度层面,把柄国度数据局表现的信息表示,2024 岁首中国日均 Token 消费量为 1000 亿,到 2024 年底已增长至 3000 亿量级。而这个数字到了本年 6 月则是达到惊东谈主的 30 万亿的量级,与 2024 岁首的 1000 亿比较,增长 300 多倍。
此外,IDC 求教表示,2024 年全年中国公有云大模子调用量为 114 万亿 Tokens,而 2025 年上半年即飙升至 536.7 万亿,响应出 AI 期骗参预范围化爆发阶段。
而 AI 期骗的爆发,当然也带动智能算力需求的激增,在这背后,是对底层算力基础设施带来的熟练,而 AI 也正以"算力同一者"的姿态重构数字基础设施形式,巨匠 20 亿活跃 AI 用户产生的海量数据处理需求,使得 AIDC 从"扶植设施"升级为"中枢坐褥力"。
在 AI 期间,传统的数据中心建筑显然照旧弗成夸口现时智算关于底层设施的需求,华为发布的《智能宇宙 2035》和《巨匠数智化指数 2025》求教中明确,运筹帷幄领域将碎裂传统冯•诺依曼架构的经管,在运筹帷幄架构、材料器件、工程工艺、运筹帷幄范式四大中枢层面达成颠覆性创新,最终催生新式运筹帷幄的全面兴起。
在华为中国数字动力数据中心动力拓展部部长石忆看来,算力增长的同期,也对基础设施形成了极大的冲击,"现时,智算中心建筑主要面对安全、弹性、高功率、高能耗等挑战。除此以外,当作遥远运营的重财富形式,数据中心建筑还需要舍弃超前。"
安全方面,AI 大模子老师对算力衔接性的要求较传统通算进步两个量级:10MW 智算中心的算力密度相当于 100 个传统通算中心,一朝发生供电中断,每秒钟将形成数十万元的算力失掉。对此,石忆暗意,"传统数据中心故障响适时分要求 2 分钟以内,但智算中心需压缩至 30 秒,且故障影响半径扩大 3 倍,任何单点故障王人可能激发集群瘫痪。"
安全事件在带来数据、奇迹器等径直失掉以外,更可能导致数月模子老师后果付诸东流。同期,安全事件的发生还会对 IDC 奇迹商的品牌价值,以及客户对其信任度带来不小的冲击。
更严峻的是,传统聚会式架构存在单点故障风险,而 AI 运筹帷幄的衔接性要求,使得这种风险被放大 10 倍以上。AIDC 的安全已不是"概率问题",而是"底线问题",任何一次故障王人可能解除企业的 AI 竞争资历。
除了安全问题以外,跟着 ChatGPT 的问世,东谈主们运转发现机柜的功率越来越高,原来 300W 的单颗 CPU,照旧不及以相沿业务,500W 的单颗 CPU 芯片成为主流。与此同期,AI 关于 GPU 的需求,也让单机柜的功率进一步进步。2.5kW 尺度机柜照旧是已往式,8kW、10kW,致使 20、50kW 的机柜的不断出现,也让单机柜功率越来越高。与此同期,跟着摩尔定律逐渐失效,在后摩尔定律期间下,芯片算力与其功耗仍将大幅进步。机柜功率的不断攀升,也对数据中心的供配电系统提议了新的挑战。
这个挑战一方面是来自供配电知晓性和衔接性的保险;另一方面,更容易被东谈主们所淡薄的是:传统数据中心"白空间"(奇迹器区)与"黑空间"(配电区)的比例大概为 2:1,而在 AIDC 期间,这个比例将被透顶逆转,部分高密 AIDC 致使出现 1:3 的极点情况,这意味着 3/4 的时势被配电、散热开发占据。而关于 IDC 客户而言,"白空间"是用来创造价值的,"黑空间"则属于纯老本支拨,得到更多的"白空间"才能得到更大的收益。
与此同期,在 AI 期间,用户关于数据中心请托周期的要求也越来越高。而当作算力的底层相沿,数据中心的建筑周期之长,是业内的共鸣。
而 AI 等 IT 时间的演进日眉月异,数据中心理柜密度也随之速即进步,"传统建筑方式,筹商阶段筹商的单柜功率宽阔在 5-10kW/ 尺度柜,而现在单台支合手大模子的 AI 奇迹器功耗就已达 10kW 以上,数据中心的筹商建筑速率难以夸口各行业对算力合手续高速增长的要紧需求。"此外,还有一个机敏的矛盾摆在眼前:奇迹器的更新周期是 3 到 5 年,而数据中心基础设施的联想寿命是 10 至 15 年。对此,石忆告诉笔者,传统数据中心 18 到 24 个月的建筑周期,与算力"一年一迭代"的速率形成致命错配。客户请托周期要求从‘年’,压缩至‘月’,致使出现‘ 6 个月必须上线’的硬性目的,这种情况对数据中心的建筑速率提议了更高的要求。
而在这些挑战的背后,还有一个阻碍淡薄的问题—— AI 期间带来的传统异步运筹帷幄向同步运筹帷幄的转型。这个经由使得供电、制冷、汇聚的协同要求达到"微秒级",而现存基础设施的"烟囱式"架构根柢无法达成这种协同。更严峻的是,时间迭代带来的尺度广大问题——不同厂商的 GPU、液冷开发接口不斡旋,导致 AIDC 建筑堕入"定制化陷坑",进一步拉长周期、推高老本。
安全是 AIDC 的首要条目
面对挑战,华为数字动力在 2025 全连络大会上提议的 RAS 理念(Reliable 安全可靠、Agile 弹性敏捷、Sustainable 绿色低碳),而华为也恰是沿着这三条旅途上前鼓吹 AIDC 建筑的。
而 RAS 理念中,最为首要的即是" R "——安全。AIDC 的安全底线不仅关乎开发存续,更决定算力奇迹的衔接性。"安全是 1,莫得安全,一切王人是 0。"
IDC 的安全可靠不仅是某个设施的安全可靠,更是要构建涵盖数据中心全生命周期的督察体系。不同于传统数据中心的单点督察想维,华为构建了袒护家具、架构、管理、运维的四层督察体系,达成从器件到系统的全生命周期可靠。
数据中快慰全体系化,率先要作念的即是将原有的聚会式的架构滚动为散布式架构。扬弃聚会式联想,确保单一故障点不会激发系统性崩溃。举例,制冷系统需要达成风冷或液冷单位互相攻击,按需部署,一台故障时其他单位能迅速补上冷量。
其次是主动安全,极端是在高风险设施如锂电板储能上。智算期间,通过锂电板取代原有占大地积大、生命周期短的铅酸电板,照旧成为数据中心斥责后续运营老本,进步数据中心"白空间"面积的首要举措之一。
当作国内较早探索锂电板期骗的企业之一,华为在数据中心锂电板安全方面提议了"既要快速响应,也要先见风险"的策略。石忆告诉笔者,锂电板出现安全风险之时达成快速处置,幸免失掉只是是基础操作,更为首要的是,在故障发生前就能精确定位并更换有风险的电板,如斯才能将风险降到最低。现在,华为对锂电板告警的袒护率达到了 92%,报警的准确率是 97%,并且这个告警最高不错提前七天。
弹性需求怎样夸口?
"行百里者半九十",当安全基础"打牢"之后,怎样夸口用户在智算期间的需求,成为奇迹商能否得到更多份额的关键。"智算期间独一不变的即是变化,弹性是搪塞变化的独一选择"——这句话照旧成为行业内公认的事实,也指出了现时很无数据中心"建成即逾期"的痛点。
面对此,华为给出了"解耦化、模块化、预制化、高密和会"的"四化"措置决策。通过此,让 AIDC 建筑速率与 IT 时间迭代达成同频共振,相较于传统决策,将数据中心的请托周期裁减 60% 以上。
这个经由中,最为首要的一步是——达成子系统的解耦。传统数据中心,基础设施层与奇迹器的供配电、供冷系统是紧耦合的景况,一朝一方发生变化,无异于将数据中心"推倒重建"。即便在通算期间,一代奇迹器的"寿命"平均在 5 年傍边,而数据中心基础设施层的"寿命"则应在 10~15 年傍边。这也就意味着,一个数据中心需要兼容三代奇迹器的更替。
而其时分来到智算期间,奇迹器更替速率只会比通算期间快,紧耦合的景况,关于需求敏捷的客户来说,少许也不敏捷。是以,在石忆看来,数据中心达成弹性的第一步即是达成解耦。"华为将 AIDC 拆分为 IT、供配电、制冷三大寂然子系统,达成串行施工向并行施工的滚动。"石忆先容谈。
在华为云(芜湖)数据中心形式中,基础设施与奇迹器的解耦联想,使得机电安设仅用 71 天完成,较传统决策从简 50% 时分,举座形式耗时 3 个月。不仅于此,石忆暗意,这种联想还支合手"按需扩容","客户可先部署基础框架,待详情奇迹器功率后再上配电单位。"石忆进一步指出。
当系统王人达成解耦之后,就不错进一步通过模块化的方式,在工场预坐褥后,进行现场拼装即可完成数据中心建筑。
互联网"快"的本性也在新一轮东谈主工智能的波澜下得以不绝,用户关于数据中心请托周期的要求也越来越高。模块化似乎照旧逐渐成为连年来数据中心建筑的主流方式,石忆告诉笔者,模块化不是绝顶,还要将模块预制化,减少现场施工工程量,将现场的开发安设、集成、调试提前到工场来完成,达成工程家具化。其最大的价值即是用工场的尺度化、高质地坐褥和测试,确保了高效劳以及高质地,把现场的工程变得最小化,极大减少现场安设,助力 AIDC 快速高质地建筑。
通过模块化方式,还能达成硬件开发的即插即用——通过预留通用接口的方式,让后续非论是制冷系统,照旧奇迹器的更换王人不错"傻瓜式"即插即用,进一步进步了部署速率。
不仅于此,模块化的方式,还能大幅斥责数据中心在建筑经由中的碳排放,达周到生命周期内的降碳,这点也恰巧呼应了 RAS 理念中——绿色低碳。
绿色低碳从"职守"变成"生计需求"
在"双碳"标的与动力危境的双重驱动下,绿色低碳已从社会职守升级为 AIDC 的生计需求。传统模式下,IDC 奇迹商与客户王人存在"降狡黠耗总量"的误区。接洽词,跟着机柜功率不断攀升,斥责总能耗照旧是一条"不可行之路",面对此,华为提议了"进步系统效劳"的中枢想路,通过高效供电、高效制冷、系统高效、算电协同等四正路线,达周到链路降碳。
高效供电方面,通逾期间创新斥责损耗。举例,华为 UPS 在 S-ECO 模式下效劳高达 99.1%。
高效制冷方面,跟着智算期间液冷的普及,制冷能耗得到进一步斥责,但风冷系统仍将链接存在,风冷和液冷系统走向和会化,冷源斡旋化,通过 AI 妙技对制冷系统作念系统级能效调优,进一步斥责制冷能耗,进步制冷效劳。
系统协同方面,通过系统协同,达成动力与算力的智能匹配。"买通 L1 动力基础设施与 L2 算力基础设施的信息流,通过 AI 算法把柄负载波动转换开发景况,让每瓦电力王人能承载更多算力。"石忆强调。
算电协同方面,绿电直供,就近消纳是现在数据中心绿色低碳化的不可或缺的一步,而从国度筹商的八个算力重要节点布局上就不丢丑放洋家在绿电直供,就近消纳的布局。八个节点除了北上广这么的一线算力需求高度聚会的城市以外,其余节点果真王人处于盛产绿电的方位。
在面对行业存在"安全与低碳不可兼得"的误区——以为冗余联想会增多能耗,节能方法会殉国安全,石忆暗意,高安全与高能效不错协同达成,关键在于系统级的优化联想。
举座来看,数据中心正在向超高功率、超高密度和超大范围发展,智算中心的建筑不仅是搪塞现时挑战的求实选择,更是赢得未来 AI 竞争的计谋布局。同期数据中心的联想想路也在变化,从"大系统"向"尺度化 + 模块化散布式架构"演变,更弹性搪塞未来需求的省略情趣,此外还要从软硬件层面磋商汇聚安全、供应安全和备电安全等问题。
不错说,AI 算力的急流既带来了"最佳的期间"的机遇,也激发了"最惊骇的期间"的挑战。在这场 AIDC 变革中,惟有以全栈专科才气与告诫千里淀为底色,才能达成智能进化、再造不凡开云体育(中国)官方网站,而华为正在这条路上挺进。(文|Leo 张 ToB 杂谈,作家|张申宇,裁剪丨盖虹达)