1、地方算力建设相关政策接连发布
在 2023 年《算力基础设施高质量发展行动计划》、《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》聚焦算力基础设施,2024 年政府工作报告提出“适度超前建设数字基础设施”的基础上,2024 年半数以上省市都出台了有关算力基础设施建设的相关规划政策。
2023.1.10 《湖南省算力支撑能力 提 升 行 动 方 案(2022—2025 年)》到 2025 年底,全省总算力从目前 3EFLOPS 达到 10EFLOPS,其中先进算力达2EFLOPS,数据中心算力达 8EFLOPS;数据中心总存储能力达 50EB;数据中心机架规模年均增速保持在 15%左右,数据中心平均利用率不低于 60%;数据中心电能利用效率指标控制在 1.5 以内,新建大型和超大型数据中心电能利用效率(PUE)控制在 1.3 以内;省内网间访问时延降低 80%以上,丢包率降低 50%以上;打造特色鲜明、泛在高效、规模适度的算力支撑体系,努力将湖南建设成为全国先进绿色算力枢纽和国际领先的算法创新中心。2022 年人工智能算力达 200 PFLOPS,2025 年达到 1500PFLOPS。
2023.12.15 《安徽省数字基础设施建设发展三年行动方案(2023-2025 年)》预期 2025 年数据中心机架规模不少于 45 万架,数据中心平均上架率不少于 65%,算力规模 14.6 EFLOPS,智能算力规模超过 12 EFLOPS。同时要求 2025 年新建大型及以上数据中心电能利用率低于 1.3。
2024.1.6 《山西省算力基础设施高质量发展实施方案》到 2025 年,全省算力规模超过 9EFLOPS,智能算力占比达到 35%,建成超过 4 个智能计算中心。存储总量超过 36EB,先进存储容量占比达到 30%以上,重点行业核心数据、重要数据灾备覆盖率达到 100%。重点应用场所光传送网(OTN)覆盖率达到 80%,算力全光调度 OXC 节点占比达到 80%,骨干网、城域网全面支持 IPv6、SRv6 等创新技术使用占比达到 40%,实现省内城市内 1ms、城市间 3ms、到京津冀枢纽节点 5ms、到其它枢纽节点 20ms 的运力网络。
2024.2.2 《贵州省算力基础设施高质量发展行动计划(2024-2025 年)》到 2025 年,计算供给均衡合理,总算力规模提升到 80 EFLOPS,超算算力与智算算力占比达到 35%。存储保障安全可靠,存储总量超过 60EB,全省先进存储容量占比达到 30%以上,重点行业的核心数据、重要数据的灾备存储覆盖率达到 100%。算力设施绿色集约,加强对存量数据中心的改造提升,推动数据中心采用高效节能冷却系统,全省新建大型以上数据中心 PUE 值低于 1.2。
2024.2.5 《青海省绿色算力基地建设方案》到 2025 年,立足西部、服务全国的青海省绿色算力基地初步建成。全省数据中心标准机架规模超过 10 万架,上架率达到 65%以上。算力总规模超过 2.06EFLOPS,其中智能算力占比超过 35%。省内数据中心间时延低于 2ms,至国家算力枢纽节点时延不高于 20ms,重点场所算力网络(OTN)通达率超过 50%,1ms 全光城市数量达到 5 个。存力总规模超过 10.7EB,先进存储容量占比达到 30%以上,数据中心核心数据灾备存储达到 100%。新建(改扩建)大型及以上数据中心 PUE 严格控制在 1.2 以下,并积极申请获得国家级绿色数据中心认证;清洁能源利用率达到 100%,实现清洁能源可追溯。
2024.3.22 《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025 年)》到 2025 年,本市智能算力规模超过 30EFlops,占比达到总算力的 50%以上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达到50%以上。本市新建智算中心国产算力芯片使用占比超过 50%,国产存储使用占比超过50%,服务具有国际影响力的通用及垂直行业大模型设计应用企业超过 10 家。本市新建智算中心 PUE 值达到 1.25 以下,存量改造智算中心 PUE 值达到 1.4 以下。智算中心内绿色能源使用占比超过 20%,液冷机柜数量占比超过 50%。
2024.3.22 《广东省算力基础设施高质量发展行动暨“粤算”行动计划(2024-2025 年)》到 2025 年,在计算力方面,算力规模达到 38EFLOPS,智能算力占比达到 50%。建成智能计算中心 10 个。在存储力方面,存储总量超过 260EB,先进存储容量占比达到 30%以上,重点行业核心数据、重要数据灾备覆盖率达到 100%。力争到 2025年底,新增国产化算力占比达到 70%。
2024.4.23 《江苏省算力基础设施发展专项规划》算力基础设施方面,到 2030 年,全省数据中心机架规模达 120 万标准机架,全省在用总算力超过 50EFLOPS,智能算力占比进一步提升,占比超过 45%,智算中心数量突破 20 个,算力算效水平显著提高;存储总量超过 500EB,进一步提升先进存储容量占比至 40%以上。到 2030 年,全国一体化算力网络长三角国家枢纽节点数据中心集群平均 PUE(电能利用效率)低于 1.25,太阳能、风能、冷能等可再生能源利用率达到 25%以上。基础软硬件和云操作系统实现自主可控,新建算力中心国产算力芯片使用占比达 70%以上、国产存储使用占比达 90%以上。
2024.4.24 《北京市算力基础设施建设实施方案(2024—2027 年)》改变智算建设“小、散”局面,集中建设一批智算单一大集群,到 2025 年,本市智算供给规模达到 45EFLOPS。到 2027 年,实现智算基础设施软硬件产品全栈自主可控,整体性能达到国内领先水平,具备 100%自主可控智算中心建设能力。本市新建和改扩建智算中心 PUE 值一般不超过 1.25,年能耗超过 3 万吨标煤的大规模先进智算中心 PUE 值一般不超过 1.15。推进本市存量数据中心升级改造,到规划期末所有存量数据中心 PUE 值均不高于 1.35。
2024.4.30 《甘肃算力基础设施高质量发展三年行动计划(2024-2026年)》到 2026 年,甘肃算力枢纽节点“东数西算”工程取得阶段性成果,一批面向全国提供算力服务的应用示范案例落地。全省算力规模超过 30EFLOPS,智能算力占比达到 50%,提升算力基础设施国产化率,力争在 2026 年国产化算力占比达到 70%以上,存储总量超过 65EB,先进存储容量占比达到 32%以上,推动人工智能算力赋能新型工业化,着力在工业领域打造 20 个可复制推广的标杆人工智能应用场景。
2024.5.23 《河北省人民政府办公厅关于进一步优化算力布局推动人工智能产业创新发展的意见》原则上平均机架设计功率不低于 8kW,PUE 不高于 1.5,上架率不低于 70%。到 2025年,算力基础设施布局进一步优化完善,智能算力供给能力显著提升,全省算力规模达到 35EFlops 以上,智能算力占比达到 35%左右,新增算力基础软硬件设施自主可控比例 60%以上。人工智能应用行业进一步拓展,在智能制造、医疗健康等优势领域孵化一批行业应用大模型,培育典型应用场景 30 个。到 2027 年,多元算力泛在融合,智能算力规模全国领先,数据要素高质量供给,大模型孵化应用走在全国前列。
2024.6.6 《山东省算力基础设施高质量发展行动方案》到 2025 年,全省数据中心在用标准机架总数达到 45 万个,存力规模达到 65EB,先进存储占比达到 35%以上。总算力达到 12.5EFLOPS,智能算力占比达到 35%。全省各类数据中心总出口带宽达到 25 万 Gbps,10G-PON 及以上端口占比达到 65%以上,枢纽间网络延迟降至毫秒级,总体水平进入全国前列,打造绿色低碳高质量发展先行区算力底座。
2024.6.29 《“算力珠峰”高质量发展行动计划(2024—2026)》到 2026 年,全区算力规模达到 100PFLOPS,智算算力占比达到 60%;存储总量超过 350PB,先进存储占比达到 40%以上;重点应用场所光传送网覆盖率达到 90%,分段路由等创新技术使用占比达到 50%;在能源、工业、教育、医疗、旅游等领域打造 5 个以上应用标杆。
2024.7.18 《天津市算力产业发展实施方案(2024—2026 年)》到 2026 年,全市算力中心国产算力芯片使用占比超过 60%,力争智能算力规模达到10EFLOPS 以上,建成 5 个以上赋能成效显著的大规模智算中心,全市超级算力应用率达到 70%以上,既有大型及以上数据中心能源利用效率(PUE)值力争降至 1.4以下,新建大型及以上数据中心 PUE 值降至 1.25 以下,算力赋能标杆应用场景超过 30 个,先进存储容量占比达到 30%以上,实现数据中心核心数据 100%容灾备份。2024.9.5 湖南 《湖南省人工智能产业发展三年行动计划(2024—2026 年)》到 2026 年将全省的人工智能产业规模突破 1000 亿元,智能算力达到 3600PFlops。
2024.11.6 《重庆市算力高质量发展三年行动计划(2024—2026 年)》到 2026 年,重庆总纳管算力规模达到 35EFLOPS,全市算力规模达到 14EFLOPS,智算规模占比达到 50%,绿色算力占比达到 60%,省际算力直连城市数达到 35 个,算力使用成本下降 50%,算力核心产业规模达到 1500 亿元,优秀行业大模型产品数达到 100 个,赋能中小微企业数字化转型 2000 家。
2024.11.14《河南省算力基础设施发展规划(2024—2026 年)》到 2026 年年底,形成布局合理、绿色低碳、高效集约、安全可靠的算力基础设施发展格局,全省算力基础设施标准机架数达到 35 万架,平均利用率达到 70%以上,算力规模超过 120EFlops,智算、超算等高性能算力占比超过 90%,形成 10 个以上算力规模达到 E 级的大型算力中心,算力中心平均利用率 70%,算力中心平均 PUE 小于 1.3,算力中心国产芯片使用占比 60%。力争到 2026 年,全省智算规模达到100EFlops 以上。
2024.11.21 《四川省算力基础设施高质量发展行动方案(2024-2027年)》到 2027 年,计算力方面,算力总规模达到 40EFLOPS,其中智能算力占比不低于60%,大规模智能计算中心达到 15 个左右,数据中心平均 PUE 降低到 1.3 以下。运载力方面,实现省内各城市之间网络时延低于 3 毫秒,天府集群到重庆集群网络时延低于 3 毫秒,到京津冀、长三角、粤港澳大湾区等枢纽节点网络时延低于 18 毫秒。5G 基站总数达 32 万个,其中 5G-A 基站总数达 4 万个。存储力方面,存储总量超过 100EB,先进存储容量占比达到 35%以上,重点行业核心数据、重要数据灾备覆盖率达到 100%。
2024.12.23 《山东省人工智能产业科技创新行动计划(2025—2027 年)》力争到 2027 年,全省算力规模达到 14EFlops(每秒百亿亿次浮点运算),智能算力占比达到 40%。
待发布《内蒙古算力枢纽节点建设方案》
通过对已经出台的省级的算力规划进行测算,我们可以看到:
(1)在总算力规划中,在不考虑目标年份因素下,河南领先其他省份,其次的贵州、上海、江苏、四川、广东、河北、甘肃都是东数西算的枢纽节点区域。
(2)智能算力规划中,在不考虑目标年份因素下,河南远远领先其他省份,其次为北京、上海为经济发达区域,再其次的贵州、四川、江苏、广东、甘肃都是东数西算的枢纽节点区域。
(3)安徽、河南都分别设立了一个 80%以上智算占比目标,重庆、甘肃、广东、四川、上海的规划中也都在积极加大智算占比,经济发达区域和部分非东数西算枢纽节点更重视该指标。
(4)3 月以后出台的省级规划中,普遍包括了较为严格的国产化比例的要求。
2、头部厂商积极展开投入规划,2025 年的算力领域投资值得期待
2024 年 12 月 5 日,美国大孟菲斯商会发表声明称,马斯克的人工智能初创公司 xAI 承诺将其超级计算机项目 Colossus 的算力扩大十倍,未来将搭载 100 万块 GPU,从而对抗谷歌、OpenAI 和 Anthropic 等竞争对手。此前,xAI 仅用 4 个月就完成了 10 万卡 Colossus 的搭建,是全球最大的超级数据中心,新的建设规划将成为 xAI 实现大模型领域追超的算力保障。
2024 年 12 月 26 日,据界面新闻等报道,小米正着手搭建自己的 GPU 万卡集群,将对AI 大模型大力投入。
DeepSeek-V2 的关键开发者罗福莉即将担任小米 AI 实验室的领导,并负责大模型团队的建设。虽然在 AI 端发力较晚,但是小米是全球第三大手机厂商,同时还拥有全球领先的消费级 IoT 平台(2024 年第三季度,小米 IoT 平台已经连接设备规模达到 8.61亿台,同比增长 23%),这意味着小米发展 AI 将具有极强的应用落地能力,有较大的后发制人的潜力。
2024 年 12 月 31 日,Information 报道,字节跳动计划在 2025 年斥资 70 亿美元购买英伟达芯片,该消息随后被字节跳动发言人否定,但仍然让市场给予了较高的投入预期。
2025 年 1 月 4 日,微软透露将在本财年(6 月结束)投资 800 多亿美元建设人工智能负载数据中心,以训练人工智能模型,并部署人工智能和基于云的应用程序。
大模型厂商算力相关投入
微软
2024.3.31:与 OpenAI 正计划建设一个名为“星际之门”的特殊数据中心,为 OpenAI 提供强大的计算支持,计划最快在 2028 年启动该项目,并且 2030 年之前会进一步扩建,所需要的电力可能高达 5 千兆瓦。“星级之门”超算会配备百万专用的服务器芯片,项目成本预计高达 1150 亿美元。
2025.1.4:将在本财年(6 月结束)投资 800 多亿美元建设人工智能负载数据中心,以训练人工智能模型,并部署人工智能和基于云的应用程序。
亚马逊
2024.10.29:亚马逊正在核能上押下重注,包括在美国三个州投资超过 520 亿美元,以帮助推动其庞大数据中心的扩张。
2024.12.16:AWS 计划追加投资约 100 亿美元,在俄亥俄州扩建数据中心基础设施。新数据中心将包含计算机服务器、数据存储驱动、网络设备和其他形式的技术基础设施,用于支持包括 AI 和机器学习在内的云计算。
谷歌
2024.12.11:谷歌与能源公司 Intersect Power 和投资公司 TPG Rise Climate 合作,计划在本十年内投资 200 亿美元在美国建设多个“工业园区”,这些园区将配备可再生能源发电设施,以支持数据中心运营。第一个园区预计将在 2026 年部分投入运营,并于 2027 年全面完工。
xAI
2024.9.3:xAI 仅用 122 天就建成了 10 万张 H100 的 Colossus 集群,未来还会扩展到 15 万张 H100 和 5 万张 H200。
2024.12.5:xAI 承诺将其超级计算机项目 Colossus 的算力扩大十倍,未来将搭载 100 万块GPU,从而对抗谷歌、OpenAI 和 Anthropic 等竞争对手。
小米
2024.12.26 :小米集团正在积极构建自己的 GPU 万卡集群,以加大对 AI 大模型的投入。
字节
2024.3.1:截止 2023 年 9 月,字节跳动已经建立超过一万张的英伟达 Ampere 架构 GPU 集群,目前正在建设 Hopper 架构的集群。
2024.12.31:Information 报道,字节跳动计划在 2025 年斥资 70 亿美元购买英伟达芯片,该消息随后被字节跳动发言人否定。
3、我国首个液冷整机柜服务器标准发布,有望 3 月推出的 GB300 将带来更大的散热考验
2024 年 10 月由信通院牵头制定,超聚变、中国移动(600941)、中国电信(601728)、中国联通(600050)、华为、中兴通讯(000063)、浪潮信息(000977)、曙光数创(872808)、新华三(紫光股份(000938)控股)、中移设计研究院、英特尔、中天宽带、宁畅、英维克、昆仑技术(超聚变子公司)、兰洋科技、云边低碳技术、中通服咨询、秦淮数据、华鲲振宇、公诚咨询、南方电网大数据服务等单位核心参编的《冷板式液冷整机柜服务器技术要求和测试方法》(标准编号 YD/T 6049-2024)正式发布,将从 2025 年2 月 1 日起实施。
该标准为首个液冷整机柜服务器领域的行业标准,规定了冷板式液冷整机柜服务器的机柜、供液组件、供配电组件、计算节点、交换节点、整机柜内组网、机柜管理模块技术方面的技术要点。作为标准制定方的相关厂商,在行业的地位和实力也得到了验证,具有先发优势。
考虑到 NVLink 72 已经在陆续部署过程中,英伟达还计划在 2025 年 3 月 17 日-20 日的GTC 大会上发布下一代 GB300 AI 服务器平台,由功率为 1400W 的 B300 组成,功率是B200 的 1.4 倍,将给系统散热带来更大的考验。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。