点击
(注:本文内容、数据均来自权威渠道,非AI生成)一、项目核心信息
项目名称:**大装置算力服务支撑平台采购项目
中标单位:****
预算金额:1.555亿元
中标金额:1.5546亿元
附件二、项目建设内容:构建三位一体的算力服务支撑体系
本项目作为**大装置的核心组成部分,旨在搭建基础**管理和服务底座,实现大装置对外开放共享能力,衔接试验平台到应用赋能的关键环节。项目总预算1.555亿元,中标金额1.5546亿元,建设内容涵盖三大核心模块,均明确要求拒绝进口,全面采用国产化解决方案。
(一)智能算力开放服务系统软硬件及服务支持(预算9500万元)
该模块是算力服务的核心载体,聚焦AI算力的池化管理与高效调度,构建从**纳管到应用开发的全流程支撑能力:
1.整体系统性能要求:需协同**大装置达成万卡分布式训练算力利用率≥40%,千亿级自然语言大模型训练能效比≥210GFLOPS/W、日Token吞吐量≥1000亿tokens,同时满足全局存储子系统聚合读/写带宽≥10TB/s、并发IOPS≥10亿的高性能指标,且整体符合等保三级及商用密码检测认证要求。
2.**管理模块:支持纳管不少于5001个AI物理算力节点,提供计算/存储/网络虚拟化、多级租户(≥4级)、统一鉴权认证等核心能力。具备精细化权限管控、**计量计费、API接口开放等功能,支持10级以上逐级审批流程,可实现**使用可视化监控与瓶颈分析。
3.AI训推模块:支持纳管AI总算力≥16000PFLOPS@FP16,具备公共**池与专属**池双模式部署能力,实现租户容器粒度的网络隔离。算力调度支持整机规模作业运行、AI作业亲和性调度,适配PyTorch FSDP、Megatron等主流训练框架,可调度训练、推理、Notebook等≥3类作业类型。断点续训能力突出,不重新调度节点时千卡级千亿模型重启时间≤5分钟,重新调度节点时总重启时间≤30分钟,支持万卡规模下万亿级模型训练。
4.开发与运维支撑:提供Jupyter、VSCode等在线IDE及Shell终端,支持SSH远程开发;通过可视化工具实时监控模型训练指标与分布式任务效能,精准定位性能瓶颈;具备故障节点自动隔离、作业自动重启等自愈能力,训练日志支持实时查看、历史追溯与永久存储。
5.配套硬件要求:通用服务器采用国产ARM架构处理器,总核数≥13984核,单颗处理器主频≥2.6GHz;配套交换机总交换容量≥168.56Tbps,实配GE/10GE光模块≥305个、25GE光模块≥856个、100GE光模块≥133个,CPU与交换芯片均要求厂商自研并提供CMA+CNAS认证检测报告。
(二)信息安全与运维软硬件及服务支持(预算1100万元)
构建立体化安全防护与智能化运维体系,保障算力平**全稳定运行:
1.运维支持模块:采用高可用部署模式,提供统一鉴权认证与数据初始化配置服务。监控大屏涵盖**总览、算力使用、告警统计等核心指标,支持物理机、网络设备、存储服务器等全栈监控,告警信息存储≥6个月,可实现事件、问题、变更等流程的自定义与自动化流转。智算运维支持训练任务全生命周期监控、慢节点/慢网络自动化诊断,以及多租户隔离策略下发。
2.平**全模块:部署WEB防火墙、安全管理器、堡垒机、日志审计、漏洞扫描等全套安全设备,均采用国产ARM架构处理器。其中,态势感知系统配置11台服务器,支持AI检测算法(含WebShell、DNS Tunnel等),可联动防火墙/交换机实现威胁自动阻断;核心及出口防火墙吞吐量≥400Gbps,预定义IPS签名≥20000条,支持SM2/SM3/SM4国密算法;主机病毒防护病毒检出率≥99%,误报率≤0.1%。
3.租户安全产品模块:支持下一代防火墙、IPS、WAF等安全组件的统一管理与灵活部署,提供3G吞吐授权的安全防护能力,支持安全组件迁移与第三方集成,可实现Web应用攻击防护、数据库审计、运维操作审计等细粒度安全管控。
4.商密建设产品模块:包含服务器密码机、智能密码钥匙(≥200个)、数字证书(≥200张)、国密浏览器(≥200套)等产品,均需提供《商用密码产品认证证书》,支持SM系列国密算法,满足数据加密、数字签名、身份认证等安全需求。
(三)温冷数据备份存储设备及配套(预算4950万元)
作为项目核心产品,该模块聚焦大规模数据的安全备份与高效存储:
1.存储设备核心要求:配置HDD硬盘裸容量≥110PB,单台设备CPU≥2颗(每颗≥48核、主频≥2.6GHz)、内存≥512GB,配备≥4块3.2TB NVMe SSD缓存盘(不占用主存空间)。存储系统采用全对称分布式架构,无独立元数据节点,支持横向扩展;每U空间可放置≥24块3.5寸HDD主存盘,单台设备主存盘支持≥120槽位,需适配**大装置11个液冷门存储机柜(15KW功率、47U规格),无需新增机柜。
2.兼容性要求:支持与**大装置“大容量层存储设备”共集群,对接全局存储子系统RoCE组网,保障数据存储与访问的兼容性和高效性。
3.配套硬件:提供≥8台负载均衡服务器,采用国产ARM架构处理器(≥2颗、每颗≥48核),内存≥512GB;配套交换机总交换容量≥350Tbps,实配100GE光模块≥1448个、400GE光模块≥47个,CPU与交换芯片要求厂商自研并提供CMA+CNAS认证检测报告。
三、关键洞察(Key Insights)
1.国产化替代成硬性要求,信创底座构建核心竞争力
项目三大模块均明确标注“拒绝进口”,从处理器(国产ARM架构)、芯片(厂商自研)到操作系统、数据库均要求国产化部署,形成全栈自主可控的技术体系。这一要求不仅响应了国家信创战略,也对供应商的国产化技术整合能力提出了极**求,中国移动凭借深厚的国产化解决方案积累成功中标。
2.AI算力规模化调度与高效运维成核心考核指标
项目以万卡级AI训练为核心场景,围绕算力利用率、训练能效比、断点续训速度等关键指标设置严格要求,同时强调自动化运维、故障自愈与安全防护能力。这反映出当前算力基础设施建设已从“规模扩张”向“效率提升”转型,对AI训推调度、分布式存储、安全运营的一体化解决方案需求迫切。
3.多维度政策叠加,凸显国家级算力基础设施建设特点
项目同时享受中小企业扶持政策与本国产品支持政策,若供应商为小微企业且提供本国产品,可享受最高30%的价格扣除优惠。作为国家级关键基础设施,项目要求通过等保三级测评与商用密码认证,履约保证金达合同金额的10%,交付期严格限定在2026年5月30日前,凸显了项目的战略重要性与执行刚性。
4.商业模式清晰,运维服务贯穿全生命周期
项目采用“40%预付款+30%初验款+30%终验款”的付款模式,要求中标方提供至少3年免费质保,保修期内工作日需配备≥3名驻场工程师(网络产品≥1人、平台≥2人)。售后服务响应机制明确:电话响应≤1小时,现场支持≤24小时,硬件故障备品到场≤24小时,同时需提供至少3次现场技术培训(8小时/次),确保采购人具备独立运维能力。
5.技术门槛高,综合实力决定中标结果
要****中心、软件开发、信息安全类项目业绩,以及关键信息基础设施安全保护、大数据安全管理体系等认证证书,综合实力成为中标关键。
本项目的落地将显著提升**大装置的算力服务能力与对外开放水平,为国家级大科学装置的算力共享与应用创新提供坚实支撑,也为国产化算力基础设施的规模化建设提供了可借鉴的实践范式。中国移动的中标,进一步巩固了其在政企信息化领域,尤其是算力基础设施建设中的领先地位。
“数说123之**”是******公司旗下自媒体矩阵“数说123”子账号,依托数据、情报、自媒体、**为省、市、县三级数政局、运营商、****公司、****公司提供招投标数据定制、商机捕获、市场洞察、行业对标、生态与渠道建设、解决方案提供、自媒体宣传与账号运营等专业服务。 附件长按扫码关注
**请联系:186****7258
点个「在看」 你最好看