开启全网商机
登录/注册
发布时间:2026-05-13 11:48:21
| 高性能大模型训练平台 | 项目编号**** | |
| 2026-05-13 11:48:21 | 公告截止日期2026-05-16 12:00:00 | |
| **** | 付款方式货到安装、调试、验收合格后,付全款。 | |
| 发布竞价结果后7天内签订合同 | 到货时间要求发布竞价结果后7天内送达 | |
| 币种 | 人民币 | |
| **省**市**区**** | ||
| 无 | ||
| 高性能大模型训练平台 | 1.00 | 无 |
| 思腾合力/AMAX/丽科星 |
| IW4235-8GR/G448-X4/X8424-G8 |
| 1、采购高性能大模型训练平台一套,整体外观为4U机架式标准结构,提供2700W (2+2)冗余供电系统,配备LKS-GIE4.18专用散热套件;平台支持基于双因子认证的动态口令(OTP)远程登录,支持二次硬件指纹加密认证;处理器:配置≥2颗IntelR最新处理器,64核心,主频2.1GHz主频; 配置内存容量≥ 256GB三星全新DDR5 RECC内存(料号为:M321R4GA3BB6-CQKET八条);配置系统盘≥全新Intel S4520 960GB企业级SSD。配备一种**度服务器的高效散热装置(专利号:ZL 2022 2 ****996.0)。10-PCI-E 5.0×16。配置≥4个1GB网络接口,支持双端口200G网卡MCX755106AAS-HEAT,支持RDMA特性,支持AIOM/OC3.0P扩展,提供高带宽低延迟的数据转发特性,同时满足AI和HPC场景下的复杂数据交换; 2、高性能大模型训练平台配置3块高性能GPU训练卡。单块高性能GPU训练卡参数为:图形处理单元G* (Ampere);显卡互联参数:GPU-GPU互联带宽600GB/秒(NVLink 3.0 2-way);CUDA单元数:6912,Tensor核数:432,基本频率:1370MHz,超频频率:1410MHz,显存频率:2.4GHz(HBM2);显存位宽:5120-bit,显存带宽:1935GB/sec,GPU显存:80GB HBM2e;计算性能:FP16(non-Tensor)70 TFLOPS,FP32(non-Tensor)19.5 TFLOPS,FP64(non-Tensor)9.7 TFLOPS,FP64 Tensor 19.5 TFLOPS,INT8 624 TOPS;显卡采用7nm工艺、542亿晶体管,PCIe4.0双槽位被动散热设计,TDP/功耗300W。(原厂原装全新PCIE卡,不接受SXM改装卡及二手和翻新卡); 3、高性能大模型训练平台服务器管理软件:安装环境:管理节点至少支持裸机安装、虚拟机两种方案、其中裸机与虚拟机安装提供定制操作系统ISO镜像,ISO系统镜像安装过程中自动部署管理节点服务,提供系统快速安装手册。底层架构:集群软件底层必须采用自主研发的调度系统,不能使用k8s或基于k8s等开源调度系统二次开发的软件。**虚拟化:采用轻量级容器虚拟化技术,实现对CPU、内存、磁盘等**的虚拟化和统一管理。针对人工智能领域的特定需求,提供GPU等异构计算**管理接口,实现对GPU等异构计算**的虚拟化统一管理,支持为容器以直通方式挂载GPU等异构计算**。容器管理:支持快速创建多种深度学习开发调试环境的容器,支持web Terminal 访问容器(无需安装ssh服务),支持将创建的容器在线进行镜像打包,并支持将打包好的镜像上传镜像仓库,实现镜像版本的持续更新。任务重启:支持任务重启功能,任务重启过程中,任务中的所有数据不丢失,容器ID保持不变。SSH公钥:支持用户配置SSH公钥,任务重启或者重新创建后都可以使用SSH公钥进行免密登录。重置系统/更换镜像:对任务环境或者系统盘进行更换,更换完毕后,缓存盘与数据盘中的数据不丢失。便携工具箱:支持Web Terminal,Jupyter,CodeServer,Tensorboard,Desktop,网盘存储等功能。显存切分:支持对CUDA架构GPU运算卡显存切分,显存切分最小颗粒度1MB。训练配额:支持添加AI训练设备,并通过BMC控制设备关机、重启等操作。**监控:自研底层监控服务,分钟级监控主机、容器**使用率,支持监控运算卡使用率、显存使用率、温度、功率。运算卡配置:支持对运算卡进行配置,包含独享、切分配置以及故障隔离等操作。用户管理:支持主用户与子用户功能,子用户只需要专注于业务,****小组内部使用。登录方式:支持微信扫码登录,短信登录,账号密码登录等多种登录方式。登录安全:在登录过程中遇到登录失败等问题时,及时弹出验证码,降低暴力破解的风险,同时管理员可以在后台配置登录失败次数以及锁定时间。实名/学生/企业认证:支持普通用户进行实名认证、学生认证、企业认证,提交信息后由后台管理员进行审核。微信通知:支持将任务状态变化情况及时通过微信公众号推送给用户。“后台式”文件上传:web页面上传大文件优化、提高用户上传大文件时的效率和稳定性,上传过程后台化,上传过程中用户可以操作其他功能,而不会因上传过程中占用太多系统**而影响使用体验。缓存盘:支持在本地计算节点为每个任务提供有配额限制的存储**,用户可扩容,减少因远端存储故障或性能问题导致用户训练效率差,并支持对关机超过限制时间的任务缓存盘进行清空操作,限制时间后台管理人员可配置。存储管理:支持通过WEB界面对存储的统一管理,在WEB界面可以对分布式存储进行挂载、**划分,可新增、删除所划分的存储卷,并支持对存储卷名称、容量、所有者权限进行设置。存储设备管理:支持添加NFS、GlusterFS、Ceph、Lustre、GPFS、Minio等以上全部存储,同时可以配置存储绑定的计算节点设备。存储挂载:任务中支持存储挂载功能,初始化新存储后,任务重启即可正常挂载,无需重新创建任务。镜像管理:系统镜像、可以根据需求,调整用户镜像数量,从而节省镜像仓库容量。镜像上传:支持用户push、pull自定义镜像,推送过程中增加权限校验,用户名与密码与整体平台用户一致。镜像共享:支持用户共享仓库、镜像给其他人,并允许配置访问权限(管理、编辑、只读)。 |
| 1、投标时请标明产品的品牌及型号,并提供原厂项目授权及三年期售后服务承诺函。 2、产品具备CCC认证,设备原厂具备GB/T19001-2016/ISO9001:2015质量体系认证,GB/T24001-2016/ISO14001:2015环境体系认证; 3、提供原厂出具的高性能大模型训练平台服务器管理软件软著证书及高性能大模型训练平台系统测试报告,以附件形式上传; 4、中标当日原厂技术人员免费送货上门安装部署联调,为保证服务及时有效,要求**本地供货商。 |