招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请
「注册/登录」或 拨打咨询热线:
400-688-2000
项目名称
| GPU计算卡等采购 | 项目编号
**** |
公告开始日期
| 2025-11-18 15:22:26 | 公告截止日期
2025-11-21 17:00:00 |
采购单位
| **** | 付款方式
内贸:全部货物交货并最终验收合格后,乙方向甲方提供全额的正式发票(10万元以上的国产设备乙方必须提供全额的增值税专用发票),甲方凭验收合格材料向乙方支付100%的合同款。 |
联系人
| 联系电话
|
签约时间要求
| 到货时间要求
内贸:合同签订后15个工作日内 |
预算总价
| ¥210000.00 |
发票要求
|
含税要求
|
送货要求
|
安装要求
|
收货地址
| ****旗山校区 |
供应商资质要求
| 符合《政府采购法》第二十二条规定的供应商基本条件 |
公告说明
|
采购商品 采购数量 计量单位 所属分类
| GPU计算卡 |
1 |
台 |
信息化设备零部件 |
品牌
| 五舟 |
型号
| 详见采购内容要求 |
预算单价
| ¥ 210000.00 |
技术参数及配置要求
| 一、采购内容要求: GPU显卡:品牌:五舟, 型号:NVIDIA * 80G显卡 1.▲五舟原厂原装NVIDIA * 80G显卡; 2.GPU 架构:Ampere G*,7nm 工艺,826 mm2 芯片,542 亿晶体管; 3.计算单元:6912 CUDA 核心,432 个 Tensor Core(第三代),108 个 SM; 4.频率:基础 1065 MHz,加速 1410 MHz; 5.显存:80 GB HBM2e,5120-bit 位宽,等效频率 3.2 Gbps,带宽 1.94–2.04 TB/s; 6.缓存:每SM 192 KB L1,总计 80 MB L2; 7.▲因本次采购显卡需要安装到原五舟服务器设备与原设备上*能够同时运行大模型并能进行并行运算调用CUDA指令,需原厂持证工程师上门安装(提供品牌厂家售后工程师医社保或劳动合同并加盖厂家公章); 8.▲三年原厂保修,保证设备稳定性与维保服务(提供品牌厂家的售后服务承诺函并加盖厂家公章,原件备查)。 AI管理平台:品牌:五舟, 型号:智海星图 1.▲商业版集群管理与调度软件,提供厂商正版纸质版序列号文件。 2.▲节点管理:支持查看集群中节点,包括主机名、节点类型(主控节点或计算节点)、系统IP、管理IP、CPU核数、GPU卡数、内存容量(GB)、分区、运行状态、作业列表,支持远程管理节点,支持精确或模糊搜索节点。 3.分区管理:支持查看分区名称、当前作业数、节点数、CPU核数、GPU数和描述信息;支持添加、编辑、删除分区,包括分区名称、描述、节点列表和组织限制。 4.文件管理:支持查看集群中的文件目录及其文件,执行**、复制/粘贴、压缩/解压、下载文件、删除文件、文件重命名等操作。 5.集群监控:支持查看集群内分区状态、CPU/GPU**情况,支持查看节点名称、CPU/GPU**利用率、网络、负载等性能,支持物理视图查看机器状态;支持对作业进行监控,包括对作业的ID、名称、状态、等待/运行时长、CPU/GPU数等进行监控;支持大屏展示功能,展示用户统计信息、**的使用情况,CPU、GPU、内存使用率趋势图、作业提交趋势图。 6.支持直观的集群节点图表,支持显示节点的闲忙状态,同时可以对节点进行开机、关机、命令行连接等操作 7.作业管理:支持先进先出、回填、抢占、绝对优先级、独占等多种调度策略;支持脚本和Web模板在线提交作业,支持作业容器化运行;支持对实时作业进行操作,可查看作业ID、名称、用户、运行时长、作业输出和工作目录;支持作业精确、模糊搜索,可查看周期一年的历史作业;支持增删改查作业模板,可**和查看作业模板。 8.用户管理:支持增删改查用户,支持导入用户,可选择用户权限,包括超级管理员和普通用户;可设置用户详情,包括用户权限、组织名称、优先级、最大运行作业数、最大使用核数/GPU数等;支持增删改查组织。 9.▲兼容现有市场上主要服务器厂商的主流x86、arm、海光、power等芯片架构,并且通过统信操作系统相互认证(提供相互认证证书复印件佐证)。 10.节点监控:支持按节点查看服务器CPU利用率、GPU利用率、内存、网络I/O、负载、归属**组、CPU核数在用/空闲、GPU在用/空闲和任务列表;支持按节点查看各GPU卡的型号、GPU利用率、显存利用率、温度、功率和运行在上面的任务。 11.GPU监控:支持监控集群GPU**使用情况,支持监控开发环境使用数量、训练任务使用数量和空闲数量;支持集群GPU平均利用率**均显存利用率监控; 12.存储监控:支持监控集群整体的存储的已用、剩余和总量统计情况,统计储空间的已分配和未分配统计情况,统计每个节点的存储使用和剩余统计情况,用户磁盘存储使用量和总量统计情况,并支持按照用户组查询使用情况。 13.**统计:支持从集群、**组、节点三个维度进行**的性能及使用统计情况,包括CPU利用率、GPU利用率、显存利用率、内存利用率、CPU使用核数、GPU使用卡数等信息。 14.任务统计:支持统计一段时间内集群整体的任务总量、人均任务量、任务平均时长、任务平均GPU时长等信息;支持按任务规模和任务时长进行数量统计;支持按天展示集群处理任务数量。 15.报警管理:支持计算节点监控项的报警设置和报警策略,达到报警阈值时自动报警,支持包括GPU利用率、GPU温度、GPU掉卡、CPU利用率、磁盘空间、磁盘I/O、网络I/O、节点掉线等报警项,支持故障报警/一般报警/严重报警三种报警等级设置;支持通过站内信、邮件等方式进行报警信息推送。 16.节点管理:支持节点**的动态添加或移除操作,支持通过模板进行节点的批量添加/删除操作;支持节点列表信息查看,包括节点名称、状态、型号、IP、交换机名称等物理信息,支持节点上线/下线操作,支持节点IPMI跳转。 17.缓存数据管理:支持节点上缓存数据的列表信息查看,包括目录、大小、最近使用时间、是否在用,支持管理员手动选择数据进行清理操作。 18.缓存镜像管理:支持节点上缓存镜像的列表信息查看,包括镜像名、大小、最近使用时间、是否在用,支持管理员手动选择数据进行清理操作。 19.**管理:支持节点的动态添加和删除,支持通过模板进行批量操作,支持通过日志查看添加/删除操作过程。 20.紧急任务调度:支持管理员为用户开启紧急任务权限,用户开启权限后可在任务提交时选择是否为紧急任务,紧急类任务优先级最高,如存在多个紧急任务则默认按任务提交顺序进行处理,支持管理员动态调整紧急任务序列,指定某个紧急任务进行优先调度。 21.用户组公平调度:提供基于用户组公平的调度机制,业务层创建不同的用户组,调度器会为每个用户组创建对应的调度队列,相同用户组的用户提交的训练任务会进入同一队列,调度器循环选择每一个用户组的任务进行调度。 22.数据对接:系统支持对接多种存储系统,包括NFS、beeGFS、HDFS、LusterFS。 23.基本操作:平台存储可提供实现用户通过Web方式上传数据,支持Web界面的操作编辑,支持用户目录安全隔离,可以存储自己的文件和数据,并可进行管理。 24.数据加速:支持用户在开发和训练时将样本数据预加载到计算节点,开发用户可以指定数据(个人/组内/公共)进行缓存操作,指定的数据会在训练前预加载到计算节点并自动挂载至容器环境; 25.数据集一致性检测:系统可以自动检测缓存数据集与原始数据集的差异,数据集发生变化时,系统可以自动检测并为训练任务下载最新版本的数据集信息。 26.开发环境管理:支持用户按需选择CPU、GPU、内存等**进行环境搭建(单机多卡、单机多卡、多机分布式模式),支持自动适配计算节点或人工指定计算节点。 27.支持tensorflow、mxnet、pytorch、caffe等主流AI框架,支持用户通过平台内置框架镜像或用户自定义镜像进行环境创建,支持直接使用dockerHub或NGC镜像创建开发环境; 28.支持对空载环境的超时自动回收,管理员可设置空闲时长以及超时策略(超时提醒、是否自动停止),用户可以手动重启已停止的超时环境; 29.在线开发:能够通过开发环境中Jupyter和web shell进行模型脚本的在线查看、编辑及调试训练等操作,支持通过开发环境对接第三方开发工具(如VSCode、PyCharm),满足研发人员线下开发的使用习惯。 30.GPU池化命令:支持当前用户的信息识别与权限控制;用户可以对可用**、配额;缓存数据集及预置提交作业模板信息进行查询; 31.任务管理:用户可以通过命令行工具用命令参数或配置文件提交单机和MPI任务;查询到除运行成功之外的所有任务列表;还可通过任务序号或任务名字查询任务的运行日志、详细信息以及运行任务的**监控信息;用户只能停止状态为运行的任务。 32.镜像管理:支持镜像按照全部、个人、组、公共分类图形化展示,支持智能排序和快速查找镜像;支持镜像的分享、删除和导出,导出时可实时查看导出进度。 33.可视化:支持深度学习训练中的训练相关的数据可视化查看,包括损失、准确率等一系列反应深度学习过程的指标,同时也包括了查看模型结构、参数的权值等;、支持通过tensorboard、netscope、visdom等工具实现tensorflow、caffe、pytorch等主流AI框架的模型可视化。 34.▲兼容主流深度学习框架>5 种(提供功能截图并加盖厂家公章) 35.▲覆盖数据收集、训练、部署、迭代的全流程开发(提供功能截图并加盖厂家公章) 36.▲在同一界面,对开发环境、模型训练、推理服务进行任务统计,实时对GPU、CPU、内存等指标的实时数据进行统计,反映当前服务器的**瓶颈(提供功能截图并加盖厂家公章) 37.兼容性:与采购人原超算平台集群管理软件无缝兼容,支持节点的动态扩容,扩容期间不影响业务,能够复用原集群平台服务器设备,能够与原集群管理平台一起提供作业调度功能完成作业任务,能够提供统一管理GPU和CPU集群平台需要集成并行文件系统,并支持GDS(GPU Direct)功能。 38.支持基于GPU 的open foam框架。 39.▲服务:提供3年7*24小时响应及远程支持服务,为保证设备稳定性与维保服务(提供品牌厂家售后服务承诺函)。 二、其他要求: 1、质保:原厂原装,三年质保,投标时提供产品制造商品牌厂家的售后服务承诺函,原件备查。 2、▲为实质性要求。标书代写 |
参考链接
|
售后服务
| 质量保证期:验收合格之日起算三年;服务网点:当地;维修响应时限:报修后2小时内响应;电话支持:7×24小时;备用机:48小时内无法排除故障,免费提供同档次备用机;质保期外:质保期外承担终身维修服务,维修过程只收取配件费,且以最优惠价格提供; |