开启全网商机
登录/注册
| 图形训练GPU | 项目编号**** | |
| 2025-12-24 14:05:11 | 公告截止日期2025-12-27 15:00:00 | |
| **** | 付款方式货到付款100% | |
| 联系电话 | ||
| 到货时间要求 | 签订合同后1个自然日内 | |
| ¥ 492000.00 | ||
| **市**** | ||
| 符合《政府采购法》第二十二条规定的供应商基本条件 |
||
| *显卡 | 2 | 个 |
| ¥ 246000.00 |
| * 80G PCIe GPU,原版原装全新GPU,非定制版,3年服务。 显卡参数要求:显存80G,显存带宽2039GB/s,片间互联900GB/s,Peak FP64 25.6 TFLOPS,Peak FP32 51.2 TFLOPS,Peak FP16 102.4 TFLOPS。 显卡AI套件满足以下功能: 1、支持GPU显存故障预测, 每小时预测GPU显存故障,图形显示预测率和命中率; 2、支持英伟达全系列GPU, * GPU和国产GPU(天数智芯,燧原,昆仑芯 ,海光DCU)的统一管理与监控;在同一界面上显示纳管的不同类型GPU型号,数量;在**分配的页面上,可以选择英伟达或者国产的GPU; 3、支持AI/HPC作业建模-使用内置模板建模。支持PyTorch,TensorFlow, PaddlePaddle算法框架,支持deepspeed, megatron并行框架,支持MPI,OpenMP等HPC模板;在训练环境中基于算法镜像和数据,配置CPU、内存、GPU **进行模型训练;配置任务优先级,默认正常级别、高和最高会不同程度增加作业在项目中被优先调度的权重; 4、支持作业、作业重新运行功能,以及作业输出在Web页面的实时显示,便于用户随时查看作业状态与结果; 5、支持内核态虚拟化形式;支持GPU按照显存、算力维度进行切分;粒度1%, 显存1M,提供产品截图; 6、支持配置k8s/Slurm融合调度策略,实现融合节点池生命周期管理(创建,节点的添加与释放等),支持通过业务排空策略和任务优先策略,灵活调度GPU节点到k8s集群或者是Slurm集群(支持手动和自动模式),提供产品截图; 7、支持对网络中断、服务器宕机、GPU卡丢失等异常情况的自动化检测与处理,支持作业自动重启和checkpoint自动恢复等容错机制,确保用户任务高可靠运行,并提供图形化界面显示容错机制触发信息及checkpoint状态,以及中断时的重启次数、故障时间、恢复时间、checkpoint恢复时间和异常日志等信息,提供产品截图; 8、支持SFT任务,兼容Full/LoRA微调方法,支持GRPO的微调参数并内置不少于5种不同的奖励函数,支持通过可视化界面修改奖励函数的参数和权重,同时必须提供微调任务的集成管理功能,包括性能监控、日志下载、容错断点续训保护、日志查看和SSH登录容器等,提供产品截图; 9、支持创建模型性能测试任务,测试模型的输出性能,包括测试数据集、输入输出长度、并发数测试等,支持以界面形式展示性能输出结果;同时必须支持创建模型能力测试任务,测试模型能力得分,支持设置测试数据集并输出模型得分,提供产品截图; 10、支持可定制查看推理服务性能相关监控指标,包括但不限于实时显示当前的首token延时、生成token延时、排队请求数、吞吐量、端到端响应时间、当前请求数、输入和输出token总数,以及端到端响应时间历史曲线等,帮助用户全面了解推理服务性能状况,提供产品截图; |
| 36个月 |