开启全网商机
登录/注册
| | 1 | L20 GPU服务器 | 其他服务/其他未分类服务/其他未分类服务 | CPU Intel Xeon 6330(28核,205W,2.0GHz)4U Processor Option Kit × 2 GPU NVIDIA L20 48GB显存 × 8块 内存 32GB DDR4 × 16条(总容量512GB) 存储 固态硬盘 3.84TB容量 网络 10Gbps速率网络接口卡 × 2 形态 4U机架式服务器,支持主流AI推理框架及CUDA生态 | 1年 | ****公司网络需求 | - | |
| | 2 | L20 GPU服务器 | 其他服务/其他未分类服务/其他未分类服务 | CPU Intel Xeon 6330(28核,205W,2.0GHz)4U Processor Option Kit × 2 GPU NVIDIA L20 48GB显存 × 8块 内存 32GB DDR4 × 16条(总容量512GB) 存储 固态硬盘 3.84TB容量 网络 10Gbps速率网络接口卡 × 2 形态 4U机架式服务器,支持主流AI推理框架及CUDA生态 | 1年 | ****公司要求 | - | |
| | 3 | * GPU服务器 | 其他服务/其他未分类服务/其他未分类服务 | CPU Intel Xeon Gold 5138Y × 2 GPU Quadro RTX * 48GB GDDR6 × 8块 内存 32GB × 16条(总容量512GB) 存储 固态硬盘 3.84TB容量 网络 10Gbps速率网络接口卡 × 2 形态 支持专业图形计算与AI推理双场景 | 1年 | ****公司要求 | - | |
| | 4 | 集群与网络要求 | 其他服务/其他未分类服务/其他未分类服务 | 1. 集群与网络要求 (1)3台服****数据中心或低延迟网络区域内,节点间通信延迟不高于1毫秒,支持RDMA或同等高速互联技术,满足分布式推理需求。 (2)每台服务器需配置双10Gbps网口,实现网络链路冗余,单链路故障不影响业务访问。 (3****公司现有网络、存储及安全设备兼容,支持标准虚拟化或容器化部署,便于模型迁移与**调度。 3. 软件与兼容性要求 (1)预装或支持安装主流Linux操作系统及CUDA驱动,兼容TensorFlow、PyTorch、ONNX Runtime等推理框架。 (2)支持Kubernetes或Docker容器化部署环境,便于公司现有模型服务的快速迁移与弹性伸缩。 (3)提供GPU虚拟化或分区能力,可根据业务需求灵活分配算力**。 2.服务要求 服务商必须提供365天×24小时的全天候算力保障服务,包括但不限于: (1)基础设施运维:机房环境、电力、制冷、网络及服务器硬件的7×24小时监控与维护。 (2)故障响应与处置:提供分级故障响应机制,重大故障现场响应时间不超过2小时,一般故障不超过4小时;硬件故障时提供应急备件更换服务,确保业务不中断。 (3)巡检与预防性维护:每月至少一次现场巡检,涵盖硬件状态、温度、风扇、电源、网络连通性及GPU运行状态检查,并提交巡检报告。 (4)技术支持:配备专业GPU技术支持团队,协助完成模型部署环境搭建、性能调优及故障排查。 (5)服务水平协议(SLA):算力可用性不低于99.9%。 | 1年 | ****公司要求 | - |