开启全网商机
登录/注册
| GPU计算模拟平台 | 1.0/1 | 190000.0 | **三(H3C) | R4900 G5 | GPU算力: FP32计算性能≥19.5TFLOPS; FP16/BF16计算性能(Tensor Core)≥312 TFLOPS; 显存 (VRAM)≥40 GB;显存带宽≥1555 GB/s; 机架: 2U式机架;支持≥14块单宽GPU卡;处理器≥2颗第三代英特尔至强R ,内核数≥20,基础频率≥2.3GHz,内存≥256GB 3200MHz DDR4,并支持≥16根;硬盘≥2*480GB SATA SSD,≥2*1.92 TB Nvme SSD,6*8TB SATA HDD;配置1个阵列卡(带掉电保护模块),支持RAID;支持≥14个PCIE4.0插槽; 平台能力: (i)功能授权:不少于8块GPU的软件授权,RAG功能授权,不限制智能对话应用创建的个数;(ii)模型支持:大语言模型包括Qwen、deepseek、glm、Llama、Baichuan、internLM、Yi、HuatuoGPU、Mistral等,文本嵌入模型包括bge-m3、gte-Qwen2等,文本重排模型包括bge-reranker、bce-reranker等,文生图模型包括FLUS.1-schnell、Kolors-Diffusers等; (iii)模型服务:提供模型安ii装启动、实例管理、停止、卸载的生命周期管理,模型能根据GPU型号,自动匹配推理框架和启动参数;(iv)RAG功能:上传知识库文件格式支持 txt、docx、pdf、md、jpg、jpeg、png等文件,支持OCR识别和多模态模型识别文档内容,支持指定URL的网页内容采集,支持定时采集,支持基于文档目录、布局的内容识别,实现智能切片,支持向量的索引,以提升检索速度;(v)智能对话:支持创建多个智能对话应用,单个应用可关联多个知识库,支持对话上传文件,支持多轮对话,支持仅知识库回答,避免模型幻觉,支持免登录窗口、iFrame或者JavaScript方式嵌入到现有应用中,支持API方式嵌入,能提供API-Key;(vi)模型对比:支持多个模型、对话对同一个提问输出对比;(vii)用户权限:支持基于组织的用户管理;支持自定义角色,并为角色分配权限,包括菜单操作、知识库访问、应用创建等细致的权限分配粒度,支持知识库、对话应用授权给多个用户或者组织使用,可以区分只读和可编辑权限;支持LDAP等统一认证协议,支持和企业当前的鉴权系统同步;(viii)硬件兼容:支持X86、C86、ARM 架构;支持英伟达、天数智芯、华为昇腾、海光、昆仑芯等推理卡。 | 提供产品整机各部件为全新原厂原装整机出厂,需依客户名称下单,不接受翻新产品,供应商不得自行改装; 签合同后提供原厂售后服务承诺函以及≥5年原厂质保相关材料,质保期内出现设备问题提供原厂工程师上门维修服务,响应时间不得多于2个小时。 针对需求里的管理及科研软件,提供不少于3次的免费现场培训; 软件服务:提供应用软件的安装调试,包含计算**管理、数据恢复、数据迁移、集群搭建、应用加速,并提供服务说明函; 要求中标后7天内由原送货指定地址并进现场安装调试,不接受快递物流送货; 全部服务费和更换产品或配件的费由中标承担,中标如不能提供该项服务,按产品原价赔偿处理。 |