大模型运行环境支持平台软件授权扩容(清采比选20252390号)采购公告

发布时间: 2025年12月05日
摘要信息
招标单位
招标编号
招标估价
招标联系人
招标代理机构
代理联系人
报名截止时间
投标截止时间
招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请 或 拨打咨询热线: 400-688-2000
相关单位:
***********公司企业信息
项目名称 项目编号 公告开始日期 公告截止日期 采购单位 付款方式 联系人 联系电话 签约时间要求 到货时间要求 预算总价 发票要求 含税要求 送货要求 安装要求 收货地址 供应商资质要求 公告说明
大模型运行环境支持平台软件授权扩容****
2025-12-05 09:54:282025-12-08 10:00:00
****到货安装、调试、验收后付款100%
签订合同后3个工作日内
¥ 185000.00
**市****

符合《政府采购法》第二十二条规定的供应商基本条件

采购清单index
采购商品 采购数量 计量单位 所属分类
大模型运行环境支持平台软件授权扩容 1
品牌 型号 预算单价 技术参数及配置要求 售后服务
GPUStack
GPUStack 0.7
¥ 185000.00
1.、配置标准版软件授权扩容包1套。 2、支持基于Linux、Windows等系统构建GPU集群,支持x86和ARM架构。 3、支持管理包括Nvidia、Huawei Ascend、摩尔线程等在内的主流GPU。 4、支持主流开源LLM模型(包括Llama, Qwen, Mixtral, InternLM2等)和Vision多模态模型的推理部署,支持昇腾Ascend 910B上Qwen2.5的推理部署。 5、支持Whisper、CosyVoice等STT/TTS语音模型和Stable Diffusion、FLUX等文生图模型的推理部署。 6、支持面向RAG应用的Embedding模型和Reranker模型的推理部署。 7、支持HuggingFace、ModelScope、Ollama Library模型仓库,支持从本地模型文件部署模型。 8、支持多种推理引擎,至少支持vLLM和llama.cpp推理引擎。 9、支持单机多卡、多机多卡的分布式推理部署,以支持大参数模型运行。 10、支持CPU和GPU混合推理和纯CPU推理,以更好地适配多种环境。 11、支持模型多副本、高可用部署及访问自动负载均衡,以满足生产环境大并发、高可用需求。 12、支持高级调度策略,支持Spread和Binpack调度策略,支持基于节点标签调度和手动指定GPU调度,以满足生产环境灵活调度需求。 13、支持OpenAI兼容的API,包括Chat Completions、Embedding等,以支持AI应用系统集成。 14、支持用户管理、访问控制及API Key管理,支持模型访问的API Key控制。 15、支持GPU**监控,包括GPU核心数量及GPU利用率、显存数量及显存利用率等。 16、支持模型及用户使用度量,包括用户Token用量、模型Token用量等。 17、提供LLM、Vision多模态、STT、TTS、文生图、Embedding、Rerank等模型的Playground试验场,支持根据对Prompts和参数的修改动态生成调用代码,支持同时对比多个模型的推理输出和推理性能。 18、以上功能需要提供**直观的UI界面操作。 19、产品支持原生Python方式部署运行和容器方式部署运行。 20、产品必须以Apache 2.0协议开源,源代码100%开源,产品功能无任何付费使用限制,需提供产品原厂开发商的授权协议。
36个月
招标进度跟踪
2025-12-05
招标公告
大模型运行环境支持平台软件授权扩容(清采比选20252390号)采购公告
当前信息
招标项目商机
暂无推荐数据
400-688-2000
欢迎来电咨询~