首页 /大模型运行环境支持平台软件授权扩容（清采比选20252390号）采购公告

大模型运行环境支持平台软件授权扩容（清采比选20252390号）采购公告

公告-招标公告

北京 -北京 -北京市

发布时间： 2025年12月05日

摘要信息

招标单位

招标编号

招标估价

招标联系人

招标代理机构

代理联系人

报名截止时间

投标截止时间

关键信息

环境平台软件授权比选

招标详情

下文中****为隐藏内容，仅对千里马会员开放，如需查看完整内容请或拨打咨询热线： 400-688-2000

相关单位：

***********公司企业信息

项目名称项目编号公告开始日期公告截止日期采购单位付款方式联系人联系电话签约时间要求到货时间要求预算总价发票要求含税要求送货要求安装要求收货地址供应商资质要求公告说明

大模型运行环境支持平台软件授权扩容	****
2025-12-05 09:54:28	2025-12-08 10:00:00
****	到货安装、调试、验收后付款100%

	签订合同后3个工作日内
￥ 185000.00




市**
符合《政府采购法》第二十二条规定的供应商基本条件

采购清单index

采购商品采购数量计量单位所属分类

大模型运行环境支持平台软件授权扩容

套

品牌型号预算单价技术参数及配置要求售后服务

GPUStack

GPUStack 0.7

￥ 185000.00

1.、配置标准版软件授权扩容包1套。 2、支持基于Linux、Windows等系统构建GPU集群，支持x86和ARM架构。 3、支持管理包括Nvidia、Huawei Ascend、摩尔线程等在内的主流GPU。 4、支持主流开源LLM模型（包括Llama, Qwen, Mixtral, InternLM2等）和Vision多模态模型的推理部署，支持昇腾Ascend 910B上Qwen2.5的推理部署。 5、支持Whisper、CosyVoice等STT/TTS语音模型和Stable Diffusion、FLUX等文生图模型的推理部署。 6、支持面向RAG应用的Embedding模型和Reranker模型的推理部署。 7、支持HuggingFace、ModelScope、Ollama Library模型仓库，支持从本地模型文件部署模型。 8、支持多种推理引擎，至少支持vLLM和llama.cpp推理引擎。 9、支持单机多卡、多机多卡的分布式推理部署，以支持大参数模型运行。 10、支持CPU和GPU混合推理和纯CPU推理，以更好地适配多种环境。 11、支持模型多副本、高可用部署及访问自动负载均衡，以满足生产环境大并发、高可用需求。 12、支持高级调度策略，支持Spread和Binpack调度策略，支持基于节点标签调度和手动指定GPU调度，以满足生产环境灵活调度需求。 13、支持OpenAI兼容的API，包括Chat Completions、Embedding等，以支持AI应用系统集成。 14、支持用户管理、访问控制及API Key管理，支持模型访问的API Key控制。 15、支持GPU**监控，包括GPU核心数量及GPU利用率、显存数量及显存利用率等。 16、支持模型及用户使用度量，包括用户Token用量、模型Token用量等。 17、提供LLM、Vision多模态、STT、TTS、文生图、Embedding、Rerank等模型的Playground试验场，支持根据对Prompts和参数的修改动态生成调用代码，支持同时对比多个模型的推理输出和推理性能。 18、以上功能需要提供**直观的UI界面操作。 19、产品支持原生Python方式部署运行和容器方式部署运行。 20、产品必须以Apache 2.0协议开源，源代码100%开源，产品功能无任何付费使用限制，需提供产品原厂开发商的授权协议。

36个月