开启全网商机
登录/注册
| 大模型运行环境支持平台软件授权扩容 | 项目编号**** | |
| 2025-12-05 09:54:28 | 公告截止日期2025-12-08 10:00:00 | |
| **** | 付款方式到货安装、调试、验收后付款100% | |
| 联系电话 | ||
| 到货时间要求 | 签订合同后3个工作日内 | |
| ¥ 185000.00 | ||
| **市**** | ||
| 符合《政府采购法》第二十二条规定的供应商基本条件 |
||
| 大模型运行环境支持平台软件授权扩容 | 1 | 套 |
| GPUStack |
| GPUStack 0.7 |
| ¥ 185000.00 |
| 1.、配置标准版软件授权扩容包1套。 2、支持基于Linux、Windows等系统构建GPU集群,支持x86和ARM架构。 3、支持管理包括Nvidia、Huawei Ascend、摩尔线程等在内的主流GPU。 4、支持主流开源LLM模型(包括Llama, Qwen, Mixtral, InternLM2等)和Vision多模态模型的推理部署,支持昇腾Ascend 910B上Qwen2.5的推理部署。 5、支持Whisper、CosyVoice等STT/TTS语音模型和Stable Diffusion、FLUX等文生图模型的推理部署。 6、支持面向RAG应用的Embedding模型和Reranker模型的推理部署。 7、支持HuggingFace、ModelScope、Ollama Library模型仓库,支持从本地模型文件部署模型。 8、支持多种推理引擎,至少支持vLLM和llama.cpp推理引擎。 9、支持单机多卡、多机多卡的分布式推理部署,以支持大参数模型运行。 10、支持CPU和GPU混合推理和纯CPU推理,以更好地适配多种环境。 11、支持模型多副本、高可用部署及访问自动负载均衡,以满足生产环境大并发、高可用需求。 12、支持高级调度策略,支持Spread和Binpack调度策略,支持基于节点标签调度和手动指定GPU调度,以满足生产环境灵活调度需求。 13、支持OpenAI兼容的API,包括Chat Completions、Embedding等,以支持AI应用系统集成。 14、支持用户管理、访问控制及API Key管理,支持模型访问的API Key控制。 15、支持GPU**监控,包括GPU核心数量及GPU利用率、显存数量及显存利用率等。 16、支持模型及用户使用度量,包括用户Token用量、模型Token用量等。 17、提供LLM、Vision多模态、STT、TTS、文生图、Embedding、Rerank等模型的Playground试验场,支持根据对Prompts和参数的修改动态生成调用代码,支持同时对比多个模型的推理输出和推理性能。 18、以上功能需要提供**直观的UI界面操作。 19、产品支持原生Python方式部署运行和容器方式部署运行。 20、产品必须以Apache 2.0协议开源,源代码100%开源,产品功能无任何付费使用限制,需提供产品原厂开发商的授权协议。 |
| 36个月 |