科技文献语料数据处理系统辅助研发与技术服务(ZJLAB-FS-BX20260026)采购公告

发布时间: 2026年03月27日
摘要信息
招标单位
招标编号
招标估价
招标联系人
招标代理机构
代理联系人
报名截止时间
投标截止时间
招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请 或 拨打咨询热线: 400-688-2000
相关单位:
***********公司企业信息
项目名称 项目编号 公告开始日期 公告截止日期 采购单位 付款方式 联系人 联系电话 签约时间要求 到货时间要求 预算总价 发票要求 含税要求 送货要求 安装要求 收货地址 供应商资质要求 公告说明
科技文献语料数据处理系统辅助研发与技术服务****
2026-03-27 10:25:552026-04-01 11:00:00
****合同签订后7个工作日内向乙方支付50%;项目验收后7个工作日内向乙方支付剩余50%。
¥280000.00

符合《政府采购法》第二十二条规定的供应商基本条件


采购清单1
采购商品 采购数量 计量单位 所属分类
科技文献语料数据处理系统辅助研发与技术服务 1 基础软件开发服务
品牌 型号 预算单价 技术参数及配置要求 参考链接 售后服务
¥ 280000.00
服务履行时间:驻场及售后服务不少于4个月,确保团队有足够时间与甲方深入沟通与协作,保障项目的高效推进与按时交付。 内容如下: 1. 文献语料接入与分布式解析流水线建设 ● 面向多个大规模科技文献类数据集,开展统一的文档接入与预处理工作: ○ 完成千万级PDF文档的提取、校验与结构化整理; ○ 构建高质量元数据体系,实现同等规模的元数据规范化入库; ○ 保障元数据字段完备率不低于98%,有效可解析文档率不低于95%; ● 构建基于Ray的K8s任务模式: ○ 支持单批次处理能力达数十万页级别的并行解析任务; ○ 具备断点续跑、失败重试与日志回写; ○ 任务从提交到调度启动的端到端时延不超过30秒; ● 形成一套标准化、可复用的数据接入工具链与操作流程,支持未来新增数据源的快速接入与自动化处理,降低运维成本,提升平台扩展能力。 2. 文献解析生产与速度优化 ● 承担平台日常文献语料处理任务; ● 对OCR进行工程优化及显卡适配: ○ GPU**调度与批处理策略 ○ 模型加载与推理流程优化 ○ OCR在不同显卡上,打包部署适配及性能测试 关键运行指标: ● 单节点解析效率 ≥ 3000页/小时 ● GPU平均利用率 ≥ 70% ● 批量任务连续稳定运行 ≥ 72小时 3. 文献解析工具迭代开发 ● 围绕海纳平台文献解析应用需求,对在线OCR服务进行功能迭代与模型升级,提升对复杂版式与大规模文献的解析能力。 ● 完成OCR服务的月度迭代发布机制建设,支持表格内容多格式复制、输入页码快速跳转以及解析过程可视化展示,实现对识别结果的实时预览与进度反馈;开展模型版本升级与优化,建立Bad Case/Good Case提交流程,不断提升对跨页表格、混排图文及复杂版式的识别效果。 ● 完善批量解析任务能力,支持大批量文献文件的统一上传与处理,实现解析任务的集中管理与状态提示;构建分级解析服务体系,满足千量级、万量级及十万量级以上数据规模的稳定处理需求,为上层业务提供可靠的结构化解析服务。 以上建设内容包括但不限于上述需求,并根据平台实际应用场景持续完善相关功能与性能。 4. 文献语料生产流水线数据源算子扩展 ● 结合Ray分布式解析任务,对Data-Juicer处理流程进行工程化适配与功能补齐,保障文献语料在Kubernetes环境下的稳定运行。 ● 完成常用处理算子的对接与调试,支持在任务运行时进行算子加载与参数配置,解决依赖冲突与版本兼容问题,使算子执行成功率不低于98%;围绕OCR与PDF解析场景,完成关键算子的封装与流水线集成,满足千万级文献处理需求。 ● 提供相关代码、配置与部署说明,保障在Kubernetes环境下稳定运行不少于48小时。 5.验收标准 ●完成多个大规模科技文献类数据集的文献语料接入与整理,实现千万级文档的规范化处理与入库,形成同等规模的结构化元数据,保障元数据字段完备率不低于98%,有效可解析文档率不低于95%,并提供标准化、可复用的数据接入工具链与操作流程。 ●完成文献解析流水线的工程优化及显卡适配测试,实现单节点解析吞吐量不低于3000页/小时,GPU平均利用率不低于70%,能够连续稳定运行不少于72小时。 ● 完成在线OCR服务的迭代升级,支持跨页表格识别与合并、表格内图像还原及复杂版式解析,具备多格式导出、批量解析与任务管理能力,满足千量级至十万量级文献的稳**构化解析需求。 ●完成基于Data-Juicer的文献处理适配,实现关键算子的对接与参数配置,在Kubernetes环境下稳定运行不少于48小时,并满足千万级文献处理的实际需要。 ●提供与本项目相关的工程代码、Dockerfile镜像构建文件、部署脚本及技术文档,满足项目组后续运维、复用与二次开发需要,验收需在2026年6月25日前完成
乙方负责向甲方提供技术售后服务2个月,自甲方签收产品之日起;发生质量问题,乙方要在24小时内响应,必要时72小时内到用户现场排除故障,售后服务地点由甲方确定。;

附件(1)
招标进度跟踪
2026-03-27
招标公告
科技文献语料数据处理系统辅助研发与技术服务(ZJLAB-FS-BX20260026)采购公告
当前信息
招标项目商机
暂无推荐数据
400-688-2000
欢迎来电咨询~