为支撑自动化系在智能控制、模式识别等领域的科研与教学需求,解决当前多源异构数据(包括非结构化文本、影像资料及生产实验数据)管理混乱、利用率低的问题,现需构建一套集智能采集、处理、存储、检索、安全管控于一体的知识库系统,并将在相关科研项目(海油发展****基地二期建设项目-数据分析模型开发与应用服务项目)中验证是否满足如下需求: (1)多模态处理能力:系统需内置高性能OCR引擎,支持对扫描件、图片、手写体及特定格式(LaTeX, MATLAB脚本等)的非结构化数据进行内容提取与全文索引。 (2)异构数据集成:需提供标准化API接口,****实验室现有设备数据、Git代码库、项目管理平台,打破数据孤岛,实现文档与生产数据的关联映射。 (3)高级检索引擎:除基础检索外,必须支持语义检索、组合条件筛选、相似度匹配及跨库联合查询,显著提升知识获取准确率。 (4)安全合规架构:严格遵循等级保护要求,实现基于角色的访问控制(RBAC)、动态水印、版本控制、操作日志审计,确保数据可追溯、防泄露。 (5)知识图谱构建:具备对学科领域知识进行自动标签化、分类及关联挖掘的能力,形成可持续演进的知识资产地图。
经费预算
300000.00元
技术指标
1)基础交互与适配系统以Web 网页为核心交互方式,兼容 Chrome、Edge、Firefox 等主流浏览器,无需安装客户端,支持多场景访问。页面加载时间≤3 秒,操作响应时间≤1 秒,支持多标签页并行操作,适配多分辨率终端,保证稳定流畅体验;
2)文档管理与非结构化处理全面支持主流文档格式,覆盖教学、科研、行政全类型文件。采用MinIO 分布式对象存储,高可靠、弹性扩展、不停机扩容,支持海量文件安全存储。内置OCR 智能识别引擎,支持对扫描件、图片、PDF 内嵌图片等非结构化文档自动文字提取、结构化解析与全文索引,实现图片类文档可检索、可编辑、可比对。自动记录文件历史版本,留存操作人、时间、修改内容,支持版本回溯、对比、下载,防止文件丢失与错误覆盖;
3)文件元数据精细化管理提供默认元数据字段(文件名、作者、时间、格式、大小、关键词、描述等),支****教研室、项目编号、保密级别、保管期限、数据源类型等),可配置必填、字段类型(文本 / 日期 / 下拉 / 单选),实现文档标准化、精细化标识与管理;
4)目录与权限体系采用多级文件夹目录管理,支持按组织、项目、文档类型灵活构建目录树。权限支持用户 / 角色 / 部门三级管控,文件夹与文件权限联动,细粒度分配查看、上传、编辑、下载、删除、分享、审核等操作,确保数据访问安全可控;
5)生产数据集成与接入支持生产数据、实验数据、设备数据、业务系统数据统一集成接入,支持自定义数据源配置与自定义数据结构映射。提供标准化API 接口、数据推送接口、库表对接能力,可接收外部系统实时 / 批量数据入库,自动完成数据清洗、格式转换、结构化处理与统一索引。支持结构化数据、半结构化数据与非结构化文档混合存储、统一管理;
6)跨数据源智能检索基于统一索引构建跨文档、跨生产数据联合检索引擎,支持:精确字段检索:按文件名、作者、时间、项目编号、元数据等精准匹配;模糊检索:关键词、近义词、片段内容模糊匹配,支持拼音检索;跨源检索:同时检索文档库与生产数据库,统一结果排序、高亮展示、快速定位;
7)存储与扩展性存储架构支持弹性扩容、负载均衡、冗余备份,保障数据高可用。系统支持用户量、文件量、数据量线性扩展。
询价小组意见
询价小组意见:经讨论,决定拟选用******公司,报价260000.00元。
询价小组成员:王珠,檀朝东,岳元龙
质疑方式
询价结果公示期为三天,公示期间如有疑问,请致电010-****3226。