开启全网商机
登录/注册
****2025年馆藏档案数据清洗项目竞采公告(服务类)
(竞采编号:****)
|
采购目录:
信息技术服务-数据服务-数据加工处理
需求描述:
1. 涉密和非密数据分离
(1)严格依据国家相关保密规定及单位实际定密情况,对全库档案数据进行涉密与非涉密分类。
(2)利用技术手段(如AI辅助识别系统)与人工复核相结合,对已定密但未标注密级的档案进行识别、标注与分离。以“件”为单位,逐件逐页筛查,在目录数据中补录“密级”(秘密、机密、绝密)及保密年限。(注:供应商提供AI辅助识别配置规则)
(3)将识别出的涉密数据(包括目录和图像)与非密数据进行物理和逻辑隔离。
(4)采用AI辅助识别系统识别准确率≥98%,筛选出的密件人工复核抽查率15%,正确率达100%。
(5)出具《涉密数据识别与分离报告》,列明涉密数据辨别方式、方法,辅助工具准确率,筛查、识别、分离数据,处理方式及其他说明。
2. 目录及原文数据规范化
遵循国家和市级档案管理相关标准,结合各门类档案特点,制定各门类档案数据清洗标准,包括档号结构、目录数据交换格式、图像命名规范、文件夹存储结构、原文图像存储路径等内容,区档案馆审核同意后实施。
3. 数据库规范
(1)数据库文档编制:全面梳理现有数据库结构,编制详尽的《数据库结构说明书》。说明书需清晰说明每个数据表对应的档案门类、主要用途,以及每个字段的中文名称、数据类型、约束条件、业务含义等。
(2)冗余数据清理:识别数据库中无业务关联、无使用价值的冗余数据表,出具《冗余数据清理汇总表》,区档案馆审核同意后安全删除。
4. 全库数据质检
(1)对治理后的全部目录数据、原文图像及两者挂接关系进行100%质量检查。
(2)目录数据质检:主要包括数据库中各条目的内容、格式等的准确程度、必填项是否填写等。
(3)数字图像质检:主要包括数字化参数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。
(4)数据挂接质检:主要包括目录数据与其对应的数字图像的挂接的准确性等。
(5)形成全库《数据质量问题清单》,其中一是因重复导入或档号更新等原因产生的重复数据,进行识别,区档案馆审核同意后安全删除;二是对可通过程序批量处理的问题(如字段字符数不匹配、日期不完整等)进行自动修正;三是对无法自动修正的问题(如内容错误、图像质量差等)进行标注。
5. 数据回迁与系统兼容性验证
(1)制定详细的、分批次的数据回迁方案,区档案馆审核同意后实施。
(2)回迁前须对治理后数据进行全量备份(至少双备份:本地服务器+离线移动存储设备)。
(3)通过安全移动介质或馆内局域网,将治理后数据完整导回原服务器;挂接成功率100%。
(4)确保回迁后数据能被现有档案管理系统完整识别和利用。验证内容包括:目录数据导入无错漏、无乱码;原文图像挂接准确,可正常预览、下载、打印;系统检索功能(精确查询、模糊查询)正常。
(5)回迁过程分批次进行,每批次完成后进行抽检,确保无误后继续下一批。
展开
|
¥300000 | 1(项) | ¥300000 |