****银行****中心建设项目之离线特征库及特征固化开发服务采购供应商征集公告
一、征集时间
2026年05月28日-2026年06月01日
二、项目需求
****中心系统离线特征库模块建设开发服务,包括批量特征ETL作业数据引入、开发、调度、计算、监控等功能,特征数据存储可支持灵活拓展,并完成3500个存量特征逻辑固化部署。本采购是采购软件开发服务,不涉及软硬件采购。项目预估45人月。
(1) 项目经理(1名)
具备8年及以上IT行业从业经验其中至少5年以上数据类平台系统相关建设经验。作为项目经理,至少主导交付过2个“数据中台/特征中心/标签平台”类项目。具备数据平台类系统数据接入、数据作业开发、作业管理、作业调度、数据存储等方面的丰富经验。
(2) 程序开发工程师(多名)
具备3年及以上前后端软件开发经验,熟悉微服务架构,熟练掌握大数据平台及常用关系型数据库。至少具备1个“数据中台/特征中心/标签平台”类系统的研发、落地经验。
(3) 数据加工开发人员(多名)
具备3年及以上大数据开发经验, 精通Hadoop生态体系(HIVE、SPARK)及常用离线调度工具。精通复杂SQL编写及数据处理。至少具备1个“数据中台/特征中心/标签平台”类系统的底层数据ETL开发经验。
项目管理要求
受邀公司应向我行提交项目管理方案,方案至少包括项目组织机构、人员安排、计划控制、质量管理及风险管理、各阶段应达到的目标、检验达到目标的标准,及其应交付文档。方案必须符合本项目招竞争性磋商文件的要求,并具有可操作性。
1.受邀公司需提供以上参与本项目的人员名单和简历,提供这些成员具有的资质证书复印件,列出项目组织结构中每个成员在项目中的参与阶段、参与时间(人月)和从事的工作内容,并体现在报价中。
2.受邀公司需书面承诺:
(1)未经我行同意,上述项目组织结构中的每个成员在项目实施过程中不得变动;
(2)在实施过程中,对征得我行同意的人员调换,受邀公司应在30个工作日内提供同资质人员并经我行确认后入场;
(3)在实施过程中,对于不符合我行技术****公司项目组成员,****银行提出书面通知后,受邀公司应在15个工作日内提供满足要求的同资质人员并经我行确认后入场;
(4****公司的竞争性磋商文件准备和讲标必须指定由后续本项目实施过程中全程现场工作的人员负责。
3.项目沟通管理:建立与各项目关联方的良好沟通,包括需求沟通,需求确认、需求及设计评审沟通、问题提出和跟进,会议记录,文档管控等。
4.项目跟踪和汇报
(1)根据项目计划衡量、跟踪和评估项目的进展;
(2)协助我行协调组织项目各相关部分,包括参与项目的第三方**;
(3)与我行项目经理一起解决项目计划出现的例外情况;
(4)审查项目的任务进展、日程安排和**调配,并根据情况做出适当的改变;
(5****小组一起召开周例会,以检查项目进展状况,每周提交项目周报并且对我行进行汇报;
(6)在例行项目状况检查会议上,与我行的项目经理一起共同审查项目进展状况;
(7)实施项目变更控制程序;
(8)审查并分析项目变更需求;
(9)定期提交项目交付品的质量报告,定期提交项目风险报告。
5.提供完整的项目计划、周报、月报等文档
(1)要提出不同阶段的进度计划安排以及项目变更时期的进度安排。
6.符合我行项目管理的统一要求,并****办公室要求的相关任务。项目日常工作管理符合我行各项项目管理条例。
7.开发测试管理
8.所有交付文档须遵循我行文档规范。
9.开发测试管理,原则上开发工具、测试工具、版本管理及程序发布工具使用我行现有的工具,如果推荐第三方产品,请列明产品信息,如版本、软硬件环境要求。
2.1整体服务方案要求
1 主题化特征宽表建设
需建立结构化、分层级的特征管理体系,便于特征检索与管理。
业务要求:
1)三层级业务目录树
| 层级 |
划分原则 |
说明 |
| 第一层 |
客群分类 |
划分为"对私"和"对公"两大板块,根据客户号严格区分 |
| 第二层 |
业务主题 |
按务属性划分(如交易类、资产类、信贷表现类、外部征信类),每个主题有唯一缩写词根 |
| 第三层 |
具体特征 |
具体特征项 |
2)特征时效分层
| 类型 |
定义 |
典型例子 |
业务规则 |
| 日增量特征 |
变化极快、需T+1每日监控的特征 |
昨日交易金额、近3天登录失败次数 |
依赖每日流水数据,每天生成一个分区 |
| 月全量特征 |
变化较慢、计算复杂、只需按月观测的特征 |
客户近3年大额资产转移倾向、公积金缴纳基数 |
每月末计算一次,覆盖上月全量状态 |
2 敏感定级与脱敏
特征数据涉及敏感信息,需依据行内规范进行定级与脱敏处理。
业务要求:
● 登记特征时依据行内敏感信息定级规范提供数据敏感等级选择
● 对于高敏感特征,底层数据展示支持自动化数据脱敏
3 特征血缘
业务背景:需清晰展示特征的来源、加工过程与应用去向,支撑数据治理与影响分析。
业务要求:
● 提供特征血缘可视化图谱:可交互的DAG有向无环图界面
● 详细展示数据节点、过程节点、应用节点信息
● 包含特征、特征来源库表、特征加工作业、特征应用模型等信息
4特征数据批量计算及历史回溯
业务背景:特征库需保留近N年特征数据,并支持历史数据回溯。
业务要求:
● 特征库需自动、准时、按时地批量计算最新特征数据,并按规范存储
● 历史回溯:新增特征或修复特征逻辑BUG时,快速补齐过去N年历史数据
● 回溯需具备防穿越机制,回溯不能影响正常跑批
5 特征灵活筛选
务背景:建模人员需快速筛选备选特征,形成特征宽表。
| 功能 |
说明 |
| 特征维度筛选 |
层级目录筛选、特征标签筛选、模糊搜索筛选 |
| 人群筛选 |
支持上传CSV文件或输入SQL定义人群 |
| 日期范围筛选 |
支持对数据日期范围进行筛选 |
| 自动化宽表生成器 |
解决时间对齐问题:日特征取当日数据,月特征取最近可用月末快照,禁止穿越未来数据 |
6 特征数据存储与管理
业务背景:特征数量众多,需形成多张特征宽表,特征持续新增,数据量巨大(需保留近N年历史数据),需保证存储效率、查询性能与数据一致性。
业务要求:
(一)特征宽表设计要求
| 要求项 |
具体内容 |
| 宽表分层设计 |
明确特征宽表分层架构(如基础特征层、衍生特征层、应用特征层),各层宽表职责边界清晰,数据流转关系明确 |
| 主键与粒度设计 |
明确宽表主键设计(如客户号+数据日期),支持ToC/ToB客群分层存储,说明数据粒度(如客户级、账户级) |
| 字段命名规范 |
宽表字段命名需遵循特征命名标准,支持自动化字段校验 |
| 宽表数量与规模规划 |
预估特征宽表数量、单表字段规模、单表数据量级,说明存储容量规划 |
(二)宽表Schema灵活性要求
| 要求项 |
具体内容 |
| Schema变更策略 |
支持字段新增、删除、类型变更,变更过程不阻塞查询 |
| 历史数据兼容 |
Schema变更后历史数据仍可正常查询,新增字段支持默认值填充 |
| 版本管理机制 |
宽表Schema变更需有版本记录,支持版本回溯与对比 |
(三)分区与存储策略
| 要求项 |
具体内容 |
| 分区设计 |
按数据日期分区,日增量特征按日分区,月全量特征按月分区,分区粒度与特征更新频率匹配 |
| 存储格式 |
采用列式存储格式(如Parquet/ORC),说明压缩算法选择与压缩比预期 |
| 冷热数据分离 |
近3个月热数据与历史冷数据分层存储,冷数据归档策略(如迁移至低成本存储) |
(四)历史数据回溯机制
| 要求项 |
具体内容 |
| 批量回溯能力 |
支持按时间范围批量回溯历史数据,回溯任务可配置并发度与**限制 |
| 防穿越机制 |
严格禁止查询未来数据,查询日期为某日时,月特征只能匹配该日之前的月末数据 |
| 回溯与跑批隔离 |
历史回溯任务不影响正常增量跑批,**隔离、任务队列分离 |
(五)增量更新能力
| 要求项 |
具体内容 |
| 差异化更新策略 |
日增量特征每日增量写入,月全量特征每月全量覆盖 |
| 增量与全量合并 |
明确增量数据与全量快照的合并逻辑,保证数据完整性 |
| 更新时效保障 |
日增量特征T+1完成更新,月全量特征每月初完成计算 |
(六)查询性能保障
| 要求项 |
具体内容 |
| 索引设计 |
主键索引、分区索引、二级索引设计策略,说明索引命中场景 |
| 预计算与缓存 |
高频查询特征预计算结果缓存,缓存更新策略 |
| 性能指标 |
单条特征检索响应时间≤3秒,并发量≥20QPS |
7特征监控
业务背景:需对特征数据质量与分布进行持续监控。
业务要求:
● 特征数据质量监控:空值率、零值率、主键唯一性
● 特征分布漂移监控:针对重点入模特征计算PSI、百分位数、最大值、最小值等
8 特征数据集成要求
数据源管理
| 类型 |
具体产品 |
| 源端数据源 |
Hive、Iceberg、Kafka、GaussDB、goldendb |
| 目标端数据源 |
Hive、Iceberg、Kafka、GaussDB、goldendb、ClickHouse |
技术要求:
● 支持数据源连通性测试
● 支持读取组件、转换组件、写入组件自适应数据类型
● 支持组件本地加载
离线数据集成
技术要求:
| 功能项 |
具体要求 |
| 任务设计 |
支持组件化拖拉拽方式快速完成数据同步任务设计 |
| 传输控制 |
支持对数据读取和写入进行流量或行数限制,实现传输速率控制 |
| 字段映射 |
支持配置化的方式选择目标库表,配置字段映射规则 |
| 并发执行 |
支持设置多任务并发,提高数据集成效率 |
| 自定义SQL |
支持自定义SQL在同步前对读取数据进行过滤,在同步后对写入数据进行处理 |
| 数据库迁移 |
支持异构数据库间数据迁移,支持数据在线迁移、全量/增量迁移 |
集成任务监控
| 监控项 |
具体内容 |
| 任务信息 |
任务名称、同步数量、时延、任务状态、系统**占用情况 |
| 告警与日志 |
支持任务告警与任务调试功能,支持操作日志 |
9 数据建模要求
| 功能项 |
具体要求 |
| 建模方式 |
支持图形化建模管理,使用**拖拽与连线吸附方式建立关联关系,支持EXCEL模板导入模型 |
| 模型版本管理 |
支持数据模型的版本管理,支持模型关联数据域、数据分层 |
| 模型类型 |
支持维度、事实、指标、宽表、实体等类型模型创建 |
10 元数据管理要求
| 功能项 |
具体要求 |
| 元数据采集 |
支持Hive、Iceberg、Kafka、GaussDB、goldendb、ClickHouse等对象的元数据采集 |
| 采集周期 |
支持手动采集或周期性自动采集,支持小时、天、周、月等多种采集周期设置 |
| 分类管理 |
提供统一的元数据管理能力,支持将元数据以数据目录方式进行分类管理 |
| 元数据查看 |
支持检索数据表并查看元数据,包含表基础信息、字段信息、索引信息、存储概览、分区信息、变更信息 |
| 血缘分析 |
支持表血缘、字段血缘分析,支持全链路分析,形成分析链路图 |
11 数据开发
离线计算
| 功能项 |
具体要求 |
| 计算引擎 |
支持Spark、Hive、Flink、Impala等计算引擎 |
| 任务类型 |
支持创建Hive、Spark、JAVA JAR、Shell、Python、Impala任务 |
| 引擎切换 |
离线开发任务可变更计算引擎 |
| 跑数设置 |
支持跑数设置,将大数据集拆分为多个小数据集执行 |
| 多版本支持 |
支持多版本任务类型(Spark、Python、Flink等) |
数据开发流程
| 功能项 |
具体要求 |
| 环境隔离 |
支持开发、生产环境隔离 |
| 项目导入导出 |
支持项目导入、导出,支持物理隔离的数据中台环境 |
| 任务依赖 |
支持跨流程、跨项目任务依赖配置 |
| 流程编排 |
支持图形化任务流程编排和任务依赖关系设置 |
| 在线开发 |
支持任务在线开发、调试、运行、发布 |
| 图形化编辑 |
支持图形化开发与编辑,支持语法自动高亮显示、代码格式化、代码智能提示 |
| 版本控制 |
支持对代码进行版本控制,可进行多版本管理和版本回溯 |
| 调度配置 |
支持多重执行周期调度(分、时、天、周、月),支持跨周期依赖调度配置 |
12 数据资产管理
| 功能项 |
具体要求 |
| 资产统计 |
支持整体数据资产统计,包括数据源、数据表、API、存储等统计,反映存储**消耗情况 |
| 资产地图 |
支持数据资产地图,可查看数据表、数据库、非结构化数据、API等不同资产详情 |
| 元数据监控 |
支持元数据监控,对元数据表及字段元数据进行稽核,形成监控面板 |
| 编目管理 |
支持对数据**进行编目管理,数据目录至少支持五级结构展示 |
13 数据质量管理
| 功能项 |
具体要求 |
| 质量监控 |
支持数据质量监控告警,支持告警汇总、告警趋势、质量趋势统计 |
| 质量规则 |
支持针对不同数据源特点设计不同数据质量检查规则 |
| 评分指标 |
支持自定义质量评分指标,可为不同质量规则关联指标并分配计分权重 |
| 内置规则 |
支持内置多种质量规则,从合理性、完整性、唯一性、准确性、规范性、一致性、及时性等维度监控 |
| 校验类型 |
质量校验支持数据集校验规则、多表校验规则和单表校验规则 |
14 数据安全管理
| 功能项 |
具体要求 |
| 数据分类 |
支持数据分类定义及管理,支持数据安全等级自定义(机密、公开、秘密、绝密) |
| 敏感数据扫描 |
支持基于不同数据安全等级的敏感数据扫描任务,支持周期自动化或手动方式发现敏感数据 |
| 敏感数据分布 |
支持敏感数据分布查看,可查看涉敏表、涉敏字段统计结果及明细 |
| 脱敏算法 |
支持内置遮蔽、截断、Hash等多种脱敏算法,支持配置脱敏策略并进行测试 |
| 动态脱敏 |
支持构建脱敏表,关联脱敏策略实现动态脱敏 |
| 权限管控 |
支持基于不同密级提供库级、表级、字段级、行级权限管控 |
15 特征固化
完成3500个特征计算逻辑固化上线。
2.2服务质量保证措施
1. 功能质量保障:严格保障特征加工精度、实时特征计算准确率、指标输出一致性,全流程把控特征质量、模型迭代稳定性,杜绝特征漂移、数据倾斜、计算偏差等问题;
2. 交付质量管控:建立多级评审与验收机制,对需求对齐、原型设计、代码开发、单元测试、集成测试、投产验证全节点进行质量卡点,确保交付成果100%匹配采购需求;
3. 性能与稳定性保障:针对实时特征低延迟高并发、批量特征大批量回溯算力场景,提供专属性能调优、容灾备份、限流降级保障机制,保障全年系统高可用;
4. 人员与过程管控:****银行风控特征、大数据平台建设经验的专属项目团队,建立定期进度同步、风险预警、问题闭环机制,全程保障项目交付质量与进度可控。
2.3应急预案要求
供应商需编制完备的专项应急预案,覆盖两大模块建设与运行全场景:
1. 故障场景:特征清洗数据异常、实时特征计算延迟/中断、跨周期验证指标大幅波动、系统算力过载、报文解析报错、生产投产异常等各类突发故障;
2. 应急机制:明确事前风险预判、事中快速定位、分钟级应急响应、故障降级兜底、事后复盘整改的全流程应急处置流程;
3. 兜底保障:建立7*24小时应急响应通道,重大故障承诺最短恢复时长,最****银行风控业务、模型投产、信贷业务开展带来的负面影响。
2.4实施计划要求
1. 输出精准到周的分级详细实施落地计划,划分为需求调研与方案细化、环境搭建与功能开发、模块联调与性能压测、用户验收测试、投产上线、试运行优化六大核心阶段;
2. 明确功能的优先级、各阶段交付物、里程碑节点、交付验收标准、项目关键依赖与前置条件;
3. 预留合理的风险缓冲周期,提前识别跨部门协同、数据对接、投产窗口等潜在卡点,保障项目按期高质量交付落地。
2.5交付文档要求
全项目周期同步交付全套规范、完整、符合银行内部管控与监管归档要求的交付文档,核心包含:
● 整体架构设计说明书、详细功能设计文档、数据库与接口规范文档
● 特征迭代相关功能说明文档、指标口径说明、可解释性算法白皮书
● 测试用例集、压测报告、投产上线方案、回退方案
● 运维操作手册、管理员手册、业务用户操作手册
● 可解释性合规归档报告、跨周期稳定性评估报告
所有文档需支持持续版本迭代更新,满足银行业监管文档存档、内部审计、业务追溯的全部要求。
2.6验收标准与验收方法
1. 功能验收:逐项核对离线特征库全功能,100%满足需求描述,所有功能无功能性缺陷;
2. 性能验收:实时特征计算时延、批量回溯效率、特征分析运算速度均达标,大并发、大数据量场景下稳定运行;
3. 准确性验收:特征固化逻辑准确性、数据一致性全部达到预设合格标准;
4. 验收方式:采用阶段性分项验收+最终整体竣工验收结合模式,执行功能黑盒测试、性能压测、场景案例核验、监管合规符合性核验,验收不通过需限期完成整改复测直至合格。
2.7知识产权要求
1. 本项目交付的全部软件成果、定制化代码、文档资料、算法适配成果、项目产出物的全部知识产权(含著作权、使用权、修改权、二次迭代权)永久归属采购方所有;
2. 供应商需保障交付成果不存在任何第三方知识产权侵权纠纷,若出现侵权责任,全部由供应商独立承担,同时赔偿采购方全部相关损失;
3. 未经采购方书面许可,供应商不得将本项目相关任何成果、方案、数据对外泄露、复用或提供给第三方。
2.8保密要求
1. 本项目全过程接触、****银行客户数据、信贷业务数据、风控模型数据、特征资产、内部业务规则、项目涉密资料,均属于采购方绝密涉密信息;
2. 供应商需签订专项保密协议,约束全体项目人员严格遵守国家数据安全法规、银行内部数据保密管理制度,严禁任何形式的数据导出、复制、外传、泄露;
3. 项目结束后,供应商需彻底销毁全部留存的采购方涉密数据与资料,永久履行保密义务,保密责任永久有效,若发生泄密,承担全部法律与经济责任。
2.9维保服务要求
1. 项目正式验收合格后,提供不少于[1年]免费质保运维服务,质保期内所有系统BUG修复、功能缺陷整改、常规版本优化全部免费;
2. 质保期内提供7*24小时技术支持,常规问题工作日及时响应,重大生产故障紧急极速响应、现场/远程兜底支撑;
3. 质保期满后,可提供优惠优先级专属续保运维服务,持续提供系统迭代、性能优化、新业务场景适配、监管规则更新适配等长效技术支撑。
2.10培训要求
1. 针对采购方业务人员、建模人员、技术运维人员,定制分层专项培训;
2. 培训内容覆盖:平台整体架构、特征全流程操作、调优分析工具使用、可解释性报告解读、实时特征引擎运维、日常问题排查、应急处置操作;
3. 提供线下+线上多轮培训、配套培训课件与操作视频,确保相关人员可以独立上手使用、自主运营维护平台。
2.11违约赔偿要求
1. 若供应商未按约定工期完成交付、交付成果质量不达标、验收反复无法通过,需按照合同约定承担逾期违约金与相应违约责任;
2. 若出现服务重大失误、数据泄露、知识产权侵权、系统故障造成采购方业务损失、监管处罚、品牌声誉损失,供应商需全额承担所有直接与间接经济损失,并承担对应的法律责任;
3. 若供应商严重违反合同核心约定、无法履约交付,采购方有权单方终止合同,并追究供应商全部违约责任与赔偿。
项目后续工作时间安排
项目整体实施计划完成时间从合同签署之日起T+12个月完成,受邀公司应以上述时间点为目标,制定项目总体实施计划。
项目的总体实施计划应包括但不限于如下内容:
1. 每个阶段中任务的人力**、其他**要求,时间安排,计划需详细周全;
2. 应包含项目启动至系统投产上线及服务流程建设完成之间的所有工作项;
3. 制定知识转移和培训计划。
公司服务期限:
按照项目实施计划及磋商文件的相关要求。
服务要求
(1) 安装、配置和调试
受邀公司必须提供系统现场的安装、配置和联调等服务,包括生产环境、开发测试、集成测试环境、压力测试环境等,****银行的要求进行现场调优工作。
(2) 试运行
应用系统在全部功能及场景上线后需经过一个月试运行期,所有指标和功能达到要求、满足用户正常使用需求时,方可进行最终验收。在试运行期间,****公司指定有相关经验的工程师全程跟踪和协助,并根据当前系统的运行情况和用户要求优化系统。如果发现系统出现功能、性能问题,****银行解决问题。待系统全部达到要求时,浦发银行最终验收,试运行期结束。
项目实施完成,从最终验收之日起提供一年免费现场维护服务,免费维护服务包括但不限于:现场工程师进行日常维护;产品和应用导致的问题修复;提供产品升级服务;健康巡检等。受邀公司必须本地拥有支持团队,以确保维护服务能够得到有效落实。
受邀公司须提供7X24的服务,在突发情况发生时能在4小时内到达现场,提供对突发事件的应对机制,并能够在我行指定的重要日期(如年终决算、重点保障)提供现场保障。
三、供应商基本资质要求
1.供应商通用资质要求
1)具有独立承担民事责任的能力;
2)具有良好的商业信誉和上年度经审计财务会计报告;
3)具有依法缴纳税收和社会保障资金的记录;
4)具有响应相关采购品目应具备的资质条件、经营范围等;
5)近3年内,在经营活动中没有重大违法记录、无重大事故。供应商及其法定代表人在近3年无行贿犯罪记录。
2.本项目供应商特定资质要求
1)2021年1月1日起至今(以合同项下有效期内订单签订日期为准),****分行****公司、****中心)或十二家****银行****公司、****中心),有类似本项目成功项目案例(关键字如:离线特征库、特征加工、批量特征数据计算、数据集成、数据整合)。
四、供应商报名提交资料
1.基本信息请在注册我行供应商门户时提供(如已在我行门户网站注册成功,则报名环节无需再次提供)
| 注册材料 |
境内企业 |
境内机构 |
境外主体 |
| 营业执照 |
营业执照 |
事业单位法人证/律所职业资格证/其他机构登记证明 |
商业登记证明 |
| 承诺声明及授权书(含廉洁自律承诺函) |
√ |
√ |
√ |
| 供应商声明 |
√ |
√ |
√ |
| 法人身份证/护照 |
√ |
√ |
√ |
| 企业介绍 |
√ |
√ |
|
| 上年度财报(因有特殊情况,****公司没有强制审计、成立不满1年或其他原因等,可情况说明代替) |
√ |
√ |
同等证明材料 |
| 税收及社保缴纳记录(近6个月任一期) |
√ |
√ |
同等证明材料 |
| 资质材料(注册环节非必传) |
√ |
√ |
√ |
| 案例材料(注册环节非必传) |
√ |
√ |
√ |
注:此表材料对应供应商通用资质要求。
2.报名提交材料。****公司公章)
1)本项目供应商特定资质要求所需提交的证明材料,案例提供项目合同复印件,或提供框架协议+有效订单(基本信息无需重复提交)。
五、报名资料提交方式
相关材料通过我行采购供应商门户-供应商征集板块对应项目征集公告报名提交。
门户主页访问地址:https://ebuy.****.cn
六、声明
1.我行接受报名并不表示接受报名供应商参与本项目后续采购等工作,且我行有权对供应商征集审核结果不做任何说明;
2.供应商须对提供的所有信息的真实性负责;
3.在审核过程中,我行如认为必要,将安排对供应商进行实地考察、邀请参加POC测试等;
4.采购人保留要求报名服务供应商补充提交资料的权利;
5.本次公开征集不收取供应商任何费用。
七、联系人及联系方式
联系人:徐老师
电话:021-****8016
邮箱: xuj47@spdb.****.cn
****
二0二六年五月二十八日