开启全网商机
登录/注册
|
项目名称
|
**省健康医疗行业高质量数据集建设项目
|
||
|
招标人名称
|
****
|
||
|
投资估算
|
1800.000000 万元
|
资金来源
|
自筹
|
|
项目概况
|
主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。
|
||
|
招标范围
|
主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。
|
||
|
计划招标时间
|
2025-11-19 00:00
|
||
|
其他
|
|||
|
备注
|
本次公开的招标计划是本项目的初步安排,仅供各方提前知悉,提高招投标活动透明度,后期存在因故取消、变更的可能,具体情况以招标公告和招标文件为准
|
||