某单位语音标注项目采购意向公告(第五次)

发布时间: 2025年08月07日
摘要信息
招标单位
招标编号
招标估价
招标联系人
招标代理机构
代理联系人
报名截止时间
投标截止时间
招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请 或 拨打咨询热线: 400-688-2000

项目所在地:**省

为便于供应商了解采购信息,根据《物资服务集中采购需求管理暂行办法》等有关规定,现将某单位某方言语音标注项目的采购意向公开如下:

序号 采购项目名称 需求概况 初步技术参数 预算金额(万元) 预计采购时间 备注
1 某单位某方言语音标注项目(包1)
采购内容:采集并标注指定4个地区各100小时总计400小时某方言有效话音语料。
采购数量:1项
主要功能或目标:采集并标注指定4个地区各100小时总计400小时某方言有效话音语料
需满足的要求:一、需要实现的功能或者目标 采集并标注指定4个地区各100小时总计400小时某方言有效话音语料。 二、应当执行的标准或规范 ****协会《中国语言服务行业规范》、《GB/T19682-2005翻译服务译文质量要求》、《语音同一性鉴定技术规范》(SF/T0122-2021)、《面向人工智能的数据集质量通用评估方法总体要求》(2021-1303T-YD)、《面向人工智能的数据生产和和标注服务能力通用成熟度模型》(2021-1306T-YD)等规范文件,编制本项目应当执行的标准或规范如下: 1、标注过程中对标注字正确率的计算标准通常如下: 字正确率=(N-D-S-A)/N*100%,式中: N:标准答案的总字数; D:删除错误数,是指识别结果相比标准答案少的字数; S:替代错误数,是指识别结果相比标准答案被替换的字数; A:增加错误数。 2、标注数据来源及要求。标注服务所需的语音数据由供应商自行采集。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。 3、标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 4、标注数据涵盖目标要求。所标注数据中需包含不同年龄段和特点的说话人,具体标准按采购单位要求执行。 三、主要功能要求 1.标注数据来源及要求。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。标注的语音数据由中标供应商按照采购单位要求自行采集,采集区域为**、**2个省内指定的共计4个州(县)区域。 2.标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 3.标注数据涵盖目标要求。所标注数据具体标准按采购单位要求执行。 4. 标注人员要求。须保证标注人员稳定,至少1名标注管理人员现场管理。
四、技术指标要求 ★1.标注结果准确率要求。某方言语音语料标注字正确率≥98%。 ★2.采集语音数据要求。8KHz采样8bit量化PCMa律、PCMu律,8KHz采样16bit量化PCM线性及Wav等主流格式。标注语料分为4个地区方言,每个地区方言需采集并标注100小时,总共400小时有效话音,每个地区的语料标注时长与要求的100小时偏差不超过3小时。中标供应商履约过程中应根据用户要求详细列明语料场景及说话人类别。 ★3.标注结果格式要求。标准的“textgrid”文本文件。 4.单个语音文件的时长须控制在0.5-10分钟内。标注文本起止时间和语音起止时间误差不超过300-500毫秒。 146.00 2025年08月 五、验收标准及方法 中标供应商需提供项目实施计划,需要在标注语料达到200小时时进行中期检查,标注语料达到400小时时方能申请最终验收,质检验收按照验收测试大纲执行。其中,标注字正确率不低于中标承诺值。由采购方提供第三方复查单位,按照标注要求及指标对所标注数据进行复检并负责答疑。验收未通过,中标供应商需在1个月内整改并达到指标要求;若整改后未达到指标要求,采购方有权终止合同并要求中标供应商支付赔偿,具体赔偿事宜需与采购方协商后在合同中明确。
2 某单位某方言语音标注项目(包2)
采购内容:采集并标注指定3个地区各100小时总计300小时某方言有效话音语料。
采购数量:1项
主要功能或目标:采集并标注指定3个地区各100小时总计300小时某方言有效话音语料。
需满足的要求:一、需要实现的功能或者目标 采集并标注指定3个地区各100小时总计300小时某方言有效话音语料。 二、应当执行的标准或规范 ****协会《中国语言服务行业规范》、《GB/T19682-2005翻译服务译文质量要求》、《语音同一性鉴定技术规范》(SF/T0122-2021)、《面向人工智能的数据集质量通用评估方法总体要求》(2021-1303T-YD)、《面向人工智能的数据生产和和标注服务能力通用成熟度模型》(2021-1306T-YD)等规范文件,编制本项目应当执行的标准或规范如下: 1、标注过程中对标注字正确率的计算标准通常如下: 字正确率=(N-D-S-A)/N*100%,式中: N:标准答案的总字数; D:删除错误数,是指识别结果相比标准答案少的字数; S:替代错误数,是指识别结果相比标准答案被替换的字数; A:增加错误数。 2、标注数据来源及要求。标注服务所需的语音数据由供应商自行采集。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。 3、标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 4、标注数据涵盖目标要求。所标注数据中需包含不同年龄段和特点的说话人,具体标准按采购单位要求执行。 三、主要功能要求 1.标注数据来源及要求。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。标注的语音数据由中标供应商按照采购单位要求自行采集,采集区域为**省内指定的共计3个州(县)区域。 2.标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 3.标注数据涵盖目标要求。所标注数据具体标准按采购单位要求执行。 4. 标注人员要求。须保证标注人员稳定,至少1名标注管理人员现场管理。
四、技术指标要求 ★1.标注结果准确率要求。某方言语音语料标注字正确率≥98%。 ★2.采集语音数据要求。8KHz采样8bit量化PCMa律、PCMu律,8KHz采样16bit量化PCM线性及Wav等主流格式。标注语料分为3个地区某方言,每个地区方言需采集并标注100小时,总共300小时有效话音,每个地区的语料标注时长与要求的100小时偏差不超过3小时。中标供应商履约过程中应根据用户要求详细列明语料场景及说话人类别。 ★3.标注结果格式要求。标准的“textgrid”文本文件。 4.单个语音文件的时长须控制在0.5-10分钟内。标注文本起止时间和语音起止时间误差不超过300-500毫秒。 120.00 2025年08月 五、验收标准及方法 中标供应商需提供项目实施计划,需要在标注语料达到150小时时进行中期检查,标注语料达到300小时时方能申请最终验收,质检验收按照验收测试大纲执行。其中,标注字正确率不低于中标承诺值。由采购方提供第三方复查单位,按照标注要求及指标对所标注数据进行复检并负责答疑。验收未通过,中标供应商需在1个月内整改并达到指标要求;若整改后未达到指标要求,采购方有权终止合同并要求中标供应商支付赔偿,具体赔偿事宜需与采购方协商后在合同中明确。

注:1.本次意向公开的采购意向仅作为供应商了解初步采购安排的参考,采购项目具体情况以最终发布的采购公告和采购文件为准;标书代写

2.供应商可以通过采购平台反馈参与意向和意见建议。


联系人:刘先生

联系方式:153****2127


附件(2)
招标进度跟踪
2025-08-07
招标预告
某单位语音标注项目采购意向公告(第五次)
当前信息
招标项目商机
暂无推荐数据
400-688-2000
欢迎来电咨询~