柬埔寨高棉语ASR语料定制采购

发布时间: 2026年05月09日
摘要信息
招标单位
招标编号
招标估价
招标联系人
招标代理机构
代理联系人
报名截止时间
投标截止时间
关键信息
招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请 或 拨打咨询热线: 400-688-2000
相关单位:
***********公司企业信息

柬埔寨高棉语ASR语料定制采购

项目询价函

各受邀报价单位:

你好!现诚恳邀请贵方对以下所述的项目进行报价。请确认报价且在2026年5月13日(星期三)17:00前将盖章报价文件上传至平台。

一、项目名称

柬埔寨高棉语ASR语料定制采购

二、项目编号

****

三、采购人

****

四、采购项目概况(拟采购一览表)

序号

名称

技术规格

数量(套)

单价(元)

合计(元)

备注

1

柬埔寨高棉语ASR语料定制采购

一、语料基本信息

语料类型:语音转文字

语种:高棉语

所属国家:柬埔寨

语料规模:220

语料规模单位:小时

二、交付时间

1. 交付周期:任务交付周期为签订合同后1周(可提前交付)。

2. 交付批次:分三个均等量批次交付。

3. 逾期扣罚:未按照约定时间完成交付的,视为逾期,将按照逾期处理。

(1) 每延期一天扣罚当次任务已交付验收通过总金额的5%,最多扣罚50%。

(2) 超过10天以上未交付的部分拒绝验收,对验收部分扣罚50%。举例:中标供应商可以分批次交付,如果在约定时间内累计交付进度为60%,超过10天未交付的40%,不再验收。针对已经交付的60%仅给结算30%的份额。(10天延期扣罚50%)

(3) 规定时间内交付进度低于60%的,不得参与二次同类任务的竞标。

三、交付要求

(一)音频技术规范

1.录制要求

(1) 原始录音频谱≥16 kHz、单声道(Mono)、WAV 格式。

(2) 不接受 MP3、AAC、OGG 等有损压缩格式。

2.发音人要求

(1) 必须为真人母语发音者,禁止使用 AI 合成语音。

(2) 发音人总数 ≥ 总时长/10。

(3) 年龄范围:18–60 岁(比例尽量分布均匀)。

(4) 口音需明确标注每位发音人的地域口音,要求尽量均匀覆盖当地各类口音。取值范围参考以下内容中的元数据文件字段说明。

(5) 单个发音人贡献的有效语音总时长不超过 10 小时但也不低于3小时(以保障说话人多样性;如需超限,须提前与甲方沟通获得书面同意)。

3.发音质量要求

(1) 吐字清晰:发音标准,吐字饱满清晰。

(2) 语速自然:保持日常说话的自然语速,不得过慢。WPM(每分钟字数)参考范围140 - 170。

(3) 表达流畅:无明显的吞音、口吃、重复、拖音、含糊等发音问题

4.录制形式:依据脚本进行单句录音。

5.环境要求:背景无明显混响、无背景音乐、无持续性环境噪声。

6.音频内容处理

(1) 前后静音处理:每句录音前后须包含不少于500ms以及不高于1000ms的静音段。

(2) 交付统计仅统计有效人声时长,静音时长不计入有效时长。

(3) 静音片段测定方式:采用语音活性检测(VAD)技术来检测静音,默认采用参数2。

(二)文本与对齐要求

1.文本内容:必须严格按甲方提供的脚本文本录制对应语音,不得增删、替换或修改任何字词;

2.准确率要求:词准≥98%且句准≥95%;

3.抽检比例:按实际交付量的千分之一,随机抽查。

4.文本-音频对齐:每条音频必须对应唯一、完整、顺序一致的文本行;

(三)数据组织与交付规范

1.文件与目录结构:

交付数据必须采用以下目录结构:

/delivery_package_YYYYMMDD/

├── metadata.csv

└── audio/

├── utt00001.wav

└── ...

2.音频文件命名规则:

格式: .wav

示例:utt00001.wav

3.元数据交付:

以 CSV 格式文件(metadata.csv)提供,使用 UTF-8 编码。

必须包含以下字段:

- utt_id: 语句的唯一ID,与文件名中的UttID对应

- speaker_id: 发音人唯一ID,与文件名中对应

- speaker_name: 发音人姓名或代号,可匿名化

- gender: 性别,取值为 male 或 female

- age: 年龄

- accent: 口音,Central:中央高棉语、Cardamom:豆蔻山高棉语、Surin:素林高棉语、Krom:下高棉语等

- duration_ms: 音频总时长,单位毫秒

- text: 该音频对应的文本

- language: ISO 639-3 语言代码 (越南:vi,缅甸:my,老挝:lo,印尼:id,马来:ms,泰国:th,柬埔寨:km)

- domain: 领域 (如 chat, news, general)

- file_path: 音频文件的相对路径

4.录制平台:基于甲方提供的平台账号进行录制,若有特殊原因需要使用自有私有化平台的,需要提前与甲方沟通并在甲方环境进行平台私有部署。

四、验收标准

(一)数据属性要求:交付数据必须为乙方自产数据,不得与市场上其他供应商提供的同类小语种数据存在重复,且需提供发音人授权证明。

(二)基础质量要求:音频质量、发音人数量、数据量、文本格式规范性及字段完整性、准确率等,均须符合上述约定的交付标准。

(三)有效时长要求:仅统计有效人声部分的时长。静音、无效噪声、非目标语音等均不计入有效时长。

(四)交付自检要求:各批次交付前必须进行自检,需要有自检记录和质量报告。

1

五、项目预算

9.5万元(人民币玖万伍仟元整)

六、报价文件的组成

1、询价函

2、报价函(见附件一)

3、报价一览表(见附件二)

4、项目需求说明书(见附件三);

七、与采购货物相关的要求

1、本次询价为整体采购,询价响应供应商报价时,报价主要为老挝语高棉语成品无监督音频语料采购交付采购人使用前所有可能发生的费用,定标后不再增补任何费用。

2、交付期:中选后按照采购人规定的期限内全部交付。

3、交付方式:客户现场。

八、询价文件的获取

1、询价文件获取地点:

****采购信息平台

(https://business_services.****.cn/#/loginOut)。

2、询价文件获取方式:入围供应商注册/登录中译语通采购信息平台下载。

九、应答文件的递交

1、应答文件递交截止时间(即应答截止时间)和递交地点:【2026】年【5】月【13】日【17】时【00】分,递交地点为【****采购信息平台】。逾期送达的应答文件将被不予受理。加急标书代写

2、询价函需加盖骑缝章,其中附件一、附件二按照文件要求在指定位置签字、盖章。

3、出现以下情形时,不予接收应答文件:

①逾期送达或者未送达指定地点的;

②未按照本询价公告要求获得本项目询价文件的;

十、供应商注册及报名

供应商在参与项目前,须进入我司供应商库,并在****采购信息平台(https://business_services.****.cn/#/loginOut)完成注册,供应商登录后,上传报价函完成报名。

十一、发布公告媒介

本询价公告在“****采购信息平台(https://business_services.****.cn/#/loginOut)”上发布,其他媒介转载无效。

十二、联系方式

采购人:****

地址:**市**区五一剧场南路

项目联系人:刘梦琪

电话:176****8114

邮箱:liumengqi@gtcom.****.cn

****

2026年5月9日

招标进度跟踪
2026-05-09
招标公告
柬埔寨高棉语ASR语料定制采购
当前信息
招标项目商机
暂无推荐数据
400-688-2000
欢迎来电咨询~