开启全网商机
登录/注册
|
|
1
|
(1)本地知识库构建。 (2)本地问答服务。
|
其他服务/其他未分类服务/其他未分类服务
|
1.服务目标: (1)本地知识库构建。 (2)本地问答服务。 2.服务内容: 2.1本地知识库构建 (1)构建专用于业务问答的知识库,数据类型涵盖实况、气候等资料; (2)建立本地知识库后台文件处理模块,按文件类型进行文件分割; (3)本地知识库详细内容见附件1。 2.2 业务问答服务(对内) 对内服务旨在支持大模型针对本地业务文件内容的语义理解与问答能力,提升业务人员获取信息的效率和准确性。 2.2.1 数据结构化与语料生成 各类本地资料进行解析与结构化处理,包括标题、时间、发布单位、正文内容分段等。 (1)数据来源分类 本项目涉及的主要资料包括以下类型: 实时业务、气候等数据 《**市气象志》全文及附录 气象政务类文件 (2)多格式解析与结构提取 针对上述非结构化本地资料,需采用自然语言处理技术和文本解析工具,完成对文档正文、标题、发文时间、编号、发布单位等字段的结构化提取。对于扫描件等图像类文档,集成 OCR 模块提取文本。对于表格数据,结合结构识别模型将其转换为标准文本形式,以统一处理流程。 (3)清洗标准与实体识别 (4)标签体系与索引构建 2.2.2 本地专用智能体搭建 (1)基于开源大语言模型的组合方式构建本地专用智能体; (2)利用RAG方案(检索增强生成),对本地文件进行语义索引与动态调用; (3)无需微调原始模型,通过向量索引与智能体配置实现问答高准确率能力,支持插件扩展与知识库持续增量。实现对本地知识库内容的上下文理解与问答。 2.2.3 内部问答服务系统开发 (1)搭建基于Dify框架的前端网页系统,实现统一问答入口,具备权限管理功能,供气象局内部业务人员使用; (2)页面集成问答框,支持自然语言输入;提供文档定位功能,可展示答案所引用的原文出处。 3.服务验收要求: (1)收集气象图文资料种类:政务数据不少于6种。 (2)本地资料问答任务中准确率达到90%以上。
|
至12月20号
|
****中心5楼
|
-
|