枝江AI数智政务项目的澄清文件
2025-09-30
湖北/宜昌 变更澄清
枝江AI数智政务项目的澄清文件
湖北/宜昌-2025-09-30 00:00:00

枝江**数智政务项目的澄清文件

递交时间:********** **:**信息来源:

文件编号
投标资格
投标文件递交截止时间
投标有效期 **天
投标文件递交方法
投标保证金缴纳方式
投标保证金金额 *元 人民币
控制价(最高限价)
评标办法 详见招标文件
开标时间
开标地点
开标方式
资格审查方式
答疑澄清时间
是否延期
延期后开标时间
延期后开标地点
对文件澄清与修改的主要内容

各潜在投标人:

根据本项目招标文件的规定,现对招标文件有关内容进行澄清与修改,具体澄清与修改内容如下:

*、针对投标人提问做出以下回复:

(一)** 应用中台模块

序号

系统子项

投标人提问

答复内容

*

大语言模型集成与鉴权

*. 是否需要支持模型级权限细分(例如:仅允许部分用户访问 *****)?*. 是否对模型响应延迟和并发量的要求?*. 是否需要审计日志?

*. 支持模型级权限细分:需按用户角色(如管理员、业务岗、普通用户)实现模型级权限管控,权限配置需与政务岗位权责体系匹配。

*. 响应延迟与并发量要求:响应延迟需满足 “单笔请求≤*.* 秒”(非峰值时段),并发量需支持 “同时在线用户≥*** 人、每秒请求数≥*** 次”,并预留 **% 扩容空间以应对政务高峰期需求。

*. 需强制留存审计日志:日志需包含 “调用用户、调用时间、模型类型、请求参数、返回结果、调用状态” 等信息,留存期限不少于 * 年,满足《数据安全法》《政务数据共享开放管理办法》对操作溯源的要求。

*

小模型管理

小模型的性能监控和自动扩缩容需求?

*.性能监控:需实时监控小模型 “*** 使用率、内存占用、响应成功率、错误率” 等指标,当指标超出阈值(如错误率>*%、*** 使用率>**%)时,需触发短信 / 邮件告警至系统管理员。

*.*. 自动扩缩容:支持基于 “并发量、资源占用率” 的自动扩缩容,扩缩容响应时间≤* 分钟,需保障扩缩容过程中模型服务不中断。

*

** 问答语料

*. 语料更新频率和人工审核流程?*. 语料的文件类型包括哪些?(文档、***、音视频)

*. 更新频率与审核流程 * 常规语料(如政务办事指南)每月更新 * 次;紧急语料(如政策新规、临时通知)需在发布后 ** 小时内更新。 * 人工审核需经过 “部门初审(业务科室负责人)→合规复审(法务 / 数据安全岗)→系统上线(管理员)” 三级流程,审核记录需留存备查。

*. 语料文件类型:支持 “文档(***/****/*****)、***、音频(***/***,需配套文字转写稿)、视频(***,需配套字幕文件)”。

*

智能识别词库

*. 是否支持词库的多语言扩展?*. 词库维护责任方?(人工自行更新或系统自动挖掘?)

*. 多语言扩展支持:当前项目仅需支持 “中文(简体)+ 英文” 双语扩展,未来如需新增少数民族语言(如藏语、维吾尔语),另行签订补充协议明确开发范围。

*. 维护责任方 * 基础词库(如通用政务术语、敏感词)由招标人(湖北省港润大数据产业发展有限公司)负责人工维护,每季度更新 * 次; * 部门专属词库(如税务、市场监管专业术语)由使用部门提供更新需求,中标方协助录入系统,每月同步 * 次,暂不支持系统自动挖掘。

*

涉敏语料管理

敏感语料的定义范围?(例如:涉及国家安全、商业机密或个人隐私)

敏感语料定义范围严格遵循《中华人民共和国国家安全法》《个人信息保护法》及政务数据分级分类标准,具体包括:*. 国家安全类:涉及国家秘密、军事机密、外交决策的信息;*. 商业机密类:招标人及下属单位未公开的财务数据、采购底价、合作协议;*. 个人隐私类:公民身份证号、手机号、家庭住址、医疗记录、社保公积金明细等可识别个人身份的信息;*. 政务敏感类:未公开的政策草案、信访举报数据、案件调查材料。

*

内容生成约束规则

规则是否支持动态识别?

支持动态识别。

*

语料同步

*. 是否需支持增量抓取与去重?*. 目标网站类型及抓取频率?

*. 需支持增量抓取与去重

*. 目标网站类型及抓取频率 * 核心网站(人民网、中央部委官网、湖北省政府网、宜昌市政府网、枝江市政府网):每日抓取 * 次(凌晨 *:****:**,避开网站访问高峰); * 行业网站(如湖北省政务服务网、宜昌市税务局官网):每周抓取 * 次(周二、周五凌晨)。

*

智能体构建

智能体的交互形式?(纯文本 / 多模态)

支持 “纯文本 + 多模态” 两种交互形式:*. 纯文本:基础交互形式,支持文字输入、关键词联想、历史对话回溯;*. 多模态:支持 “图片上传(如身份证、营业执照识别)、表格导入(如 ***** 数据统计分析)、语音输入(中文语音转文字,识别准确率≥**%)”。

**

智能体欢迎引导

无疑问

无补充说明,按招标文件技术参数执行即可。

**

智能体权限控制

无疑问

无补充说明,按招标文件技术参数执行即可。

**

智能体引用

智能体对外开放方式?(*** 接口、页面、***)

支持三种对外开放方式,中标方需全部实现:*. *** 接口:支持与招标人现有政务系统(如办公 **、政务服务平台)对接,接口文档需符合《政务信息系统接口规范》;

*.页面嵌入:提供可嵌入的页面,支持自定义样式(如匹配招标人官网色调);

*.*** 开发包:提供 ****/****** 语言的 ***,含完整开发手册及示例代码,支持后期二次开发。

**

智能体调试

无疑问

无补充说明,按招标文件技术参数执行即可。

**

*** 调用信息

无疑问

无补充说明,按招标文件技术参数执行即可。

**

意图库

*. 是否支持用户反馈纠正意图?*. 意图分类的粒度?(粗粒度 ****; 细粒度)

*.支持用户反馈纠正。

*. 意图分类粒度:采用 “粗粒度 + 细粒度” 双层分类: * 粗粒度:按业务领域划分(如 “社保查询”“企业注册”“投诉建议”); * 细粒度:按具体需求划分(如 “社保查询” 下细分 “养老保险缴费查询”“医疗保险报销查询”“社保卡挂失”),细粒度分类需覆盖枝江市政务高频事项(≥*** 项)。

**

意图配置

意图冲突的处理策略?(例如:多个意图匹配同一语句)

采用 “优先级 + 模糊匹配” 双重处理策略具体方案由投标人提供

**

意图调试

意图触发的方式?(关键词 ****; 语义)

支持 “关键词 + 语义” 两种触发方式,且需实现协同触发。

**

文档抽取集成

文档类型 (是否包括图片?是否包括非结构化文档?是否包括版式分析、表格识别、公式识别、阅读顺序识别能力)

*.文档类型覆盖 支持图片 支持非结构化文档(如扫描版 ***、手写笔记照片,需配套 *** 文字识别,识别准确率≥**%)。

*.核心能力要求:需全部具备以下能力: 版式分析表格识别公式识别阅读顺序识别。

**

能力调用集成

无明确疑问

无补充说明,按招标文件技术参数执行即可。

(二)小模型管理模块

序号

系统子项

投标人提问

答复内容

*

光学字符识别(***)

*. 如何处理识别后的纠错与校验?是否需要人工审核流程?*. 对结构化信息 (如发票上的金额、日期) 的提取是否有要求?*. 主要应用场景?是标准文档 (扫描版 ***), 还是自然场景图片 (街拍、广告牌)?*. 精度要求?可接受的错误率是多少?*. 语言范围?除中文外,是否需要支持少数民族语言或特定小语种?

*. 纠错与校验系统需具备自动纠错人工审核功能

*. 结构化信息提取要求:需提取 “关键字段 + 格式保留”。

*. 主要应用场景:以 “标准文档(扫描版 ***,如政务表单、审批文件)” 为主,“自然场景图片(如街拍、广告牌)” 仅作为辅助场景,占比不超过 **%。

*. 精度要求:标准文档识别准确率≥**%(可接受错误率≤*%),自然场景图片识别准确率≥**%(可接受错误率≤**%),单页文档错误率超过 *% 视为不合格,需重新识别。*. 语言范围支持 “中文(简体)”,暂不要求支持少数民族语言及小语种。

*

计算机视觉(**)

*. 是需要通用的 ** 能力,还是针对特定场景的定制化模型?*. 对识别速度 (实时性) 和准确率的优先级如何排序?

*. ** 能力类型 通用 ** 能力(如目标检测、图像分类)作为基础支撑,无需额外定制。

*. 优先级排序:准确率优先于识别速度。

*

知识图谱构建(向量模型)

*. 知识图谱的数据来源是什么?结构化数据 (数据库,还是非结构化数据 (文档、网页)?*. 构建图谱的规模预期是多少 (实体、关系的数量级)?*. 图谱需要覆盖的领域有多专业 (如通用常识 **. 法律条款 **. 基因关系)?

*. 数据来源:以 “结构化数据” 为主,“非结构化数据(文档、网页)” 为辅。

*. 规模预期:首期构建规模为 “实体数量≥**万个,关系数量≥**万条,预留 **% 扩容空间。

*. 领域专业度:覆盖 “通用政务常识(如办事流程)+ 枝江市特色领域(如当地产业政策、园区企业信息)”,暂不涉及高度专业领域(如法律条款、基因关系),若后续需扩展,需另行约定。

*

自然语言处理(***)

文本处理的对象是规范的书面语,还是口语化、含有错别字的网络用语?是否需要处理方言或特定领域的 “行话”?

*.文本处理对象:以 “规范书面语(如政策文件、办事指南)” 为主,“口语化 / 网络用语(如用户咨询对话)” 为辅,需支持对口语化表达的规范化转换。

*.方言与行话处理 * 方言:仅支持 “宜昌方言” 的基础理解(如 “搞么子”“克哪里”),其他方言暂不支持; * 行话:需支持枝江市政务高频领域行话(如 “一窗通办”“最多跑一次”),行话清单由招标人提供,中标方需嵌入 *** 模型。

*

数据采集技术(***)

*. 是否确定目标网站或应用?(目标网站或应用的 ** 结构一旦变更,*** 流程就会失效,需要频繁维护)*. 采集的数据源是内部系统还是外部网站?是否需要登录?采集的频率和量我是多少?

*. 目标网站 / 应用:已确定,具体清单由招标人在中标后 * 个工作日内提供(含枝江市政务服务网、宜昌市公共资源交易网等 ** 个核心平台);针对 ** 结构变更问题,中标方需提供 “*** 流程监控与快速适配服务”,当 ** 变更时,** 小时内完成流程调整,避免服务中断。

*. 数据源及采集要求 * 类型:内部系统(招标人业务 **、数据中台)与外部网站(政府公开平台)均需覆盖; * 登录:内部系统需支持 “单点登录(***)”,外部网站无需登录(仅采集公开信息); * 频率:内部系统每日采集 * 次,外部网站每周采集 * 次; * 量:单次采集数据量≤****,避免占用过多带宽影响系统运行。

*

多模态交互(图片、声音、表格)

*. 交互的具体形式是什么?多模态交互的典型用例 (例如,语音问答关于图片内容” 还是 “上传表格并语音命令生成图表”) 请描述 *** 个最典型的多模态交互用例)*. 对响应速度的要求是多少?

*. 交互形式及典型用例 * 用例 *:图片 + 文本交互(用户上传身份证图片,系统识别后生成 “身份证信息确认文本”,用户核对后提交,用于政务办事材料预审); * 用例 *:表格 + 语音交互(用户上传 ***** 格式的 “月度办事数据” 表格,通过语音指令 “生成近 * 个月办事量趋势图”,系统自动分析数据并生成可视化图表,用于政务工作汇报)。*. 响应速度:多模态交互单次响应时间≤* 秒,其中图片 / 表格处理时间≤* 秒,文本 / 语音生成时间≤* 秒。

(三)公文写作等智能体建设模块

序号

系统子项

投标人提问

答复内容

*

智能拟稿场景

*. 拟稿的具体文档类型 (如:通知、请示、工作报告) 及其标准模板范例?*. 可接受的内容准确率和规范性标准?

*. 文档类型及模板:需支持枝江市政务常用 * 类文档,标准模板范例由招标人提供: * 通知(如会议通知、工作通知); * 请示(如经费请示、项目请示); * 工作报告(如月度总结、年度报告); * 批复(如对下级单位请示的批复); * 函(如部门间协调函); * 新闻稿(如政务活动报道)。

*. 准确率与规范性 * 内容准确率:核心信息(如时间、地点、金额、责任部门)准确率 ***%,表述逻辑准确率≥**%; * 规范性:需符合《党政机关公文处理工作条例》及枝江市《公文格式规范》,格式错误(如字体、行距、页码)不超过 * 处 / 页。

*

智能改稿场景

改稿的重点是侧重于语言文字,还是文章结构与逻辑?

“语言文字 + 文章结构 + 逻辑” 三者并重,具体优先级:*. 第一优先级:逻辑正确性(如请示理由是否充分、报告数据是否连贯);*. 第二优先级:文章结构(如通知需包含 “标题、主送机关、正文、落款” 四要素,缺一不可);*. 第三优先级:语言文字(如错别字修正、用词规范、语句通顺)。

*

智能排版场景

是否由针对不同类型文档的具体排版规范文档或格式要求?

有,招标人将在中标后提供不同文档类型的具体要求,例如: * 通知:标题用 ** 号黑体,正文用 ** 号仿宋 ******,行距 ** 磅; * 工作报告:标题用 ** 号黑体,一级标题用 ** 号黑体,二级标题用 ** 号楷体,正文用 ** 号仿宋 ******,行距 ** 磅; 中标方需按手册要求开发排版功能,排版结果需 ***% 符合规范。

*

智能摘要场景

对摘要的字数、格式 (段落式 / 要点式) 有无具体要求?

*. 字数要求:根据文档长度动态调整例如原文字数≤**** 字,摘要≤*** 字;原文字数> **** 字,摘要>***并且≤*** 字。*. 格式要求支持 “段落式 + 要点式” 两种格式,用户自主选择。

*

文件解读场景

这个功能是作为理解辅助工具,还是可以替代人工解读?

作为 “理解辅助工具”,不替代人工解读。

*

公文智能检索

需要支持的检索条件?(如关键词、文号、日期、发文单位、主题词)

需支持 * 类检索条件,用户可组合使用:*. 关键词检索*. 文号检索;*. 日期检索*. 发文单位检索;*. 主题词检索;*. 文档类型检索;*. 密级检索(公开、内部、秘密,需权限控制);*. 附件检索(支持按附件名称、附件类型检索)。

*

智能问答场景

是否需要支持多轮对话?是否需要支持答案溯源?

*.多轮对话:需支持多轮对话,且对话上下文保留时间≥** 小时。

*.答案溯源:需支持答案溯源。

*

后续构建的智能体梳理

无疑问

无补充说明,按招标文件技术参数执行即可。

**

枝江公务员办公门户集成智能体对接开发

需要门户开发团队提供清晰、稳定的 *** 接口,上述系统是否具备对接条件,能否提供接口文档?

*.对接条件:枝江公务员办公门户已具备对接条件,招标人将协调门户开发团队配合对接;

*.接口文档:招标人将协调门户开发团队组织三方(中标方、门户开发团队、招标人)技术对接会,明确对接细节。

**

已有文档库集成对接开发

文档库中是否存在大量无效、重复或敏感数据,需要在同步前处理?

*.数据现状:已有文档库存在少量无效、重复数据,敏感数据已标记;

*.处理要求:中标方需在同步前完成 “数据清洗”工作

**

系统部署及联调

需要先明确服务器操作系统、数据库版本、中间件等软硬件环境要求。

服务器操作系统、数据库版本、中间件等软硬件环境不做强制要求,需为主流软硬件环境满足后期安全性、拓展性、易维护性等。

**

原始数据收集及入库

数据类型?数据清洗和标注的标准?

*. 数据类型:包括 “语料数据(政务文档、政策文件、问答记录)、业务数据(办事流程、审批记录、用户反馈);*. 清洗与标注标准 * 清洗标准:无空值、无乱码、无敏感信息(按涉敏语料定义剔除)、格式统一; * 标注标准:语料数据需标注 “业务领域(如社保、税务)、数据类型(如文本、表格)、敏感级别(公开 / 内部 / 秘密)”,标注准确率≥**%,标注记录需留存。

**

系统培训

无疑问

无补充说明,按招标文件技术参数执行即可。

**

单位内部常用知识语料整理

无疑问

无补充说明,按招标文件技术参数执行即可。

(四)** 系统的持续知识积累与智能进化模块

序号

系统子项

投标人提问

答复内容

*

** 系统的持续数据获取与处理

*. 数据源的法律授权:需要提供书面的、明确授权的数据来源清单和使用协议,能否配合提供?*. 需要领域专家深度参与审核,能否安排专家配合?

*. 法律授权:招标人将配合提供 “数据源授权文件”,包括: * 公开政务数据集(如政府官网公开文件):提供《数据使用授权函》; * 非公开数据集(如内部业务数据):签订《数据保密与使用协议》,明确使用范围(仅用于本项目)、保密义务及违约责任; 所有授权文件在中标后提供。

*. 专家配合:招标人将组建 “领域专家审核组”,成员包括枝江市政务服务、数据安全、法律等领域专家,专家将在 “数据审核、模型优化、需求确认” 等关键环节参与,具体时间由双方协商确定。

*

** 系统的持续数据清洗与预处理

*. 数据清洗的规则和标准由谁制定?*. 当 ** 输出与人工验证结果冲突时,以哪个为准?如何利用冲突案例优化模型?

*. 规则与标准制定:由 “招标人 + 中标方 + 领域专家” 三方共同制定《数据清洗规则与标准手册》,手册需明确 “数据格式、清洗流程、质量校验指标”,经三方签字确认后执行,后续调整需书面审批。

*. 冲突处理与模型优化 * 冲突判定:以人工验证结果为准 * 模型优化:将冲突案例纳入 “模型优化数据集”,通过 “微调模型参数、补充训练数据” 优化模型,优化后需重新测试,确保冲突率下降。

*

** 系统的持续数据增强

*. 数据增强的策略是针对所有语料还是针对模型表现薄弱的环节?*. 如何避免过度增强导致模型过拟合或学到无意义的噪声?*. 数据增强主要解决什么问题?是解决训练数据不足,还是提升模型在特定任务上的鲁棒性?*. 数据增强可能引入不可控的误差,需要一个严格的测试流程来把关,能否提供配套的业务流程验证要求?

*. 增强策略:采用 “重点突破” 策略,优先针对模型表现薄弱的环节。

*. 如何避免过度增强由投标人提供专业且合理的解决方案

*. 解决问题:主要解决两大问题: 训练数据不足模型鲁棒性不足。

*. 业务流程验证要求:招标人将向中标单位提供相关标准,明确 “增强前数据审核、增强中过程监控、增强后质量验收” 三个环节的验证要点,中标方需按清单执行并提交验证报告。

*

** 系统的持续模型研发

*. 模型更新的频率是多久?是月度、季度还是按需更新?*. 是否有回滚机制?当新模型表现不佳时,能否快速切换回旧版本?*. 对技术风险的认知: “持续模型研发” 是探索性工作,可能投入大量资源后效果不及预期?能否接受这种不确定性?

*. 更新频率按需更新

*. 回滚机制:需具备完善的回滚机制,支持 * 小时内回滚至旧版本,并自动发送告警信息至管理员。

*. 技术风险认知:招标人已充分认知 “持续模型研发” 的探索性,接受合理范围内的不确定性,但需中标方: * 提前制定风险预案; * 及时同步风险情况。

*、原开标时间为****年**月**日*:**,现延期至:****年**月**日*:**。

*、本澄清修改公告与招标文件具有同等法律效力,本澄清修改公告与招标文件表述不一致之处,以本澄清修改公告为准。

招标人:湖北省港润大数据产业发展有限公司

招标代理机构:湖北港宏工程咨询有限公司

****年**月**日

递交时间
微信客服
公众号
小程序