科技文献语料数据处理系统辅助研发与技术服务(ZJLAB-FS-BX20260026)采购公告
2026-03-27
浙江/杭州 招标采购
科技文献语料数据处理系统辅助研发与技术服务(ZJLAB-FS-BX20260026)采购公告
浙江/杭州-2026-03-27 00:00:00
浙江/杭州-2026-03-27 00:00:00
| 项目名称 | 科技文献语料数据处理系统辅助研发与技术服务 | 项目编号 | ******************* |
|---|---|---|---|
| 公示开始日期 | ********** **:**:** | 公示截止日期 | ********** **:**:** |
| 采购单位 | 之江实验室 | 付款方式 | 合同签订后*个工作日内向乙方支付**%;项目验收后*个工作日内向乙方支付剩余**%。 |
| 联系人 | 中标后在我参与的项目中查看 | 联系电话 | 中标后在我参与的项目中查看 |
| 签约时间要求 | 供货期 | ||
| 外贸代理费核算(若为进口采购) |
*.*万***以下:****元;[*.***)万***:*.*%;[****)万***:*.*%;[*****)万***:*.*%;[*****)万***:*.*%;**万***及以上:*.*% |
||
| 预算 | ¥***,*** | ||
| 供应商资质要求 |
符合《政府采购法》第二十二条规定的供应商基本条件
|
||
| 收货地址 | |||
采购清单*
| 采购物品 | 采购数量 | 计量单位 | 所属分类 |
|---|---|---|---|
| 科技文献语料数据处理系统辅助研发与技术服务 | * | 项 | 基础软件开发服务 |
| 推荐品牌 | |||
|---|---|---|---|
| 推荐规格型号 | |||
| 预算 | ¥***,*** | ||
| 技术参数 | 服务履行时间:驻场及售后服务不少于*个月,确保团队有足够时间与甲方深入沟通与协作,保障项目的高效推进与按时交付。 内容如下: *. 文献语料接入与分布式解析流水线建设 ● 面向多个大规模科技文献类数据集,开展统一的文档接入与预处理工作: ○ 完成千万级***文档的提取、校验与结构化整理; ○ 构建高质量元数据体系,实现同等规模的元数据规范化入库; ○ 保障元数据字段完备率不低于**%,有效可解析文档率不低于**%; ● 构建基于***的***任务模式: ○ 支持单批次处理能力达数十万页级别的并行解析任务; ○ 具备断点续跑、失败重试与日志回写; ○ 任务从提交到调度启动的端到端时延不超过**秒; ● 形成一套标准化、可复用的数据接入工具链与操作流程,支持未来新增数据源的快速接入与自动化处理,降低运维成本,提升平台扩展能力。 *. 文献解析生产与速度优化 ● 承担平台日常文献语料处理任务; ● 对***进行工程优化及显卡适配: ○ ***资源调度与批处理策略 ○ 模型加载与推理流程优化 ○ ***在不同显卡上,打包部署适配及性能测试 关键运行指标: ● 单节点解析效率 ≥ ****页/小时 ● ***平均利用率 ≥ **% ● 批量任务连续稳定运行 ≥ **小时 *. 文献解析工具迭代开发 ● 围绕海纳平台文献解析应用需求,对在线***服务进行功能迭代与模型升级,提升对复杂版式与大规模文献的解析能力。 ● 完成***服务的月度迭代发布机制建设,支持表格内容多格式复制、输入页码快速跳转以及解析过程可视化展示,实现对识别结果的实时预览与进度反馈;开展模型版本升级与优化,建立*** ****/**** ****提交流程,不断提升对跨页表格、混排图文及复杂版式的识别效果。 ● 完善批量解析任务能力,支持大批量文献文件的统一上传与处理,实现解析任务的集中管理与状态提示;构建分级解析服务体系,满足千量级、万量级及十万量级以上数据规模的稳定处理需求,为上层业务提供可靠的结构化解析服务。 以上建设内容包括但不限于上述需求,并根据平台实际应用场景持续完善相关功能与性能。 *. 文献语料生产流水线数据源算子扩展 ● 结合***分布式解析任务,对***********处理流程进行工程化适配与功能补齐,保障文献语料在**********环境下的稳定运行。 ● 完成常用处理算子的对接与调试,支持在任务运行时进行算子加载与参数配置,解决依赖冲突与版本兼容问题,使算子执行成功率不低于**%;围绕***与***解析场景,完成关键算子的封装与流水线集成,满足千万级文献处理需求。 ● 提供相关代码、配置与部署说明,保障在**********环境下稳定运行不少于**小时。 *.验收标准 ●完成多个大规模科技文献类数据集的文献语料接入与整理,实现千万级文档的规范化处理与入库,形成同等规模的结构化元数据,保障元数据字段完备率不低于**%,有效可解析文档率不低于**%,并提供标准化、可复用的数据接入工具链与操作流程。 ●完成文献解析流水线的工程优化及显卡适配测试,实现单节点解析吞吐量不低于****页/小时,***平均利用率不低于**%,能够连续稳定运行不少于**小时。 ● 完成在线***服务的迭代升级,支持跨页表格识别与合并、表格内图像还原及复杂版式解析,具备多格式导出、批量解析与任务管理能力,满足千量级至十万量级文献的稳定结构化解析需求。 ●完成基于***********的文献处理适配,实现关键算子的对接与参数配置,在**********环境下稳定运行不少于**小时,并满足千万级文献处理的实际需要。 ●提供与本项目相关的工程代码、**********镜像构建文件、部署脚本及技术文档,满足项目组后续运维、复用与二次开发需要,验收需在****年*月**日前完成 | ||
| 售后服务 | 乙方负责向甲方提供技术售后服务*个月,自甲方签收产品之日起;发生质量问题,乙方要在**小时内响应,必要时**小时内到用户现场排除故障,售后服务地点由甲方确定。; | ||
之江实验室
********** **:**:**



