标准动态
《出版业高质量数据集:建设与应用指南》和《出版业高质量数据集:格式与分类要求》两项团体标准工作组稿评
时间:2026-04-03 浏览量:4
2026年4月2日,在中国音像与数字出版协会团体标准化技术委员会的组织下,由武汉大学信息管理学院、北京中科闻歌科技股份有限公司牵头,中国建筑工业出版社、人民交通出版社、人民邮电出版社、机械工业出版社、化学工业出版社、奔流电子音像出版(北京)公司、天闻数媒科技公司等单位共同参与的《出版业高质量数据集:建设与应用指南》和《出版业高质量数据集:格式与分类要求》两项团体标准工作组稿评审会在京召开。中国音像与数字出版协会常务副理事长兼秘书长敖然、副秘书长李弘出席会议,协会副秘书长兼团体标准化技术委员会秘书长张传静主持评审会。
当前,以大模型为代表的新一代人工智能技术快速演进,为出版业实现智能化重构提供了前所未有的机遇。在算法趋同、算力普惠的背景下,高质量数据集成为驱动大模型性能提升与行业应用落地的核心瓶颈。出版业天然集聚了海量高知识密度、强逻辑结构、来源权威可信的数据资源,数字化时代下,出版业正经历从传统内容供给向深度知识服务的系统性转型。但在将既有数据资源转化为标准化、可供AI复用的数据集过程中,行业仍面临建设路径不清晰、描述与分类不统一、质量管理与评价流程不完善等共性挑战,导致出版业数据资源开发难以满足标准化、规模化、系统化和智能化的应用需求。
鉴于此,《出版业高质量数据集:建设与应用指南》致力于确立出版业高质量数据集的全生命周期建设框架,为行业提供从需求规划到落地应用的操作指引;《出版业高质量数据集:格式与分类要求》则为出版业在结构与组织层面系统构建高质量数据集提供统一技术规范。二者协同发力,共同解决出版业高质量数据集建什么、怎么建和建后如何用等核心问题。
会上,标准起草组代表对标准的研制思路、研制计划、前期调研情况及文本内容进行了详细介绍。与会人员围绕数据集建设流程、质量管理、应用模式、交付方式和数据格式等内容展开了充分讨论。专家组一致审议通过两项团体标准的工作组稿,认为两项标准前期调研工作扎实充分,内容能够满足出版业高质量数据集建设与实际应用需要,对行业开展相关数据集建设具有重要参考与借鉴价值。

根据工作计划,协会团体标准化技术委员会也将于4月19日在南昌的“第五届出版融合创新发展论坛”上介绍相关标准研制的进展情况,开展团体标准的宣贯工作。