主作者:肖林博士
我国正在全面推进数字中国战略, 大力发展数字经济。数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。这其中,档案数据是国家核心战略资源的重要组成部分,也是价值密度最高的数据, 如何探索创新档案数据管理与长期保存策略, 成为摆在我们面前一项紧迫的重大课题。
海量数据的涌现,给人类生产、生活带来了巨大便利, 同时也诱发了数据的安全问题。数据安全关乎国家安全,数据与国家经济运行、社会治理、公共服务、国防安全等方面密切相关, 数据泄露、丢失和滥用将直接威胁国家安全和社会稳定。档案数据自然也不能例外,而且要求更高。2021年1月1日, 《中华人民共和国档案法》 正式施行, 明确要求“各级人民政府应当将档案信息化纳入信息化发展规划, 保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用”。2021年中共中央办公厅、国务院办公厅印发《 “十四五” 全国档案事业发展规划》, 要求档案部门要贯彻总体国家安全观, 加强电子档案长期保存技术和管理研究, 保障档案数字资源安全, 创建科学的可信存储与验证体系。2023年, 国务院办公厅印发《政务服务电子文件归档和电子文件管理办法》, 要求“各级政务服务机构应当做好本单位政务服务电子档案安全管理工作,定期开展电子档案备份,做好电子档案登记、日常检查、转换、迁移、鉴定、销毁等工作”。2019年2月和 2022年2月, 时任上海市委书记李强同志两次视察上海市档案局、档案馆时指出, 要加强档案数字资源长期安全保存问题的超前研究, 找到对策。可以说,档案数据的长期安全保存应该放在数字中国战略和总体国家安全观战略下去思考、去谋划、去解决。由肖林、龙凌云、张建明、杨安荣等撰写、中国财富出版社有限公司于2024年6月出版的《档案数据管理与长期保存策略:基于数字中国战略的研究》一书,正是这样一部聚焦防范档案数据安全风险、提升档案数据管理与长期保存工作的质效的研究专著。
本专著为国家档案局立项重点科研项目研究成果,作者团队采取文献调研、实地调研、比较分析等形式, 对国内40多家档案馆、机关、企事业单位档案室进行深入调研, 广泛听取有关部门单位和基层档案工作者的意见和建议, 了解档案数据保存现状及存在的问题, 以及档案数据存储介质耐久性与长期保存最新发展趋势和技术方向,对当前主流档案数字存储介质进行了系统梳理, 深入研究存储介质的物理性能、读写规则、使用寿命, 从国外同类项目的案例分析中吸收先进的理念与技术, 提出档案数据管理与长期保存的策略和方法, 并提出了切实可行的电子档案备份中心建设方案。
全书正文部分共分为五个章节,分别是档案数据长期保存概述、档案数据保存现状及存在的问题、档案数据存储介质及耐久性分析、档案数据长期保存策略研究、电子档案备份中心建设方案。各章节的主要内容概要如下:
1.档案数据长期保存概述
本章首先对档案数据的概念、特点、来源与分类以及管理方式进行了介绍;其次对长期保存的概念、期限、目标、对象、要求和技术措施进行了阐述;然后从档案数据需要超长的保存周期、档案数据具有严格的保存要求、档案数据形式类型非常丰富、档案数据的容量非常大四个方面对档案数据长期保存的特点进行了分析;指出档案数据的长期保存面临真实性、完整性、可用性和安全性等多个方面的挑战;从相关基础研究、存储介质分析选择研究、存储系统研究、长期保存系统研究、长期保存策略研究、实践应用六个方面对档案数据长期保存国内外研究现状进行了说明。
2.档案数据保存现状及存在的问题分析
本章重点聚焦目前档案馆档案数据的保管情况, 从数据量情况、存储备份情况、存储介质保管情况等方面进行了详细调研和深入分析;指出现阶段档案数据长期保存主要存在的八个方面问题:
档案数据量激增带来数据存储风险;
现有的档案数据存储备份介质不能满足长期保存的要求;
软硬件技术快速的更新迭代致使档案数据的识读遭遇挑战;
库房环境条件和控制水平参差不齐亟待改善;
档案数据长期保存维护工作量大、成本高;
档案数据遇到丢失、损坏等情况无法及时发现;
档案数据异质备份的问题尚未考虑;
核心技术被国外垄断, 档案安全威胁持续存在。
3.档案数据存储介质及耐久性分析
本章给出了目前主流的四大类存储介质(磁存储介质、光存储介质、电存储介质、胶片存储介质)的分类表,并从发展过程、技术原理、分类和特点等方面对各类存储介质进行具体分析,着重分析应用于企业级存储市场的存储介质;对目前主流的四种档案数据存储介质(磁带、硬磁盘、蓝光光盘和缩微胶片)的耐久性进行了深入分析;对这四种档案数据存储介质的特性进行对比分析,并指出“每种存储介质都有各自的优势和劣势, 单一的介质并不能很好地解决档案数据长期安全保存问题。应充分发挥各种存储介质的优点, 结合档案数据长期保存的要求组合应用, 才能满足档案数据长期安全保存的要求。”同时分别介绍了数字胶片、全息存储、玻璃存储和DNA存储这四种为实现大容量、高密度、长寿命的存储目标而研发的新型存储介质。
4.档案数据长期保存策略研究
本章给出了档案数据长期保存的总体框架,自底向上分为基础设施、 存储载体、管理软件和保存策略四个层次,并分别对每个层次进行了简要介绍。从数据管理、载体管理、环境管理三个方面对档案数据长期保存管理策略进行介绍:数据管理对需要长期保存的档案数据通过数据组织、数据检测等管理手段来确保其真实、完整、可用和安全;载体管理从载体保管设备和载体管理措施两个方面提出要求;环境管理则通过将磁带、硬磁盘、蓝光光盘和缩微胶片等各类存储载体置于合适的保存环境中进行管理。从备份策略、载体迁移策略、格式转换策略三个方面对档案数据长期保存技术策略进行介绍:备份策略包括载体选择策略、多套备份策略、备份更新策略、数据恢复策略;载体迁移策略重点关注迁移载体的选择、 迁移时间的确定等问题;格式转换策略则需要考虑现行标准规范的要求、技术更新与产品迭代的需求以及信创背景下自主可控要求。
5.电子档案备份中心建设方案设计
本章给出电子档案备份中心的总体设计,明确备份中心的背景和定位,设计备份中心的架构,并针对备份中心在线备份、离线备份、异地备份、异质备份的需求分别选择不同的备份载体;从备份库房建设、装具建设、管理系统建设三个方面入手提出了电子档案备份中心的建设方案;按照档案数据入库、日常管理和出库的流程分别从入库管理、日常管理和出库管理三个环节对电子档案备份中心中的长期保存策略分别进行介绍,并对档案数据长期保存策略进行了汇总:包括但不限于入库管理环节的筛选策略、AIP 结构、AIP 更新策略,日常管理环节的多载体备份策略、巡检策略、数据恢复策略、载体迁移策略、格式转换策略以及出库管理环节的优先级顺序、出库审批流程、载体检测策略、备份频次。
本书通过对存储介质耐久性的详细分析,明确了哪些存储介质适合长期保存。 首先对传统存储介质及其发展趋势展开研究,分析各类存储介质的优劣势; 再对适合长期保存的介质进行深入分析,从介质结构出发,分析影响耐久性的因素,客观科学地得出各类存储介质的寿命,为档案数据长期保存存储介质的选择提供了重要的参考依据。
《档案数据管理与长期保存策略——基于数字中国战略的研究》版权页
本书从管理策略和技术策略两方面提出档案数据长期保存策略。档案数据长期保存无法通过单一的存储介质和存储策略实现。本书首先对长期保存概念和长期保存对象进行分析,再结合档案数据长期保存的要求提出档案数据长期保存的框架, 明确档案数据长期保存策略包括战略规划、管理策略和技术策略三方面,本书的研究重点放在管理策略和技术策略这两个方面。从数据管理、载体管理、 环境管理三个部分提出了详细的档案数据长期保存管理策略; 同时, 通过对长期保存技术的研究,从备份策略、载体迁移策略、格式转换策略三个部分提出了档案数据长期保存技术策略。
本书结合上海市区两级综合档案馆档案数据现状,提出了电子档案备份中心建设方案。按照档案数据长期保存的总体框架, 对电子档案备份中心的总体架构进行了设计,并从库房建设、装具建设、管理系统建设等方面档案数据管理与长期保存策略提出了详细的设计方案。同时,以长期保存策略为基础,基于实际情况,从入库管理、日常管理、出库管理三个环节提出了一套可落地、可操作的长期保存策略,为下一步电子档案备份中心的建设和运行提供了依据。
本书基于现有的存储介质和长期保存技术,制订了档案数据长期保存方案,以期该方案能尽快落地实施。同时, 也希望在档案数据长期保存工作开展过程中能不断总结经验, 不断完善长期保存策略, 为后续开展档案数据长期保存工作提供可借鉴的经验, 为尽快制订我国档案数据长期保存国家行业标准规范提供依据。
档案数据长期保存是一个漫长而艰巨的工程, 也是全世界档案部门面临的共同难题。档案数据长期保存既需要存储介质的支撑, 更需要各种技术和策略的综合应用。由于档案数据长期安全保存所涉及的情况复杂、内容众多, 要系统、全面、深入地研究剖析档案数据管理与长期保存策略是相当有难度的,团队成员将在后续实际工作中开展不断探索与实践,同时结合实践经验反馈、改进、完善本书中的观点,并通过公众号文章、修订增发等方式及时分享给大家。