Industry news

行业新闻
展开分类
收起分类

兰台学术 | 生成式人工智能对档案工作的影响——从ChatGPT谈起

  • 发布时间:2025-04-15
  • 发布者: 超级管理员
  • 内容来源: 本站
  • 阅读量:25
  • 点赞量:0

摘要《“十四五”全国档案事业发展规划》明确指出要应用人工智能助力档案管理工作转型升级,并与数字档案馆(室)建设相结合。生成式人工智能应用于档案管理已经是大势所趋。基于“未来已来”的数智时代背景,笔者以档案工作为例,从爆火的ChatGPT谈起,结合国内外有关研究和应用案例,总结概括生成式人工智能给档案检索查阅、档案编研、价值挖掘、公开共享和开放审核等方面的工作带来的机遇,分析可能存在的信息安全、网络安全、网络犯罪和知识产权等方面的风险并提出针对性建议,为档案领域更广泛和深入应用生成式人工智能提供参考。


《“十四五”全国档案事业发展规划》对数智时代档案事业发展提出了新的要求和挑战。档案作为基础性文化资源和战略性信息资源,对国家各项事业的支撑性作用愈加明显。近年来,经互联网、大数据、区块链、机器学习和Web3.0等技术的出现为档案行业带来了诸多变革,而ChatGPT(Chat Generative Pre-trained Transformer)的横空出世更是给档案工作创造了无限的遐想空间。借助新技术新方法,创新档案治理理念、范式和路径,推动档案事业数字化转型和智慧化升级显得重要而迫切。作为在一线奋斗近30年的档案工作者,笔者认为具有强大信息整合能力、自然语言处理能力和多模态交互能力的智能工具ChatGPT深度影响档案事业已经成为必然;ChatGPT将是引起档案事业发展模式嬗变之肇始,是“未来已来”的重要标志。

图片

吉林省档案馆新馆晨曦

ChatGPT给档案工作带来新机遇


ChatGPT是由OpenAI公司于2022年底推出的一款基于深度学习技术的人工智能模型,该模型采用大规模文本语料的无监督训练方式,模拟人类自然语言处理能力,直接根据前文内容,对文本进行编码和解码,自动生成后续文本,是典型的生成式人工智能。

图片

第一,生成式人工智能与档案事业发展需求高度匹配。

一是档案行业可为ChatGPT提供巨量数据。ChatGPT通过对海量的信息进行深度学习,模拟人类的反应做出反馈和回答。档案领域特别适合ChatGPT“训练容量大”“支持多元输出”“专业领域内学习能力更强”等特点,将给ChatGPT等生成式人工智能技术发展和应用提供更广阔的空间。

二是非结构化的档案数据实现智能化管理需要ChatGPT等生成式人工智能技术。ChatGPT具有的非结构化提取、海量信息训练、跨专业跨语言输入输出等特点,能够较好地解决档案智能化管理中的传统难题,能够适应档案材料语言种类繁多、无需进行翻译处理,能够全面充分地抽取档案中蕴含的历史、文化、政治、经济、对外交流等各方面信息,降低档案馆等文化机构在档案、整理、数字化、分类、索引和智能化处理等工作强度,提高档案资料的管理水平和利用效率,最大化发掘其中的知识价值。

第二,ChatGPT在档案领域的应用方向。

笔者认为,ChatGPT在档案领域的应用主要体现在六个方面。

一是可以助力档案信息智能检索。ChatGPT具备去伪存真、去粗取精的加工和汇总能力,可以通过对话不断修正、聚焦、锁定,根据查询语句和档案记录之间的相似度,匹配最佳的档案记录给用户利用。可以解决“搜不准、搜不到、搜不好”的问题,从而提高档案检索效率和实际效果。

二是可以创新档案编研模式。传统的档案编研是以编研人员对档案资料内容的熟练掌握和对某一专业领域的精通为基础的,而档案资料的质量和数量又从客观上制约着档案编研成果的质量。以吉林省档案馆馆藏的日本侵华档案为例,吉林省档案馆馆藏日本侵华时期档案10万余卷(件),真实地记录了日本帝国主义对华的侵略活动,是揭露日本军国主义罪行的铁证,但由于日军为销毁侵略罪证而对档案采取的焚烧、填埋等破坏手段,目前仍有部分档案内容残缺或者不成体系,导致档案编研人员无法完整还原侵华日军的罪行,成为难以产生编研成果的“孤品”和“孤证”。ChatGPT的应用将会大幅度还原日本侵华的种种罪行,产生大量无可辩驳的编研成果,对纪念中华民族和世界反法西斯胜利具有重大意义。

三是可以深度挖掘海量档案潜在价值。档案部门借助ChatGPT不仅能够大量节约人力,而且能够通过系统对比档案内容形成新发现,发现海量档案信息间的共性或紧密关联,为深入研究提供新的切入点和灵感。

图片

四是可以提高政府信息公开和资源共享水平。群众申请公开政府信息,需要到制作或获取该政府信息的行政机关进行申请,并需要提供该政府信息的名称、文号或者其他特征性描述。通过引入ChatGPT等生成式人工智能技术,将有效化解上述问题,提高政府信息公开和资源共享水平,为政府与民众沟通开辟新的智能界面。

五是可以辅助档案开放审核。数量庞大的馆藏档案数据开放审核是档案共享利用的重要基础。传统的开放审核主要依靠档案管理人员长年累积的划控经验,审核标准具有一定的主观性。ChatGPT等生成式人工智能的技术特点,能够有效解决长期制约馆藏档案开放的基础性业务瓶颈问题,取代简单和重复的公共部门工作。

六是可以增加档案知识趣味和文化魅力。ChatGPT能够助力档案宣传,讲好档案故事,能够为档案工作营造良好环境。通过对大量的档案文本和相关图片进行处理和分析,从档案材料中提取相关的知识和信息,发掘出充满生机活力的有趣的档案故事,档案的中国精神、民族情感、人生哲理,更容易引起人们的情感共鸣,通过形象打动人,通过情感感染人,通过道理影响人,通过作用带动人,引导社会各界和人民群众参与档案事业,充分发挥档案工作存史、资政、育人的重要作用。

图片


生成式人工智能应用于档案领域存在的风险


ChatGPT发布以来,全球竞逐AI赛道。然而,生成式人工智能技术引发的争议也越来越多,当前,人们对ChatGPT担忧主要有四个方面。信息安全问题。当前的ChatGPT由国际金融大资本支持的跨国高科技企业所研发,对我国来说存在巨大的技术“黑箱”。网络犯罪问题。ChatGPT可能被不法分子恶意使用,对开放性公共平台的登录页面进行修改,从而肆意地进行网络犯罪行为。侵犯隐私问题。ChatGPT需要使用大量的文本数据进行训练和处理,如果数据泄露或被恶意利用,将会对个人隐私造成威胁。知识产权问题。ChatGPT抓取大量受著作权法保护的第三方文字作品内容投入数据库作为训练素材,将触及著作权侵权、挖掘行为授权、二次创作许可等问题。

档案工作者拥抱生成式人工智能技术的对策建议


我们应当以理性的眼光看待科技的进步,发展机遇和风险挑战并存,主动做好的应对防范措施。档案部门应积极接受突破性技术的赋能,推动档案事业发展智能化发展。

第一,高举旗帜,努力践行习近平新时代中国特色社会主义思想,推动档案事业高质量发展。做好新时代档案工作,关键是要深学细悟习近平新时代中国特色社会主义思想的核心要义、精神实质、丰富内涵和实践要求,及习近平总书记关于档案工作重要指示批示精神,做到了然于胸、融会贯通,坚定历史自信,把握历史主动,强化历史担当,牢牢锚定“国之大者”,把政治标准放在首位,坚持党管档案的原则,不断提高政治判断力、政治领悟力、政治执行力,守正创新、真抓实干,不断提高解决问题、化解矛盾、深化改革、推动发展能力,为党和国家事业发展做出积极贡献。

第二,开放包容,积极主动探索ChatGPT等生成式人工智能技术在档案领域的应用实践,实现档案事业发展现代化。一是应对“黑箱”,把握科技自主,维护国家安全。二是争取试点,主动掌握和运用档案领域专用生成式人工智能工具。三是加快数字档案馆建设,为迎接生成式人工智能技术奠定坚实基础。四是转变角色,遵循“人机协同”发展原则,探索和制订档案数字化管理的标准化培训规范,全面系统提升档案工作人员的智能科技素养。

image.png

Copyright © 2021~2024 All Rights Reserved.上海民桥精密科学仪器有限公司  备案号:沪ICP备2021025372号-1   法律声明  
在线客服
联系方式

公司传真

021-6608 2117

公司电话

021-6608 2110

上班时间

周一~周五

微信公众号
线