今年的《政府工作报告》将“大力推进现代化产业体系建设,加快发展新质生产力”列为2024年政府工作十大任务之首。发展新质生产力是推动高质量发展的内在要求和重要着力点。依托前沿技术的革命性突破,对劳动者、劳动资料、劳动对象进行系统性、创新性配置和优化组合,能够提升全要素生产率,催生新产业、新模式、新动能,从而推进传统生产力跃升,支持高质量发展和社会主义现代化建设。
新质生产力的“新”主要体现在生产力基本要素的革新,可拆解为具有善用现代技术、知识快速迭代能力的新劳动者,数据等新型生产要素和新劳动对象,人工智能、虚拟现实和增强现实设备等新劳动工具,适应科技创新新需求的新型基础设施。
运用数字人文理念和技术活化档案数据,既适应新质生产力发展的要求,也为推动新质生产力发展提供有力支撑。
就劳动对象来看,档案数据涵盖历史、文化、艺术、科学等方面的记录,具有广源性、累积性和扩展性等特征,可提供真实完整的数据资源作为新质生产力的生产要素。
就劳动工具来看,数字人文是信息技术和人文学科深度融合的新兴领域,计算机技术思维、数据量化思维推动人文社会科学领域数字资源的知识化建设,为解决人文研究问题提供知识服务。关联数据、数据挖掘、数据可视化等数字人文技术可为挖掘档案数据的知识价值提供有效工具。
就基础设施来看,传统档案数据化以及原生数字资源存档形成的海量档案数据得到整合与关联,逐步推动全景式资源库建设。开放互联的资源库为档案数据共建共享提供基础设施。
蕴含着知识价值的档案数据、数字人文工具、档案资源库以及掌握数字人文技术的档案资源开发者这4个要素优化组合、共同作用,建立档案数据资源体系,供给高质量数据要素,基于价值挖掘方法释放档案价值,创新档案信息服务方式衍生新型业态,进而驱动新质生产力的形成。
一、利用关联数据进行整合 形成档案数据全景
建设可持续、跨机构、跨领域、开放性的数据基础设施,是文化记忆机构和数字人文领域的共识和发展方向。
在推动新质生产力发展的背景下,数字经济蓬勃发展、数智技术取得革命性突破,这些变革催生海量原生档案资源,并带动档案领域数字化、数据化转型,形成了更多数据态档案资源。
而只有经过筛选、序化和描述,将散乱、多模态的档案数据按照一定的逻辑结构组织成有序化、结构化、系统化的资源体系,才能够快捷精准地获取数据,支持深入地挖掘与开发。
建设全景式资源库,建立档案数据的关联关系,成为档案领域借力数字人文开展档案挖掘工作的重要一环。
从内容上看,有“一内一外”两个面向。
一方面,做好国内各级各类档案机构档案数据资源的整合。通过采集、识别、著录、标引、关联等处理环节,将分散的档案数据整合成资源集成的数据库或语义关联的知识库,从而突破传统物理空间的属地化、层级化保管格局,促进档案数据的整合与共享,真正满足知识服务的需要。如,上海交通大学开发的中国地方历史文献数据库收录了来自浙江、安徽、江西、福建等地的地方历史文献,以地域为连接点形成关联,并从内容特征、物理特征、身份识别特征3个方面标引元数据,提供多元检索和全文检索服务。
另一方面,加快我国流散在国外的离散档案资源的“数字回归”。通过移交离散档案数字副本、构建离散档案数据库等方式,实现离散档案以数字形式回归,达到内容信息回归和利用的目的,既维护我国档案数据资源体系的完整性,也为构建完整的民族记忆充实素材。
从技术上看,多维技术应用日趋成熟。如,本体模型将领域关键概念和术语组织成概念体系,在语义层面为来源各异的档案数据提供了组织框架。关联数据技术则将跨机构跨领域的档案数据组织成计算机可读的语义数据网络,在数据标准描述、多维揭示、资源聚合和知识服务等方面展现出巨大潜力等。
全景式资源库是推动新质生产力发展的基础设施,通过实现跨机构、跨领域的互通与共享,为社会公众获取利用、多主体协同开发提供了基础平台。既能促进多主体参与构筑档案数据全景,不断增加资源库的内容数量,又能拓宽开发的思路和方式,带动创新应用链条完善发展,促进开发提质增效,也为和其他领域数据融合应用创造条件,在数据的驱动下推动跨界融合和协同发展。
开放的档案数据平台、协同的开发环境为知识生产创造了无限可能,既扩展了档案数据价值释放的途径,又提升了价值形成的持续性,还为新质生产力的发展提供了新动力。
二、活化档案数据 释放知识价值
档案数据记录历史发展和社会活动的过程信息,凭借其原始记录性为国家和社会提供可靠的信息,不仅具有重要凭证价值,还具有巨大知识价值。
数字人文为档案数据资源提供重构策略。基于“数据识别—数据组织—数据挖掘与呈现”的档案数据价值挖掘模式,运用数字人文技术,将处于信息孤岛的档案数据组织成语义关联的知识网络,能够推动档案内容信息的知识发现和价值洞察。
如,针对档案文本内容,可运用词频分析、共现分析、聚类分析等文本分析方法,绘制档案信息的词云图、关键词共现矩阵、聚类谱系图等,帮助厘清特定档案中的关键信息、内容要义和语词共现关系。
又如,聚焦档案中的“人、地、时、事、物、情感”等记忆要素,运用社会网络分析、地理位置分析、时序分析、情感分析等方法,可梳理人物网络关系、时空演化、情感倾向、事件脉络等,通过对记忆要素的组织与关联,再现记忆场景,阐释记忆内涵和情感取向。
再如,在生成式人工智能的引领下,人工智能技术加速发展,语音识别、图像识别、机器学习等技术支持文本类、声像类多模态档案的内容提取和挖掘日益深入,实现多媒体档案数据的检索与利用。
生成式人工智能的自然语言处理技术还可提高文本类档案数据实体识别和语义关系揭示的效率。可将真实可靠、完整优质的档案数据作为训练语料,抽取档案内容中的事件、内容摘要等,基于预训练模型和抽取内容数据库,实现根据提问自动完成智能语义检索、智能档案编研、智能数据生成等任务,推动档案数据挖掘的效率提升、深度凸显。
可以看出,作为新质生产力劳动工具的数字人文技术,赋能作为劳动对象的档案数据,推动其挖掘重构、知识化、故事化,既创新价值释放方式,又有力推动价值释放,为发展提供参考信息和决策支持。
一方面,数字人文技术从描述、组织与系统化开发等层面突出了档案数据的知识价值,创新其价值释放方式。通过可获取的途径,传递可理解的档案数据资源,能够降低档案信息获取成本,提供数据资源以支持提高全社会创新效率,加速推动新质生产力发展。
另一方面,档案数据中潜藏的知识得到充分挖掘与释放。如,提炼蕴含在档案中的生产方式、技术发展、创新成果等方面的经验或规律,为新质生产力发展提供借鉴与启示,为决策提供依据,有助于优化资源配置,激发创新思维,推动科技进步。
三、创新档案信息服务方式 推动文化服务业态升级
档案数据只有通过知识服务的方式向社会提供利用,才能够真正释放其价值,让其活起来。培育新质生产力的环境下,社会公众的数据意识不断提升,信息需求呈现出多元化、个性化、精细化特点。基于高质量的档案数据,开发档案数据类产品和服务,成为满足公众日益升级的信息需求的重要途径。
数字人文技术,如可视化技术、虚拟现实技术、沉浸式体验等的发展,为档案数据的服务方式注入新活力,在挖掘内容深度和强化知识属性的同时,兼顾形式的多样性、互动性和可体验性。
数字人文环境下档案数据价值释放的方式有:建设主题数字平台、制作可视化展示项目、设计互动式档案游戏和历史场景虚拟重现等。
档案数字平台。挖掘档案的隐性关系提供资源的关联访问,从外部特征的分类聚类逐渐发展为基于语义的连接整合。
可视化项目。以可视化的方式统一展示多源异构的档案数据,如时间轴、地理信息系统、社会关系网络等,促进档案价值的发现。上海图书馆开发了盛宣怀档案知识库,根据其日记、文稿、信札、电报等记录中的共现关系,绘制可根据时间轴调整的人物关系图,展现不同时期的人物社交网络,便是典型例证。
档案游戏。融入大量互动形式开展沉浸式教育,传播档案知识,因其引人入胜的故事情节和交互体验而提高公众参与的积极性。如,苏州中国丝绸档案馆打造了“第七档案室”IP,融红色历史、档案知识、解谜游戏等内容为一体,开发了解谜书、大型实景解谜活动、互动密室、剧本杀等剧情联动、类型多样、系列互补的档案游戏。
历史场景虚拟重现。基于多模态档案记忆资源的沉浸式体验,借助VR、数字孪生等技术对历史空间或历史场景进行虚拟复原,拓宽了档案利用服务的深度与广度,带给用户身临其境的历史场景感。如,《古籍寻游记》系列VR纪录片之《居延汉简》,以居延汉简的相关史料、考古遗存等为依托,利用6DoF交互技术、三维重建及视频扫描技术,构建汉代边塞场景,设计劈柴、射击、喂猪等交互动作,再现档案文献中记载的边塞生活面貌以及将士保家卫国经历。
历史场景虚拟重现的方式塑造沉浸式的档案数据呈现空间,再现历史场景,还原档案生成背景或内容背景,融入趣味互动体验表达档案内容知识,激活多感官体验,强化具身认知,破除平面化数据呈现存在的互动壁垒和理解阻碍,推动档案知识理解和价值传播。
数字人文技术创新档案数据呈现形式,推动档案数据从可识别可理解发展为可感知可体验,促进档案数据价值释放。
其一,档案信息服务方式的延展满足社会公众日益增长的多样化信息需求。依托用户行为、用户画像、用户偏好等数据要素,借助大数据技术深化对用户需求的理解,促进生产端与消费端的匹配,提高整个产业链的生产效率。同时,刺激公众扩大对档案数据知识服务的需求,倒逼档案机构不断提高生产效率、优化服务水平,供给高质量的档案信息产品和服务,推动档案领域实现新质生产力的发展。
其二,档案信息服务方式的创新激发文化服务行业新产业新业态的涌现。借助人工智能等技术,推动编研、展览等传统的档案信息服务产品转型升级,向沉浸性、互动性、知识性的服务类体验类产品创新发展。同时,注重文化内涵和情感体验的传播,提高档案信息服务产品的附加值,培育强大的生产力潜能,推动新质生产力发展。
数字人文赋能之下,档案数据的组织、开发和服务朝着知识化方向深入发展。在档案数据的活化开发中,形成了致力于知识服务的问题导向和借力数字技术的数据导向思维。通过构筑语义关联的档案数据全景、挖掘档案数据中的隐性知识和价值、创新兼具知识性和体验性的档案信息服务方式,档案数据的知识价值得到充分呈现和阐释,既为新质生产力的发展提供高质量的数据基础和知识支撑,也通过数据驱动、技术引领、效率提升、服务升级为新质生产力的发展创造新的驱动力。