历史档案形成时间久远,具有丰富的史料价值、文物价值与文化价值,其载体的唯一性、不可再生性以及内容中蕴含的历史沉淀,使其成为各级各类档案馆中稀缺的珍贵馆藏和独一无二的展览对象。尤其是历史照片档案,在展览中往往是点睛之笔,使人印象深刻。但历史照片档案随着保存时间的延长,不可避免地经历自然损毁、老化或者人为破坏,档案中留存的信息已经有所缺失,因此在开发利用前有必要对图像进行修复。
现有的图像修复方法主要有两种:一种是传统修复方法,即直接在原件或复制品的纸质照片上通过物理、化学、光学等手段进行人工修复处理,此种方法不仅耗时耗力,而且对于严重破损、模糊、污渍的照片很难恢复如初,同时在处理过程中还存在操作失误、药剂使用不当等造成不可逆的二次损伤的风险。加之修复中预期效果并不可见,修复者主观经验影响较大,把控修复质量有较大的难度。另一种是数字修复方法,通过扫描或摄影将原照片转化为可被计算机识读的数字图像,再利用图像处理技术进行手工的编辑和修复。但当前所用的照片增强算法主要针对互联网图像,与照片档案在图像视觉内容、需增强的视觉元素等方面存在着一定的差异。同时,尽管数字修复方法相对传统方法的效率有所提高,但其在修补、去污等处理过程中仍存在大量的重复性动作,效率有待进一步提高。随着计算机视觉、计算机图形学等人工智能技术的快速发展,数字智能修复技术提供了一种新的途径,可以从速度与精度两个层面优化上述两种修复方法存在的问题。
数字智能修复技术的引用
近年来,数字智能修复技术随着计算机视觉方法的改进而迅速发展。数字智能修复是指通过人工智能技术对老化、受损的数字图像进行智能化处理,最后得到完整清晰的图像。深度学习技术使得计算机能够像人一样具有分析学习的能力,在智能修复领域能够弥补传统图像修复技术在纹理结构和语义内容上修复的缺陷,可以较好地提取图像的语义特征,使得修复的结果可以达到人类视觉满意的效果。
数字智能修复技术可以对低分辨率的图像进行超分辨率处理,对模糊的图像进行去模糊操作,对残缺的图像进行补全以及对黑白照片进行上色操作。其采用的常用方法包括:超分辨率方法,即将一幅低分辨率图像恢复为高分辨率图像,基于深度学习的超分辨方法利用了上采样网络来提升图像的分辨率,克服了传统方法不连续性和未考虑相邻像素的问题;图像的去模糊操作,即将模糊的图像变清晰,可以采用基于“编码器—解码器”模型的结构恢复图像,其中编码器用来提取图像的视觉特征,解码器还原生成清晰图像;图像补全,是指对图像中缺失的部分进行合理的内容填充,可以采用基于注意力机制的模型为缺失区域寻找最相似的特征块进行特征匹配,从而有效地提升图像纹理细节和语义的修复效果;黑白照片上色,即将黑白的老照片颜色还原,可以使用生成对抗网络(由生成器和判别器构成)进行颜色的生成,其中生成器主要用于视觉内容的生成,判别器用于判断生成内容接近真实内容的程度。
数字智能修复的总体流程如图1所示,其中主要包括电子扫描、数据处理、模型预测及审核纠正4个步骤:
1.电子扫描:利用图像扫描技术、数字摄影技术将受损的图像转化为可被计算机读取的数字图像。
2.数据处理:对获取的数字图像进行预处理,包括对受损的图像进行归类、过滤不符合要求的数据、数据格式的转化以及对图像分辨率的调整等操作。
3.模型预测:根据受损图像的类型(低分辨率、有噪声、有残缺、模糊、淡化)选择不同的智能修复模型,利用修复模型对受损的图像进行预测,生成得到清晰完整的图像。
4.审核纠正:采用人机交互的方式,对模型生成的图像进行审核,对不符合要求的图像或图像区域进行调整和纠正。
数字智能修复流程图
数字智能修复的具体应用
历史档案因其时代因素与内容特质具有独特的展览价值,且从传播的角度来看,图像形式更加形象直观,视觉冲击力更强,展示效果更好,因此历史档案在展览中多以图像形式出现。但是在实地调研中发现,受限于历史照片档案和纸质档案本身的质量状况,展览中的照片档案还存在清晰度不高、数字化成果分辨率较低等问题,因此笔者将分析数字智能修复在上述两种情况下的具体应用。
面向历史照片档案的图像增强与恢复。主要做法是通过将块匹配思想引入图像特征空间,在注意力机制的引导下为缺失区域寻找最相似的特征块进行特征匹配,以此指导图像特征图的补全。同时,基于生成对抗网络的总体思路,通过输入不同的真实图像可以得到不同的修复图像,通过生成对抗网络的判别器评估和多个损失的综合得分排名返回修复效果最好的图像。
从当前的展览中看,不乏存在如名人肖像、集体合影等历史照片档案清晰度不高、细节模糊缺失等问题,一定程度上影响了参观者的体验。而数字智能修复结合基于生成对抗网络、注意力机制等技术方法,可以有效提升图像纹理细节和语义的
修复效果,同时提高图像修复的真实性和客观一致性,能够有效解决上述痛点。图2所示为张之洞(中)与三江师范学堂官员在开学典礼上的合影,修复前模糊不清,修复后的历史照片档案能够满足人们对张之洞等人面容形象的基本认知需求,同时能清晰地呈现重要历史建筑、重要历史人物、重要历史事件等的细节风貌,在提升用户体验感的同时也能激励参观者,更好地发挥档案的育人作用。
图像增强与恢复效果图
面向扫描数字化成果的图像分辨率提升。主要做法是采用级联神经网络来进行纸质档案扫描件的图像分辨率提升处理。级联神经网络包含多个网络结构相同的子网络,各子网络分别以一个较小的倍数对输入图像进行超分辨率处理,最终多个级联的神经网络对原始输入图像以一个较大的倍数进行放大。
展览中的很多历史档案是通过对实体进行扫描等数字化处理,展出的是数字化成果。但是由于档案形成时间久远,本身存在一些字迹模糊、褪色的问题,扫描后的图像依然分辨率不高,低分辨率图像中文本的形状和轮廓经常是模糊的。图3所示为张之洞创建三江师范学堂的奏折,在处理前模糊不清影响阅读,而通过上述数字智能修复技术方法处理后,可以达到高清图像的视觉效果。此类图像分辨率提升处理技术尤其适合修复文本型的纸质历史档案,即先对纸质历史档案数字化,再利用数字智能修复技术提升数字化成果的分辨率,在保护原件的同时还原文字内容,以高清的修复效果满足档案同行、史学家及爱好者等群体对珍贵档案的研究利用需求,有利于充分发挥历史档案的学术与文化价值。
图像分辨率提升效果图
数字智能修复的优势
修复技术契合需求。数字智能修复技术结合了现有的图像修复方法,采用模型内部优化模式,能够实现纹理一致、结构连贯、语义明确的高质量图像修复,同时专门针对档案数据进行相应的优化,更加契合档案领域的修复需求,如上述应用中所提到的展览需求。
修复效率大幅提升。数字智能修复技术能够省去大量重复性动作,上传后仅需对模型生成的图像进行审核,相较传统方法和Photoshop等数字方法效率更高,尤其在待修复照片档案多、时间紧迫的情况下优势更加突出。
修复范围全面覆盖。数字智能修复技术运用目前的基于深度学习的技术,可修复范围包括照片破损、撕裂、污染物遮盖、淡化、折痕、划痕等。
修复质量精准可控。数字智能修复可预览修复效果,只需调整预设参数就可实现客观精准地修复,不仅能够将原始照片还原到初始状态,还能呈现出较原件质量更清楚的影像。
修复过程安全可逆。数字智能修复技术的对象是数字化成果,避免了在照片档案原件上修复带来的二次损伤风险,而且修复次数无限制,过程可逆,可有效保障档案的安全。
修复成本明显降低。一方面数字智能修复中投入的人力与时间大大减少,另一方面智能修复工作的开展仅需配置电脑等设备,无场地限制,节约了空间成本。