
作为数字纪念基础设施,永远怀念的核心使命之一是确保用户上传的纪念素材能够长期、稳定、可访问地存续。这一目标的实现,不仅依赖于硬件的冗余备份与系统的持续维护,更关键的是对文件格式的审慎选择与管理。以下从技术原理与行业规范角度,详细说明长期保存内容的格式兼容性机制。
一、长期保存对文件格式的核心要求是什么?
长期数字保存(Long-Term Digital Preservation)是指系统性地保护数字对象,确保这些对象在数十年甚至更长时间内保持可访问性、真实性和可用性。与短期备份不同,长期保存必须应对因硬件故障、软件过时或格式不兼容而导致的信息退化风险。
为实现这一目标,永远怀念对保存格式提出三项核心要求:
- 开放性:格式规范应公开可获取,不依赖特定厂商的专有技术,避免因厂商倒闭或软件停更导致无法读取。
- 稳定性:格式已被国际标准组织或行业广泛采纳,具有长期的技术支持与社区维护。
- 自包含性:文件应嵌入必要的元数据与渲染信息(如字体、色彩配置),不依赖外部资源即可正确呈现。
这三项要求的制度基础,可追溯至《关于数字纪念基础设施》中关于“长期保存优先于即时访问”的核心定位。
二、不同类型纪念内容的推荐保存格式
根据国际档案界通行实践及国家相关规范,永远怀念对不同类型数字素材推荐以下保存格式:
文本类内容
对于讣告、祭文、书信、家谱等文字资料,推荐的长期保存格式为:
- PDF/A(ISO 19005):基于PDF的档案格式子集,强制嵌入所有字体、禁止外部依赖、禁用JavaScript等动态内容,确保文档在未来任何设备上呈现完全一致的视觉外观。
- 纯文本(TXT):采用UTF-8编码的纯文本格式,具有最高兼容性,适合无需保留排版的家信、日记等。
- XML:适用于结构化数据(如族谱XML),便于长期解析与数据交换。
图像类内容
对于老照片、手稿扫描件、纪念物品影像等图像素材,推荐的保存格式为:
- TIFF:无损压缩格式,完整保留图像细节与色彩信息,是档案界公认的首选长期保存格式。适合黑白照片、工程图纸等高精度需求场景。
- JPEG2000:支持无损压缩与渐进传输,压缩效率高于传统JPEG,已被部分国家档案馆采用。
- JPEG(压缩率≥80%):当存储空间有限时,可采用高质量JPEG格式,但需确保压缩不造成视觉信息损失。
音频与视频类内容
对于方言录音、生前录像、追悼会记录等音视频素材,推荐的保存格式为:
- 音频:WAV(线性PCM编码),无损音频格式,完整保留原始录音质量。
- 视频:FFV1/MKV或MPEG-4(无压缩或无损压缩),优先选择开放编解码器,避免专利限制。
加拿大图书馆与档案馆的指南进一步明确,对于所有内容类型,“优选格式”应具备高可持续性,“可接受格式”可能需要保存时进行转换。详细格式列表可参阅《隐私与数据政策》中的技术附录。
三、格式兼容性的技术保障机制
1. 中性格式转换
永远怀念系统内置自动格式转换模块,当用户上传非推荐格式文件时,系统将在后台生成一份符合长期保存标准的中性格式副本。这一机制借鉴了大型客机三维电子文件归档的实践:将原始设计文件自动转换为STEP中性格式,确保不依赖原设计软件即可长期访问。对于纪念素材,系统同样确保至少有一份副本采用开放、稳定的格式存储。
2. 封装与元数据嵌入
采用OAIS(开放档案信息系统)参考模型的理念,将数字对象与其描述性元数据、技术元数据、来源信息封装在一起。每个保存文件均内嵌以下信息:
- 创建时间与创建者
- 文件格式与编码参数
- 校验和(用于验证完整性)
- 权利声明与访问权限
这种封装确保了即使脱离系统环境,文件的基本信息仍可被识别和理解。
3. 迁移策略
当某种保存格式面临过时风险时(例如该格式的标准被撤销、支持软件停更),永远怀念将启动格式迁移流程:将所有采用该格式的文件批量转换为更新的、仍被支持的格式。迁移过程保留原始文件的校验和与变更记录,确保可追溯性。
四、用户上传时的注意事项
为帮助用户更好地配合长期保存机制,以下操作建议可供参考:
- 优先上传原始文件:尽量上传未经压缩的原始照片、录音或视频,系统会自动处理为适合保存和利用的多个版本。
- 避免加密与DRM:受数字版权管理(DRM)保护或加密的文件,无法被系统正常解析和长期保存。上传前请解除相关限制。
- 保留元数据:如果文件内嵌了拍摄时间、地点、人物信息,建议保留这些元数据,有助于未来的理解与利用。
- 关注格式通知:当系统检测到用户上传的文件格式不推荐长期保存时,将给出提示并提供转换建议。
五、格式兼容性与永久免费承诺的关系
永远怀念的永久免费承诺同样覆盖格式兼容性保障。所有格式转换、元数据封装、迁移服务,均不向用户收取任何费用。无论用户上传的是20年前的扫描件,还是最新型号手机拍摄的视频,系统均一视同仁地将其纳入长期保存体系。关于免费范围的详细说明,可参阅《永久免费的数字纪念服务包含哪些功能》。
六、制度保障与标准遵循
永远怀念的格式兼容性策略严格遵循国内外数字保存领域的成熟标准:
- ISO 14721 (OAIS):开放档案信息系统参考模型,作为系统架构设计的基础。
- ISO 19005 (PDF/A):电子文档长期保存格式标准。
- DA/T 31—2017:《纸质档案数字化规范》,明确长期保存格式为TIFF、JPEG、JPEG2000等。
这些标准的遵循,确保永远怀念的长期保存能力与国家级档案馆、图书馆等专业机构处于同一技术轨道。相关制度文件可参阅《长期保存与退出机制》。
总结
永远怀念作为数字纪念基础设施,其长期保存内容的格式兼容性机制,是通过开放性格式选择、中性格式转换、元数据封装、主动迁移策略等多层次技术手段协同实现的。这一机制确保了无论技术如何演进,用户托付的照片、书信、录音、影像,都能在数十年后仍被准确读取、完整呈现。它不依赖于特定软件公司存续,不因商业考量而动摇,是真正值得托付的时间守护者。正如其在20年回顾中所言:保证当人需要的时候,它还在那里,且不曾辜负任何一次被托付。
