English
凯华数字档案及分布系统

档案是社会信息资源的重要组成部分。随着社会的飞速发展,档案馆的馆藏数量急剧增长,馆藏内容日益丰富,人们对档案资源的需求也越来越多样化。人们要求突破一个档案馆的界限,突破时间和空间的限制,按照自己的需要,寻求同类信息的组合。因此,采用现代化的档案管理模式,实现档案信息收集、整理和开发利用的数字化符合档案管理的发展需要。

    系统设计原则

    凯华数字档案及分布系统的设计要遵循可靠性与安全性、准确性与高效性、分布性与交互性的原则:

    • 与原有数字化资源无缝整合
    • 数字档案信息描述问题
    • 基于数据网格的海量数据分布式存储和管理

      分布式是海量数字档案文件在物理上的特征,而共享是其存储系统在逻辑上的要求。为了解决海量档案数据分布式的存储、传输和访问的问题,通过与传统分布式存储系统解决方案SAN和新兴的数据网格技术的比较,数据网格的自相似性、异构性、动态性和可扩展性更能满足分布式数字档案馆对于安全性、高性能、兼容性、可扩展性和经济性的要求,因此本系统选择了基于数据网格的分布式存储技术。在数据网格环境下实现两方面的设计:

      • 分布式文件系统的存储和管理;
      • 分布式数据库系统的设计。

    • 基于服务网格的高效率分布式检索系统的设计实现

      档案检索是数字档案馆的核心服务之一,要取得良好的档案信息检索效果,必须要有科学、合理的信息存储技术和检索系统的支持。对于分布式检索系统以面向服务为中心,采用开放网格服务体系结构(OGSA),通过分布式的全文检索系统和分布式的元数据检索系统实现。

    • 系统安全性和稳定性
    • 档案访问安全性与高效性
    系统功能及特点
    • 基于网格的分布式数据库系统架构,提供一个可扩展的网络应用系统,实现数据资源的共享,消除信息孤岛。
    • 基于事务的Two-Phase Commit数据库提交模式保证分布式数据库系统各数据库资源数据的一致性和完整性;
    • 基于WEB SERVICE模式的远程数据库方案方式,实现分布式异构数据库系统的可靠访问;
    • 系统采用模块化的设计思想,基于数据及消息驱动的程序设计方法,支持灵活的系统软件配置,便于系统的扩充及维护。
    • 采用DES及RSA算法对重要的网络传输信息进行数据加密保证数据的传输安全性和排他性;
    • 可靠的数据备份机制,保证系统的数据安全性和可恢复性,系统确保数据库服务器意外失效或磁盘库失效的情况下数据的恢复能力;
    • 实现对数字化的档案原文信息嵌入电子水印标示,保证档案原文数据的真实性及知识产权;
    • 实现数字化采集设备的软件驱动和操作,对数字化设备的数据获取完全由软件实现,实现数据获取→数据压缩→数据分类→数据入库→数据显示的自动化;
    • 提供对非规则档案纸张的数字化处理功能(不便于采用扫描仪处理的档案),确保在不损坏档案原始资料的情况下实现档案资料的快速数字化。并对图像提供边缘裁剪功能,保证档案图像的准确性,剔除非相关图像边缘;
    • 档案的数字化采集、处理、存储、归档、组织、发布、利用全过程的计算机化闭环管理,提供全中文方式的图形界面,建立友好的人机交互方式;
    • 提供在数据采集过程中的多种参数设置功能,如图像的自动旋转、图像的缩放比例、图像存储压缩比例等。
    • 丰富的图像处理功能,系统提供对档案原文图像的多种图像处理操作,如图像的镜像、明暗度调整、图像的锐化等;
    • 提供基于主题词的全文检索功能;
    • 操作管理的安全性,严格的用户权限管理体系保证系统的可靠使用,系统管理员可方便地对操作人员的使用权限进行设置,系统自动记录操作人员的登录日志。