返回
热门搜索

网页档案信息长期保存的策略

IT博客 运维技术 运维 点击量 603

基本信息 收藏 - 举报 - 海报

详细介绍

       网页档案信息长期保存的策略。从国内外网页档案长期保存的项目来看,其多为公益性项目,同时大部分的项目都是在政府部门的支持下由多个部门联合参与或者举办的,如国家档案馆、高校、网络中心或者信息中心、商业部门和公益性机构。如澳大利亚的数字档案PANDORA项目和我国的“中国Web信息博物馆”项目,都是由图书馆、档案馆和高校联合参与的。基于网页采集的动态变化性和多样性等特点,仅有档案馆或者图书馆单独承担这类大项目是不现实的,因此必须鼓励多方力量共同参与到网页长期保存中。具体来说,就是要做好职能划分和利益分配的工作。首先,参与单位可以在法律允许的范围内对网页档案信息资源进行合理的利用,如图书馆和档案馆可以利用网页资源进行档案服务的深度开发与加工。其次,网页档案采集工作对技术的依赖性较高,因此还要支持和鼓励互联网企业或者信息技术企业参与到项目中,为采集项目提供技术上的支持。最后,还要不断丰富采集项目的资金来源,利用项目众筹和社会募捐等非政府拨款方式募集资金,为采集项目提供更多的资金支持。

       当前网页档案信息的主要采集策略有两种,分别是完全性采集策略和部分性采集策略。完全性收集策略是指对网页的所有信息进行收集。目前,瑞典、奥地利和美国的多个网页档案保存项目采用了完全性采集策略。完全性采集策略的优势在于不需要人工对网页内容进行判断和复制,而是完全由机器完成这一操作,因此其成本较低。对于小型的、资金较为缺乏的档案管理部门,可适当地选择完全性收集策略,但需要注意对信息进行过滤。内容结构和类型较为单一的网站可通过设置关键词对无用信息进行过滤,同时建立定期的人工审核机制。

       部分性采集策略是指有选择地对网页的某个类型或者学科的内容进行收集,因此其内容的专业性较强,主题也十分鲜明。与完全性采集策略不同的是,部分性采集以价值判断为基础,通过制定完善的采集标准限定采集的内容,因此标准是否合理就成为部分性采集是否成功的决定性因素。对此,档案管理部门在选择部分性采集策略时,应充分考虑到网页档案信息的动态变化性,对网页信息实行动态监控,并及时调整采集策略,不断提高网页采集的覆盖率。

没有更多内容。

用户评价(0)

好评度100%
  • 还没有人评论此条信息!
+ 加载更多

联系方式

提示:联系我时,请说明在巅云php学苑看到的,谢谢!
  • 联系人:
  • 地  区:
  • 电  话: 共发布信息(2004)条 所在地:未填写
看了又看
加载中
首页 首页 收藏 收藏

电话联系