欢迎来到百文图书馆!包月下载,不限IP,随心所欲!

DLs资源的互操作的概念层次及问题

互操作的目标是为用户提供一致的服务,这些服务最终的作用对象是由不同组织管理的、采用不同技术、异构的分布式系统。这些分布式系统组成的团体称为“联盟”,其中的每个独立的系统称为“成员”。成员的系统中存储的资源从广义上统称为“数据”。数据的存储系统称为“数据库”。为了实现成员之间的“交谈”,需要联盟中所有成员在三个方面达成“共识”:

    (1)技术。包括数据的输出格式,遵守的协议,安全系统等。

    (2)资源内容。包括数据和元数据的语法和语义的定义。

    (3)组织管理。包括数据存储的方法,访问控制、身份认证和计费方法等规定。

    以上三个方面达成的一致性“协议”,对各成员的要求程度不同,最终实现互操作的程度就不同,提供给用户的服务功能也就不同。Wiliam Y. Arms一定义了三种层次的互操作:

    (1)联盟(Federation)

    联盟内部制定一系列的协议和规范,要求所有成员的系统都遵守这些协议,从而基于共同的协议标准容易实现互操作,并能提供功能强大的服务。但对于成员的要求比较高,成员之间关系紧密,所以很难形成大规模的联盟团体。如Z39. 50就实现了这个层次的互操作;

    (2)采集(Harvesting)

    对于联盟成员不要求遵守许多复杂的协议,只需少量的工作就可以实现与其他成员的互操作,所以说是加入联盟的一种低门槛( Low-barrier)的方法。成员之间的关系比较松散,容易形成较大规模的联盟。但这种层次仅能提供一些基本的互操作功能。如OAI ( Open Amhives Initiative)就是基于元数据采集的思想;

    (3)搜集(Gathering

    如果形式上不建立这种正规的联盟,只是通过搜集完全开放的自由访问的网络资源,也可以实现最基本的互操作。不妨把互联网上所有的网站看作一个虚拟的联盟,显然对于成员没有任何要求,但提供互操作的服务质量很差,难以满足需要密切合作的成员的要求。比如互联网上的搜索引擎就属于这个层次。

DLs互操作的必要性:

    数字图书馆资源的互操作是数字化实践发展的需要。数字图书馆的建设的蓬勃发展,造成了两方面的结果:

    一方面,不同组织建设的数字图书馆将侧重于不同的各具特色的信息内容:一是内容交叉重复,影响用户对信息的选择与获取。二是存在冗余信息,多数数据库的资源收录原则是“全”,使得大量使用价值不高的信息进入资源系统,干扰用户对信息的获取,这在人文社科领域尤为明显。三是知识关联程度低,人类知识是一个紧密联系的有机整体,而现有数据资源系统内的数据对象大都是孤立存在的,无法体现学科知识的内在联系。

    另一方面,由于不同组织进行数字图书馆建设的目的、方式、运行手段不同,从而在技术实现上采用的平台、协议、体系结构也各不相同。这些数字图书馆的资源是由分布在异地、异构的信息仓储构成。每个仓储都是一个相对独立的信息空间,具有各自的信息组织方式、处理方式,以不同的查询方式提供

利用,具有不同的权限保护和收费策略。

    数字图书馆资源数量虽呈增长趋势,但因其整体的无序化,内容组织程度不高,数字资源问交叉关联程度较低,用户需要在不同的网络环境之间穿梭漫游,需要在不同的信息空间来回切换,需要掌握不同检索软件的使用方法。从某种意义上讲,数字资源量越大,给用户造成的负担也就越重。如果不对数字资源进行合理有效的整合,必然会使用户陷于不得门径而入的困惑境地,影响着数字资源的有效利用。

    信息社会对数字图书馆的信息检索需求己经从通过分散的网络化检索服务界面获得数字化资源转化为要求更加方便、快捷的单一入口、一次检索、统一提供的集中式信息服务方式。也就是说,读者无需为了比较全面的查找某一专题的资料而浏览多个数字图书馆网站,数字图书馆群将作为一个逻辑上统一的信息资源整体,为用户提供一站式信息服务。这种方式要求各个数字图书馆在保持内部自治的基础上,通过一定的组织方式关联起来,实现高度的资源共享和资源服务的统一管理。面临的问题:

    数字图书馆的互操作是指建立一套资源共享的有效机制,包括:数据交换与通信格式、信息交互协议、资源管理与组织方式、组织原则、用户管理与认证、访问控制等等方面,以便将独立的数字图书馆有机组织起来,协同工作,以统一界面对外提供资源服务。

    由于体系结构和实现技术的差异,数字图书馆系统之间一般不能直接进行数据通信和资源共享,无法建立规整的、一体化的、自底向上的统一信息服务平台,只能通过有针对性的开发标准通信协议和中间层软件,来标准化数字图书馆的对外通信接口以及屏蔽其内部结构。最终将各自为政的资源服务体系“粘和”起来,成为有机的整体。

数字图书馆系统建设面临的主要互操作问题有:

    (1)屏蔽分布的各数字图书馆之间的差别,为用户提供一个一致的检索界面,在该统一界面上进行的跨仓储检索对于用户来说是透明的。

    (2)为数字图书馆系统提供一种灵活的集成机制。这种集成方法必须允许各相对独立的数字图书馆能够自由增加新的服务,或对以前提供的服务进行修改。

    (3)数字图书馆系统服务协议的制定,包括元数据协议、数字对象存储协议、信息搜索协议、付费协议等等。

(4)开发数字图书馆系统高层协议中间件,实现分布的子系统间各项服务的互操作。