互操作聯(lián)邦數(shù)字圖書(shū)館研究
【內(nèi)容提要】未來(lái)的圖書(shū)館將是聯(lián)邦數(shù)字圖書(shū)館,其目標(biāo)是向用戶提供一個(gè)將異構(gòu)、分布信息源無(wú)縫集成的視圖,實(shí)現(xiàn)對(duì)數(shù)字圖書(shū)館資源的透明訪問(wèn)。文中首先介紹了研究數(shù)字圖書(shū)館互操作的必要性,在此基礎(chǔ)上重點(diǎn)分析討論了聯(lián)邦數(shù)字圖書(shū)館的實(shí)現(xiàn)方法,并對(duì)當(dāng)前具有代表性的互操作聯(lián)邦數(shù)字圖書(shū)館的研究進(jìn)行了綜述討論,最后簡(jiǎn)單討論了目前建立互操作聯(lián)邦數(shù)字圖書(shū)館所面臨的挑戰(zhàn)及進(jìn)一步研究和解決的問(wèn)題。【摘 要 題】專題探討……
1 研究數(shù)字圖書(shū)館互操作的必要性
隨著在線數(shù)字圖書(shū)館(DLs)的日益增多,人們發(fā)現(xiàn)必須訪問(wèn)許多DLs才能找到所需要的資料。由于大多數(shù)DLs是基于數(shù)據(jù)庫(kù)驅(qū)動(dòng)的,現(xiàn)有流行的搜索引擎不能對(duì)其內(nèi)容建立索引。因此,對(duì)于那些需要跨越多個(gè)DLs查找資料的用戶來(lái)說(shuō),搜索引擎不能滿足這種需求。如何將廣泛分布的、異構(gòu)的DLs聯(lián)合起來(lái)向用戶提供統(tǒng)一的服務(wù),即實(shí)現(xiàn)DLs之間的互操作,成為DLs研究與開(kāi)發(fā)所關(guān)注的中心問(wèn)題。
所謂數(shù)字圖書(shū)館的互操作是指交換和共享DLs的文檔、查詢和服務(wù)的能力[1]。它要求來(lái)自技術(shù)(協(xié)議和格式等)、內(nèi)容(元數(shù)據(jù)及其語(yǔ)義等)和組織(DLs的基本訪問(wèn)原則、支付方式和認(rèn)證等)三方面的合作。DLs的互操作可以出現(xiàn)在不同的抽象層次上,我們可以將其概括為兩類視圖[1]:縱向視圖(vertical view)和橫向視圖(horizontal view)。前者涉及法律、社會(huì)、文化和知識(shí)產(chǎn)權(quán)等方面的問(wèn)題,后者涉及DLs的硬件和軟件即體系結(jié)構(gòu)方面的問(wèn)題。
為什么要研究DLs的互操作?道理很簡(jiǎn)單:目前很少有DLs既提供豐富的館藏資源,又提供有效的服務(wù)。盡管目前一些DLs擁有大量的館藏資源,而另外一些DLs卻提供許多的服務(wù),但在這兩種情況下,用戶都不太容易找到其所需要的信息資源。只有在這些DLs之間實(shí)現(xiàn)互操作,才能共享DLs的資源和服務(wù)。因此,研究DLs的互操作是十分必要的。
2 聯(lián)邦數(shù)字圖書(shū)館的實(shí)現(xiàn)方法
為了解決用戶使用DLs查找資料時(shí)同一查詢條件的重復(fù)提交問(wèn)題,人們提出了聯(lián)邦數(shù)字圖書(shū)館的概念。所謂聯(lián)邦數(shù)字圖書(shū)館是指正式或非正式合作操縱DLs的一些組織,它們同意支持一組共同的服務(wù)和標(biāo)準(zhǔn),以便在聯(lián)盟成員之間共享DLs的資源,實(shí)現(xiàn)互操作。聯(lián)邦數(shù)字圖書(shū)館允許跨越不同的DLs執(zhí)行搜索,并將每個(gè)DLs的查詢結(jié)果合并后返回給用戶,使用戶感到如同使用單個(gè)數(shù)字圖書(shū)館一樣。從聯(lián)邦的耦合度考慮,實(shí)現(xiàn)聯(lián)邦數(shù)字圖書(shū)館的方法可分為以下三種:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。
2.1 NCSTRL方法
網(wǎng)上計(jì)算機(jī)科學(xué)技術(shù)報(bào)告圖書(shū)館(NCSTRL)是一個(gè)擁有100多個(gè)機(jī)構(gòu)加盟的聯(lián)邦數(shù)字圖書(shū)館[2],它利用Dienst作為DLs的協(xié)議和體系結(jié)構(gòu)。凡是要求加入NCSTRL的機(jī)構(gòu)需要在本地安裝Dienst服務(wù)器,并按照統(tǒng)一規(guī)定的數(shù)據(jù)格式建立其館藏資源。NCSTRL借助于分布式搜索技術(shù)在聯(lián)盟DLs之間實(shí)現(xiàn)資源共享,它將用戶的查詢送往參與聯(lián)邦的所有DLs上分別執(zhí)行,收集返回的結(jié)果,綜合整理后返回給用戶(圖1)。
附圖
圖1 NCSTRL方法
NCSTRL方法要求所有參與聯(lián)邦的DLs使用相同的協(xié)議或軟件系統(tǒng),因此能夠提供全面的互操作。但緊密的聯(lián)邦必將加重聯(lián)盟成員的負(fù)擔(dān),它們不得不就技術(shù)標(biāo)準(zhǔn)和策略(如知識(shí)產(chǎn)權(quán)準(zhǔn)則、安全和隱私等)達(dá)成一致。從網(wǎng)絡(luò)和搜索系統(tǒng)方面的限制考慮,NCSTRL是昂貴的運(yùn)行模式,因?yàn)橐竺總(gè)聯(lián)盟成員的DLs必須支持復(fù)雜的查詢語(yǔ)言和對(duì)查詢的快速實(shí)時(shí)響應(yīng)。另外,從查詢的頻率、元數(shù)據(jù)的質(zhì)量以及網(wǎng)絡(luò)資源的可用性等方面綜合考慮,這種實(shí)現(xiàn)聯(lián)邦的方法對(duì)聯(lián)盟成員加負(fù)較重。因此,只有那些需求強(qiáng)烈的DLs會(huì)采用這種代價(jià)較高的模式。
[1] [2] [3] [4] [5] [6]