大學(xué)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究論文
摘要:本文簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門管理中,幫助圖書館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進(jìn)圖書館事業(yè)的創(chuàng)新與發(fā)展。
關(guān)鍵詞:高校圖書館;數(shù)據(jù)挖掘;創(chuàng)新;發(fā)展。
隨著網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)的快速發(fā)展,高校圖書館事業(yè)也順應(yīng)時(shí)變,不斷向高科技、高水平領(lǐng)域進(jìn)展,尤其是當(dāng)今處于數(shù)字信息發(fā)展的時(shí)代。如果利用圖書館現(xiàn)有以及收集的數(shù)據(jù)資源,通過數(shù)據(jù)挖掘技術(shù)來分析、篩選對(duì)圖書館有用的數(shù)據(jù)信息,依據(jù)提煉的數(shù)據(jù)資源來指導(dǎo)、推進(jìn)圖書館事業(yè)的創(chuàng)新與發(fā)展,是當(dāng)今信息時(shí)代圖書館亟待研究、探討的一個(gè)問題。本文將簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門管理之中,幫助圖書館管理者依據(jù)數(shù)據(jù)挖掘技術(shù)更好地為讀者提供科學(xué)化和人性化的服務(wù),促進(jìn)圖書館的事業(yè)創(chuàng)新與發(fā)展。
一、數(shù)據(jù)挖掘技術(shù)綜述。
數(shù)據(jù)挖掘定義。數(shù)據(jù)挖掘(Data Mining,DM)是一種新的信息處理技術(shù),其主要特點(diǎn)是對(duì)單位、企業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換分析和其他模型化處理,以從中提取輔助管理決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過程。換句話說,數(shù)據(jù)挖掘技術(shù)就是從收集的大量、繁雜的數(shù)據(jù)中挖掘出其隱含的、未知的、對(duì)決策有潛在價(jià)值的關(guān)系、模式和趨勢(shì),并用這些知識(shí)和規(guī)則建立用于決策支持的模型,提供預(yù)測(cè)性決策支持的方法、工具和過程。
數(shù)據(jù)挖掘的意義。在當(dāng)今的競(jìng)爭(zhēng)時(shí)代社會(huì)中,隨著計(jì)算機(jī)的飛速發(fā)展,計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理能力、內(nèi)存儲(chǔ)存容量和網(wǎng)絡(luò)寬帶等價(jià)格的持續(xù)快速下降,因此大型的數(shù)據(jù)分析、提取技術(shù)不再是一個(gè)障礙。面對(duì)圖書館每天接收的龐大數(shù)據(jù)源,管理者必須學(xué)會(huì)從所擁有的大量數(shù)據(jù)信息源中提取并利用隱含在這些數(shù)據(jù)中的有用價(jià)值以及有用新信息,從而獲取對(duì)圖書館事業(yè)研究領(lǐng)域的本質(zhì)認(rèn)知和未來認(rèn)知,幫助圖書館管理者從傳統(tǒng)的經(jīng)驗(yàn)管理、主觀管理提升為理性管理和科學(xué)管理。
數(shù)據(jù)挖掘的應(yīng)用分類。目前較常用的一般有分類與回歸、關(guān)聯(lián)規(guī)則、聚類分析、時(shí)序模式等。
二、數(shù)據(jù)挖掘技術(shù)對(duì)圖書館事業(yè)創(chuàng)新與發(fā)展的影響。
面對(duì)大量數(shù)據(jù),如何去存儲(chǔ)和收集數(shù)據(jù),如何利用數(shù)據(jù)挖掘技術(shù)將圖書館海量信息數(shù)據(jù)中提取供管理者決策的有價(jià)值的數(shù)據(jù),提取并利用隱藏在這些數(shù)據(jù)中的有用知識(shí)的能力變得越來越重要。運(yùn)用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中獲得有用的知識(shí),這在圖書館管理方面顯得尤為重要,本文將簡(jiǎn)述如何將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館各部門工作,為今后各部門的創(chuàng)新與發(fā)展提供策略分析。
流通部門。流通部門作為圖書館的一線服務(wù)崗位,對(duì)圖書館功能的發(fā)揮起著舉足輕重的作用。作為窗口形象崗位,直接體現(xiàn)了圖書館的整體工作狀態(tài)。
要實(shí)現(xiàn)從以往的經(jīng)驗(yàn)管理、主觀管理提升為科學(xué)管理和理性管理,數(shù)據(jù)挖掘技術(shù)將利用現(xiàn)代技術(shù)展現(xiàn)其獨(dú)天得厚的優(yōu)勢(shì)。圖書館每天都會(huì)產(chǎn)生大量的圖書流通數(shù)據(jù),這些數(shù)據(jù)包含進(jìn)、出館讀者人數(shù),借、還書數(shù)量,檢索查詢次數(shù)以及網(wǎng)上咨詢等大量繁雜的數(shù)據(jù)。在流通部門最為常用的數(shù)據(jù)就是借書、還書量,通過借書、還書數(shù)據(jù)的統(tǒng)計(jì),可獲取讀者信息行為、借閱書興趣導(dǎo)向,充分利用數(shù)據(jù)挖掘技術(shù)如關(guān)聯(lián)規(guī)則、分類、聚類、時(shí)間序列分析等,對(duì)圖書館蘊(yùn)含的大量豐富的用戶行為進(jìn)行建模,從而挖掘出有用的或有興趣的信息和知識(shí)。如可利用這些有價(jià)值的信息,借鑒“啤酒與尿布”的經(jīng)典商業(yè)案例,嘗試在流通部開辟一塊試驗(yàn)田地――搭檔書架,即通過借、還書數(shù)據(jù)挖掘,將讀者感興趣、組合搭檔頻率高的書籍挑選出來,開辟一塊搭檔書架,方便讀者在借用專業(yè)書籍的同時(shí)順便也借閱自己感興趣的圖書,既學(xué)習(xí)了自己的專業(yè)知識(shí),同時(shí)也順便閱讀了自己感興趣的書籍,充分實(shí)現(xiàn)了圖書館“第二課堂”的育人價(jià)值。
采編部門。傳統(tǒng)的采編部門在采集書籍時(shí)大多數(shù)情況是依據(jù)采集經(jīng)驗(yàn)或是依據(jù)各院系、讀者反饋的需求書籍進(jìn)行征訂。大部分購買的圖書還是比較適合讀者所用的,但也會(huì)存在一些盲目性,有時(shí)會(huì)造成采集的偏差,這是采編部門一直比較困惑的問題。如何既將購書經(jīng)費(fèi)合理利用好,同時(shí)又能滿足讀者借閱所需,是采編部門長期探索、研究的問題。如果將數(shù)據(jù)挖掘技術(shù)運(yùn)用到采編部門,通過一線的文獻(xiàn)借閱數(shù)據(jù),分析、挖掘、提煉讀者借、還書的信息量,且一直追蹤這些信息數(shù)源的變化,即可獲得可被部門利用的有價(jià)值數(shù)據(jù),并匯總出讀者借、還書的規(guī)律。依據(jù)這些一線信息數(shù)源的價(jià)值,加之網(wǎng)上薦購及讀者書面薦購等信息,匯總出哪些是讀者專業(yè)常用書籍,哪些是讀者感興趣的書籍,哪些又是常年被冷落的書籍,從中提煉出書籍采集的方向;合理化的采集方案繼續(xù)延用,不合理的采集要進(jìn)行科學(xué)化的數(shù)據(jù)分析,及時(shí)理清思路,盡可能做到書籍采集的合理化、科學(xué)化。
技術(shù)部門。在信息飛速發(fā)展的時(shí)代,作為圖書館負(fù)責(zé)信息網(wǎng)絡(luò)技術(shù)的部門,其肩上的重量顯得格外沉重。技術(shù)部門不但肩負(fù)著網(wǎng)絡(luò)技術(shù)的責(zé)任,當(dāng)今也要肩負(fù)起圖書館所有數(shù)據(jù)的收集、存儲(chǔ)、挖掘及分析技術(shù)。數(shù)據(jù)挖掘及分析技術(shù)在技術(shù)部十分重要,技術(shù)部應(yīng)將圖書館各部門所產(chǎn)生的相關(guān)數(shù)據(jù)進(jìn)行長期性、系統(tǒng)性的收集和科學(xué)分析,并將研究數(shù)據(jù)的挖掘及分析作為當(dāng)前和今后技術(shù)部研究及發(fā)展的方向,承擔(dān)起“數(shù)據(jù)監(jiān)護(hù)員”的角色,通過實(shí)踐為圖書館提供數(shù)據(jù)監(jiān)護(hù)操作技能及策略。注意將可獲得的數(shù)據(jù)及時(shí)進(jìn)行收集,并通過收集數(shù)據(jù)使用案例,分析并總結(jié)用戶需求及使用規(guī)律,為數(shù)據(jù)監(jiān)護(hù)提供基礎(chǔ)資料。
學(xué)科部門。學(xué)科部門作為一個(gè)新興的部門,目前已在全國各高校圖書館廣泛推廣運(yùn)用。學(xué)科館員的主要任務(wù)是派專人與對(duì)口院系或?qū)W科專業(yè)搭建合作、交流平臺(tái),并利用圖書館信息檢索的'技術(shù)優(yōu)勢(shì),為研究者開展長期追蹤、收集、傳遞文獻(xiàn)信息的科技服務(wù)。當(dāng)前大部分學(xué)科館員關(guān)注的是如何為院系教學(xué)提供良好的信息傳遞幫助,而忽略了在當(dāng)前信息飛速發(fā)展的時(shí)代,科研與教學(xué)走向數(shù)字化的趨勢(shì)。學(xué)者所做的所有工作,包括教案、論文、實(shí)驗(yàn)、畢業(yè)設(shè)計(jì)等等工作,基本上都是以電子信息的方式進(jìn)行編輯、存儲(chǔ)的。雖然極大地方便了學(xué)者們的工作,但同時(shí)也面臨這些電子數(shù)據(jù)的丟失風(fēng)險(xiǎn),一旦電子數(shù)據(jù)丟失,其損失的學(xué)術(shù)價(jià)值是不可估量的。為盡量避免這些事件的發(fā)生,學(xué)科部門可依托技術(shù)部門的支撐,利用數(shù)據(jù)挖掘技術(shù),開展學(xué)者數(shù)據(jù)監(jiān)護(hù)服務(wù),保存這些非紙質(zhì)信息。這樣學(xué)科部門不僅為學(xué)者提供了科研信息的前沿追蹤,同時(shí)也提供了科學(xué)數(shù)據(jù)保存平臺(tái);既為學(xué)者科研開辟道路,也為學(xué)者預(yù)防丟失科研數(shù)據(jù)提供保障,可謂雙保險(xiǎn)。數(shù)據(jù)挖掘技術(shù)還可以幫助學(xué)科部通過數(shù)據(jù)挖掘、分析出讀者關(guān)注以及咨詢較多的問題,從中歸納出重點(diǎn)并分門別類,作為圖書館工作的重要依據(jù)。
三、結(jié)語。
數(shù)據(jù)挖掘技術(shù)在當(dāng)今大數(shù)據(jù)時(shí)代,已成為一個(gè)相對(duì)成熟的學(xué)科,融入到社會(huì)的各行各業(yè)。利用數(shù)據(jù)挖掘技術(shù)對(duì)圖書館數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘已經(jīng)成為圖書館需要開展的一項(xiàng)重要工作。圖書館事業(yè)已全部進(jìn)入電子信息化,由此產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)和信息資源是圖書館行業(yè)的一筆寶貴財(cái)富,它較真實(shí)地反映了讀者對(duì)圖書館事業(yè)運(yùn)作以及提供的服務(wù)是否到位。因此,通過數(shù)據(jù)挖掘分析,能夠幫助圖書館管理者分析并發(fā)現(xiàn)現(xiàn)有管理的不足之處,通過已知的現(xiàn)象預(yù)測(cè)未來的發(fā)展趨勢(shì)。數(shù)據(jù)挖掘技術(shù)已成為今后圖書館事業(yè)保持競(jìng)爭(zhēng)力的必備法寶。
參考文獻(xiàn):
【1】顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書館個(gè)性化服務(wù)的探討[J].圖書館雜志,2013,8:63-65.。
【2】王偉.基于數(shù)據(jù)挖掘的圖書館用戶行為分析與偏好研究情報(bào)科學(xué),2012,30(3):391-394.。
【3】楊海燕.大數(shù)據(jù)時(shí)代的圖書館服務(wù)淺析[J].圖書與情報(bào)。
【4】程蓮娟.美國高校圖書館數(shù)據(jù)監(jiān)護(hù)的實(shí)踐及其啟示[J].圖書館雜志,2012,1(31):76-78.。
【大學(xué)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究論文】相關(guān)文章:
數(shù)據(jù)挖掘技術(shù)的研究論文09-12
數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究12-01
高校管理數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文09-18
支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用研究論文09-09
數(shù)據(jù)挖掘技術(shù)在中等職業(yè)學(xué)校管理實(shí)踐中的應(yīng)用研究論文12-02
基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)探討論文09-12
多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文09-13