楊志騰 孫萍 朱天怡 蘇冠文 馬俊隆
摘要:經(jīng)濟(jì)增長(zhǎng),群眾的物質(zhì)需求得到滿足后,文化需求就會(huì)相對(duì)增加,書籍作為重要的文化載體,正在重新被我們拾起。但是在眾多場(chǎng)所中,例如社區(qū)居民,大型工廠,存在借閱不平衡的問(wèn)題,大量的圖書資源集中在高校圖書館以及市區(qū)少量的公共圖書館,無(wú)法輻射到大量的有需求群眾集體,文章將以大數(shù)據(jù)為背景,結(jié)合支持向量機(jī)分類法,以高校圖書館為起點(diǎn),探討建立中轉(zhuǎn)借閱體系,以解決圖書借閱運(yùn)營(yíng)模式相對(duì)落后,無(wú)法充分利用資源的問(wèn)題。
Abstract: When the economic growth and the material needs of the masses are met, the cultural needs will increase relatively, and books, as an important cultural carrier, are being picked up by us again. However, in many places, such as community residents and large factories, there is a problem of unbalanced borrowing. A large number of book resources are concentrated in university libraries and a small number of public libraries in the urban area, and can not radiate to a large number of mass collectives in need. This paper will take big data as the background, combined with support vector machine classification, and take the university library as the starting point, to explore the establishment of a transit lending system in order to solve the relatively backward operation mode of book lending. The problem of not being able to make full use of resources.
關(guān)鍵詞:圖書館中轉(zhuǎn)站;借閱平衡;大數(shù)據(jù);支持向量機(jī)分類法
Key words: library transit station;loan balance;big data;support vector machine classification
中圖分類號(hào):TP18? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1006-4311(2020)05-0216-03
0? 引言
2016年,教育部九部門發(fā)布《教育部等九部門關(guān)于進(jìn)一步推進(jìn)社區(qū)教育發(fā)展意見》,意見指出,社區(qū)教育是我國(guó)教育事業(yè)的重要組成部分,是社區(qū)建設(shè)的重要任務(wù)。作為教育事業(yè)繁榮的標(biāo)志,圖書館極大的方便了大部分群眾的借閱需求,如今在各大高校都建設(shè)了較為完善,圖書種類齊全的圖書館,這些圖書館在原有圖書借閱的基礎(chǔ)上,還擁有資料查詢、文獻(xiàn)檢索、文獻(xiàn)典藏等眾多功能。然而,高校以外的眾多社區(qū)尚缺乏方便的借閱條件。而這些社區(qū)又潛在著巨大的借閱需求,短時(shí)間內(nèi),很難通過(guò)建立大量的公共圖書館來(lái)滿足這一需求。數(shù)據(jù)顯示,2018年美國(guó)圖書的銷量為6.96冊(cè),比上一年增長(zhǎng)1.3%[1],同樣的增長(zhǎng)也發(fā)生在中國(guó),圖書需求正在與日遞增。通過(guò)問(wèn)卷調(diào)查的方式發(fā)現(xiàn),高校圖書館圖書借閱功能使用率正在下降,一方面是因?yàn)楦咝D書館圖書類目的不斷完善,圖書數(shù)量增多,圖書數(shù)量快速增多的同時(shí),高校圖書借閱需求未能快速增長(zhǎng)或者趨于飽和,導(dǎo)致圖書借閱率下降,大量書籍一直處于書架閑置狀態(tài)。另一方面,閱讀方式的轉(zhuǎn)變,例如電子書的出現(xiàn),也降低了部分閱讀者對(duì)圖書借閱的需求。然后,在公共社區(qū),這一現(xiàn)象卻截然相反,快速增長(zhǎng)的閱讀需求往往得不到滿足,文章將利用大數(shù)據(jù)的方法和支持向量機(jī)分類法對(duì)借閱圖書進(jìn)行分類,進(jìn)而構(gòu)建高校圖書館的圖書中轉(zhuǎn)站,以達(dá)到借閱平衡的一種狀態(tài)。
不僅如此,高校圖書館作為圖書資源豐厚的資源庫(kù)代表僅能達(dá)成有限的資源共享。在大數(shù)據(jù)時(shí)代,高校圖書館扮演者圖書中轉(zhuǎn)站的角色,作為影響社會(huì)的指明燈推進(jìn)圖書資源的流通,可漸漸帶動(dòng)社區(qū)群之間、省市之間圖書資源的共享?,F(xiàn)如今,隨著時(shí)代更替速度的加快,要求獲取信息的速度與質(zhì)量下,確保圖書公共資源的合理應(yīng)用配置也顯得尤為重要。基于大數(shù)據(jù)計(jì)量分析多種圖書資源庫(kù)的使用效率,為圖書采購(gòu)等提供有效的數(shù)據(jù)支撐。
1? 支持向量機(jī)分類法基本思想與模型
支持向量機(jī)分類法基本思想:支持向量機(jī)(Support vector machines,SVM)與遺傳算法、魯棒模型等研究方法類似,都是學(xué)習(xí)型的。通常分類的過(guò)程都是學(xué)習(xí)的過(guò)程。它的基本思想是在兩個(gè)(甚至是多個(gè))類別的樣本集之間尋找一個(gè)最優(yōu)分界面,將其分開且分隔距離最大。它分為線性的和非線性。考慮到圖書的借閱種類與數(shù)量的關(guān)系,文章采用線性可分的支持向量機(jī)分類法。
線性可分的支持向量機(jī)分類法的模型:
對(duì)于給定的一組線性可分的樣本S={(x1,y1),(x2,y2),…,(xk,yk)},其中x為n維特征向量;y取1或-1。分類就是尋找n維空間上的一個(gè)實(shí)值函數(shù),以根據(jù)決策函數(shù)推導(dǎo)出某一模式x對(duì)應(yīng)的y值。支持向量機(jī)分類法是去尋找一個(gè)最優(yōu)的分類超平面,試圖將兩類樣本正確分開。
2? 圖書借閱的現(xiàn)狀
2.1 高校圖書館館藏的增加
高校在推進(jìn)基礎(chǔ)設(shè)施及提高辦學(xué)條件時(shí),圖書館館藏的擴(kuò)增往往是一項(xiàng)非常重要的工作,眾多高校熱衷于擴(kuò)增圖書館館藏,這一工作滿足了學(xué)生的閱讀需求,提高了高校的辦學(xué)條件。但與此同時(shí),出現(xiàn)了圖書借閱率不高的現(xiàn)實(shí)問(wèn)題,通過(guò)數(shù)據(jù)顯示,以天津理工大學(xué)為例,該校2018年全年借閱量為153507冊(cè),而據(jù)該校圖書館官網(wǎng)顯示,該校圖書館館藏已經(jīng)達(dá)到200萬(wàn)余冊(cè),即使在不考慮全年借閱圖書借閱重復(fù)率的情況下,圖書的借閱率也不是很高,甚至在某些高校中出現(xiàn)了部分圖書常年無(wú)借出的情況。因此一些高校的圖書館存在較為嚴(yán)重的資源過(guò)剩甚至資源浪費(fèi)的情況,因此如何將這些過(guò)?;蛘呃速M(fèi)的資源利用起來(lái),是一個(gè)值得思考的問(wèn)題。
2.2 居民社區(qū)借閱資源的缺乏
我國(guó)城市化進(jìn)程中,城市居民社區(qū)的國(guó)模得以擴(kuò)大,尤其是在一些較為發(fā)達(dá)的地區(qū),社區(qū)的規(guī)模越來(lái)越大,社區(qū)的居民數(shù)量也有很大的增加,社區(qū)居民階級(jí)城市不斷地豐富,這就必然地造成了圖書借閱需求的不斷擴(kuò)大,但與此同時(shí),絕大部分社區(qū)圖書資源相對(duì)較為落后,甚至幾乎處于零狀態(tài),社區(qū)沒有圖書借閱這方面的資源,自然就會(huì)導(dǎo)致社區(qū)居民借閱資源的缺乏,在我國(guó),公共圖書館的建設(shè)在一定程度上解決了部分社區(qū)圖書借閱的問(wèn)題,不過(guò)公共圖書館的建設(shè)范圍有限,以目前公共圖書館的數(shù)量,難以滿足絕大部分的借閱需求,另一方面,公共圖書館高度依賴于政府的投資,段時(shí)間內(nèi)很難快速地建立起大面積的公共圖書館,成為促進(jìn)社區(qū)教育事業(yè)發(fā)展的一個(gè)阻礙。
2.3 借閱的不平衡
一方面部分高校圖書館借閱率不是很高,甚至出現(xiàn)一定時(shí)期零借閱率的情況,而另一方面,社區(qū)圖書館建設(shè)的不完善,資源的缺乏以及管理的不健全,導(dǎo)致了圖書節(jié)約的不平衡,高校圖書館出現(xiàn)圖書過(guò)剩的情況,這得益于我國(guó)對(duì)高校教育良好的政策投入,作為高?;A(chǔ)建設(shè)的一部分,圖書館館藏的數(shù)量在一定方面,也能反映高校的基礎(chǔ)建設(shè)實(shí)力,多數(shù)高校在近幾年來(lái),圖書館館藏規(guī)模有了很大的提升。另一方面,社區(qū)作為一個(gè)城市的基本單元,其覆蓋的人群可能比高校還要多,人們生活水平的提高,慢慢的已經(jīng)不再滿足于物質(zhì)生活的需求,對(duì)文化方面的需求就會(huì)提高,當(dāng)前現(xiàn)狀來(lái)說(shuō),在部分發(fā)達(dá)地區(qū),社區(qū)已經(jīng)出現(xiàn)了許多圖書館,這些圖書館從一方面來(lái)說(shuō)方便了社區(qū)居民的生活,滿足了社區(qū)居民的借閱需求,社區(qū)居民可以很方便的借閱到一些需要的書籍。然而依然存在運(yùn)作機(jī)制不完善,圖書資源缺乏,圖書種類單一等問(wèn)題,尤其是在圖書資源方面,是限制社區(qū)圖書館發(fā)展最大的原因,大量的社區(qū)有著強(qiáng)大的借閱需求,而部分高校又存在資源過(guò)剩,借閱率低的現(xiàn)狀,因此,便產(chǎn)生了一個(gè)借閱的不平衡,這樣的一個(gè)不平衡狀態(tài),長(zhǎng)期導(dǎo)致了資源的浪費(fèi),圖書資源是有限的,需要大量的財(cái)力來(lái)購(gòu)買圖書資源,短時(shí)間內(nèi),很難通過(guò)購(gòu)買大量書籍來(lái)滿足大部分社區(qū)居民對(duì)于圖書借閱的需求,因此,這樣的一個(gè)不平衡狀態(tài),將長(zhǎng)期制約高校和社區(qū)的借閱需求的滿足。
在加快高校圖書館與社區(qū)圖書館信息資源共享問(wèn)題上,針對(duì)目前高校圖書館所存在問(wèn)題和管理現(xiàn)狀,首要問(wèn)題應(yīng)解決高校圖書館圖書資源的更新以及如何實(shí)現(xiàn)高校同社區(qū)信息資源上的互補(bǔ)。針對(duì)南開區(qū)觀園公寓、陽(yáng)光100等五個(gè)社區(qū)居民地問(wèn)卷調(diào)查結(jié)果顯示,在800份調(diào)查樣本中,近8成的居民認(rèn)為有必要完善社區(qū)圖書館的建設(shè),但其中僅有不到10%的居民偶爾或經(jīng)常使用社區(qū)圖書館的資源;在選擇很少使用社區(qū)圖書館的樣本中,超過(guò)65%的居民反饋社區(qū)圖書館書籍熱門書目種類數(shù)量有限、過(guò)時(shí)書籍較多,可供挑選的有價(jià)值的書籍過(guò)少,遠(yuǎn)遠(yuǎn)滿足不了社區(qū)的實(shí)際需求。在走訪天津市內(nèi)六區(qū)數(shù)十家社區(qū)閱覽室,統(tǒng)計(jì)得出公眾借閱需求主要在故事小說(shuō)類、名人傳記類、休閑養(yǎng)生類和成人教育類。相比于社區(qū)圖書館資源不平衡的問(wèn)題,高校圖書館也屢見不鮮,針對(duì)不同的借閱對(duì)象,高校借量最多的為專業(yè)領(lǐng)域相關(guān)書籍、文獻(xiàn),與社區(qū)借閱需求成相反趨勢(shì)。由此可見兩者之間若實(shí)現(xiàn)書籍信息匹配、共享,則可一舉兩得解決圖書利用率和借閱量的問(wèn)題。圖1分別為近兩年天津理工大學(xué)、附近社區(qū)借閱圖書的數(shù)量分析。
3? 應(yīng)用支持向量機(jī)分類法圖書分類
針對(duì)書籍分類和資源配值問(wèn)題,許多文獻(xiàn)利用集成性分類,依據(jù)圖書管理信息系統(tǒng)的多元化進(jìn)行優(yōu)選;利用層次分析法,對(duì)書籍種類與對(duì)象匹配進(jìn)行權(quán)重比較、評(píng)價(jià);針對(duì)不同人群,借用多重指標(biāo)分類方法對(duì)書籍利用率進(jìn)行對(duì)比分析;或是遺傳算法、魯棒模型、聚類分析方法等研究方法。而支持向量機(jī)分類法相比于以上研究手段,能更為直接和方便的篩選出適合于不同用戶群的書籍種類。
一般我們?cè)谑褂弥С窒蛄繖C(jī)算法對(duì)樣本集進(jìn)行分類時(shí),都盡可能地將其劃分歸類清晰,會(huì)容易產(chǎn)生過(guò)學(xué)習(xí)的狀況;有干擾性訓(xùn)練樣本分類出錯(cuò)的情況發(fā)生。文章是在MATLB操作系統(tǒng)環(huán)境下完成的,數(shù)據(jù)選用2017年和2018年天津理工大學(xué)圖書館大學(xué)生經(jīng)常借的4種圖書進(jìn)行分類,采用基于距離的訓(xùn)練過(guò)程,根據(jù)運(yùn)行情況相應(yīng)減小正常樣本,降低分類器的泛化能力。我們通過(guò)對(duì)比四種核函數(shù)的支持向量機(jī)的分類性能,選用線性核函數(shù)■。支持向量機(jī)分類的結(jié)果如表1。
4? 中轉(zhuǎn)站的構(gòu)建的背景
4.1 中轉(zhuǎn)站構(gòu)建的設(shè)想
基于大數(shù)據(jù)時(shí)代背景下高校圖書分類及合理再利用對(duì)策為響應(yīng)政府號(hào)召,現(xiàn)當(dāng)代高校圖書館在保證高校在校生的書籍借閱的基本需求下,應(yīng)有針對(duì)性地服務(wù)社會(huì)群體,充分利用好高校圖書館儲(chǔ)存文明、傳遞文明、提升國(guó)民綜合素養(yǎng)的基本特性。這就要求高校圖書館不但提供與時(shí)俱進(jìn)的資源需求供給和合理的圖書管理分類方式,還要具備更加完備的系統(tǒng)化、科學(xué)化的信息互通網(wǎng)絡(luò)建設(shè)。
4.2 采用分類管理,合理分配圖書資源
為提高社會(huì)高校間圖書資源使用率、發(fā)掘潛在價(jià)值,用合理的方法實(shí)現(xiàn)價(jià)值最大化,基于支持向量機(jī)分類方法的前提,利用書籍資源數(shù)量以及借閱量(周轉(zhuǎn)率)兩個(gè)指標(biāo)進(jìn)行針對(duì)性劃分。根據(jù)社區(qū)圖書借閱數(shù)據(jù)分析,所篩選出來(lái)的使用價(jià)值較高、重復(fù)利用率較好的書籍可在滿足高校需求的前提下,適當(dāng)?shù)膹母咝D書館資源庫(kù)進(jìn)行向社區(qū)圖書館抽調(diào),從而豐滿社區(qū)圖書館資源,滿足公眾所需。同時(shí),對(duì)于部分使用價(jià)值較低、重復(fù)利用率較少圖書,高校圖書館可根據(jù)實(shí)際需求進(jìn)行處理,適當(dāng)控制未來(lái)一段時(shí)間的采購(gòu)計(jì)劃。
4.3 基于大數(shù)據(jù)整合共享社區(qū)教育資源
4.3.1 開放共享學(xué)校圖書資源
利用大數(shù)據(jù)平臺(tái),盡可能跟蹤圖書借閱在各數(shù)據(jù)庫(kù)或平臺(tái)中瀏覽、下載、引用、分享等指標(biāo),記錄對(duì)某類圖書關(guān)注度比較高的來(lái)訪者。充分利用社區(qū)周邊大學(xué)、職業(yè)學(xué)校、中小學(xué)、成人技術(shù)學(xué)校等各類教育機(jī)構(gòu)的圖書資源,為其推薦研究領(lǐng)域相近或?qū)W科互有交叉的相關(guān)書籍。利用資源建立起漂流站形式的中轉(zhuǎn)站,社區(qū)可以通過(guò)中轉(zhuǎn)站借還書籍,使得一些原本閑置的圖書資源能夠發(fā)揮作用,高校圖書資源能夠和社區(qū)資源實(shí)現(xiàn)共享,解決借閱不平衡的問(wèn)題。為廣大讀者提供個(gè)性化、動(dòng)態(tài)化、可視化的圖書資源。
4.3.2 共同維護(hù)社區(qū)中轉(zhuǎn)站
社區(qū)圖書維護(hù)可以由高校和社區(qū)居委會(huì)共同完成,高校通過(guò)數(shù)據(jù)分析,共享閑置而又符合社區(qū)需求的書籍,社區(qū)居委會(huì)為中轉(zhuǎn)站建設(shè)提供場(chǎng)地、電力支持,組織工作人員或者志愿者對(duì)圖書中轉(zhuǎn)站進(jìn)行維護(hù),必要時(shí)可以通過(guò)募捐進(jìn)行書籍損耗維護(hù)。長(zhǎng)遠(yuǎn)看來(lái),政府也可加大對(duì)社區(qū)圖書中轉(zhuǎn)站建設(shè)的支持,圖書中轉(zhuǎn)站建設(shè)提供資金,也可以凝聚社會(huì)力量,通過(guò)福利機(jī)構(gòu),慈善基金等維護(hù)社區(qū)圖書中轉(zhuǎn)站。
4.3.3 社會(huì)效益最大化
通過(guò)將社區(qū)周圍高校閑置的資源利用大數(shù)據(jù)分析的方法整合共享到社區(qū)中去,有利于充分發(fā)揮資源的價(jià)值,在不影響周邊高校圖書借閱的情況下,較好的滿足了社區(qū)居民圖書借閱的需求,其帶來(lái)的社會(huì)效益遠(yuǎn)遠(yuǎn)超出于社區(qū)借閱本身,長(zhǎng)期下來(lái),對(duì)推進(jìn)社區(qū)教育發(fā)展、提升社區(qū)居民教育水平將起著重要的作用。
5? 結(jié)語(yǔ)
大數(shù)據(jù)環(huán)境下,圖書數(shù)據(jù)庫(kù)不僅是為用戶提供圖書資源的重要渠道,也是提供知識(shí)情報(bào)分析的重要平臺(tái),需要不斷地與時(shí)俱進(jìn),優(yōu)化升級(jí)。為進(jìn)一步推進(jìn)社區(qū)教育發(fā)展,圖書館中轉(zhuǎn)站的建設(shè)是一個(gè)較為可行的方式,通過(guò)大數(shù)據(jù)的背景,建設(shè)圖書館中轉(zhuǎn)站,將有利于社區(qū)居民獲得更好的閱讀資源,創(chuàng)建便捷的社區(qū)圖書借閱環(huán)境。并建議通過(guò)提升智能化數(shù)據(jù)處理技術(shù),深度分析大數(shù)據(jù)之間的關(guān)聯(lián),利用政策機(jī)制、激勵(lì)機(jī)制促進(jìn)街道社區(qū)主動(dòng)參與圖書館中轉(zhuǎn)站建設(shè)等多種手段,滿足以讀者對(duì)文化的需求,為構(gòu)建文化交流圈,使高校圖書庫(kù)成為充滿活力的資源共享和學(xué)術(shù)交流服務(wù)創(chuàng)新平臺(tái)。
參考文獻(xiàn):
[1]子柚.美國(guó)紙書銷量連續(xù)六年上漲[N].國(guó)際出版周報(bào),2019-01-21(001).
[2]朱碧純,吳愛民,張以舒,郭桑.大數(shù)據(jù)環(huán)境下醫(yī)學(xué)高校機(jī)構(gòu)知識(shí)庫(kù)建設(shè)現(xiàn)狀調(diào)查與策略探析[J].圖書館學(xué)刊,2019(11):73-78.
[3]余輝,趙暉.支持向量機(jī)多類分類算法新研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(7):185-189.
[4]劉曉亮,丁世飛.SVM用于文本分類的適用性[J].計(jì)算機(jī)工程與科學(xué),2010,32(6):106-108.
[5]krebel U.Pairwise classification and support vector machines [C].Schuolkopf B, Burges C J C, Smola A J.Advances in kernel Methods: Support Vector Learning.MA: Cambridge, MIT press, 1999: 255-268.
[6]Knerr S, Personnaz L, Dreyfus G.Single- layer learning and training a neural network[C]. NeuroComputing: Algorithm, Architectures and Applications.New York: Springer- Verlag, 1990.