• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于大數據的數字圖書館流量預測算法

      2020-07-14 08:37:05楊思思王琢玉
      現代電子技術 2020年11期
      關鍵詞:歷史數據大數據分析數字圖書館

      楊思思 王琢玉

      摘? 要: 數字圖書館流量預測是數字圖書館管理的基礎,直接影響數字圖書館管理效率。當前數字圖書館流量預測算法存在預測精度低、時間長等局限性,為了提高數字圖書館流量預測結果,提出基于大數據的數字圖書館流量預測算法。收集數字圖書館流量歷史數據,用大數據分析技術對數字圖書館流量歷史數據進行建模,構建數字圖書館流量預測模型,并對數字圖書館流量預測模型的相關參數采用蟻群算法進行優(yōu)化。在Matlab 2017平臺上進行數字圖書館流量預測的仿真對比測試實驗,結果表明,所提算法的數字圖書館流量預測精度超過95%,相較其他對比算法預測建模總時間最短。所提算法的數字圖書館流量預測精度、建模效率均得到了明顯的提升,可以應用于實際數字圖書館管理系統中。

      關鍵詞: 大數據分析; 歷史數據; 數字圖書館; 流量預測; 仿真測試; 執(zhí)行效率

      中圖分類號: TN911.1?34; TP391? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)11?0120?05

      Digital library flow forecast algorithm based on big data

      YANG Sisi1, WANG Zhuoyu2

      (1. Library of Wuhan University of Science and Technology, Wuhan 430081, China;

      2. Journalism and Information Communication School, Huazhong University of Science and Technology, Wuhan 430070, China)

      Abstract: The flow forecast of digital library is the foundation of digital library management, which directly affects the management efficiency of digital library. The current digital library flow forecast algorithm has the limitations of low prediction accuracy and long prediction time. To improve the flow forecast result of digital library, the digital library flow forecast algorithm based on big data is proposed. The historical data of digital library flow are collected for modeling with big data analysis technology, so as to construct the flow prediction model of digital library. Furthermore, the relevant parameters of the flow prediction model of digital library are optimized with ant colony algorithm. The simulation comparison tests for digital library flow prediction is performed on the Matlab 2017 platform. The results show that the flow prediction accuracy of digital library of the proposed algorithm is above 95%. The total time for modeling is the shortest, compared with other algorithms. Both the prediction accuracy and modeling efficiency of the proposed algorithm have been significantly improved. Therefore, it can be applied to the actual digital library management system.

      Keywords: big data analysis; historical data; digital library; flow prediction; simulation test; execution efficiency

      0? 引? 言

      隨著網絡、通信技術及數字閱讀技術的快速發(fā)展和不斷融合,許多高校建立了自己的數字圖書館,學生可以通過數字圖書館搜索和找到自己需要的數字圖書資源,如何對數字圖書館有效利用,提高數字圖書館的管理水平十分重要[1?3]。學生訪問數字圖書館的時間點、時間長短都不一樣,使得數字圖書館流量具有較大的時變性和隨機性,數字圖書館流量的建模與預測可以幫助管理人員提前知道數字圖書館流量變化態(tài)勢,從而更好地提升數字圖書館利用率,所以數字圖書館流量的預測成為當前高校數字圖書館中的一個重要研究方向[4?6]。

      數字圖書館流量預測采用時間分析技術,認為數字圖書館流量之間具有一定的時間相關性,可以根據時間相關性發(fā)現數字圖書館變化規(guī)律。最初采用多元線性回歸算法對數字圖書館流量進行建模與分析,根據數字圖書館流量歷史數據找到預測模型的參數,從而對未來一段時間的數字圖書館流量進行估計,但是由于其是一種線性分析技術,局限性十分明顯,如無法對數字圖書館流量的隨機變化特點進行描述等,使得對于現代數字圖書館流量預測錯誤比較大[7?9]。

      隨后出現了基于人工神經網絡的數字圖書館流量預測算法,相對于多元線性回歸算法,人工神經網絡的學習能力更強,可以更好地反映數字圖書館流量變化態(tài)勢,使得數字圖書館流量預測效果得到了有效改善[10?11]。但是人工神經網絡算法同樣存在不足,如數字圖書館流量預測結果不穩(wěn)定、預測精度時高時低、建模花費時間相當長、預測速度比較慢等。最近幾年,出現了基于支持向量機的數字圖書館流量預測算法[11?14],其建模與預測的穩(wěn)定性要優(yōu)于人工神經網絡,數字圖書館流量效果更優(yōu),但是其數字圖書館流量建模時參數優(yōu)化是一個難題,當前還沒有找到有效的解決方法,使數字圖書館流量結果有待進一步改善[15?17]。

      為了提高數字圖書館流量預測結果,本文提出了基于大數據的數字圖書館流量預測算法,結果表明,本文算法的數字圖書館流量預測精度超過95%,而對比算法的數字圖書館流量預測錯誤率高,而且本文算法的數字圖書館流量預測建??倳r間少,數字圖書館流量預測建模效率得到了明顯的提升,具有更好的應用價值。

      1? 基于大數據的數字圖書館流量預測算法

      1.1? 數字圖書館流量歷史數據的處理

      數字圖書館流量的歷史數據通常包括一些無效的數據,這些數據以噪聲的形式出現,為此,本文采用去噪算法對數字圖書館流量的歷史數據進行處理,去除其中的一些無用信息,從而改善數字圖書館流量的歷史數據質量,有利于數字圖書館流量預測。

      設[yt]表示數字圖書館流量的歷史數據,那么連續(xù)小波變換可描述為:

      [W(a,b)=1aytψt-badt] (1)

      預處理后的數字圖書館流量的歷史數據重構為:

      [y′t=1Cψ0+∞-∞+∞W(a,b)aψt-badadb] (2)

      在實際應用中,數字圖書館流量的歷史數據具有一定離散性,因此引用離散形式的去噪技術,即:

      [cj+1(m)=mh(m-2k)cj(m)] (3)

      [dj+1(m)=mg(m-2k)cj(m)] (4)

      1.2? 數字圖書館流量歷史數據的重構

      當前數字圖書館流量建模沿用時間分析技術,而原始數字圖書館流量的歷史數據為一維,無法直接對其進行建模與預測。結合數字圖書館流量的歷史數據的隨機性和混沌性,引入混沌算法將一維的數字圖書館流量的歷史數據變?yōu)橐粋€多變的數字圖書館流量的歷史數據,更好地挖掘隱藏于數字圖書館流量的歷史數據中的變化特點。原始數字圖書館流量的歷史數據為:[xi,i=1,2,…,n],[n]表示數字圖書館流量的歷史數據數量,通過引入混沌算法得到的多維數據為:

      [Xt={xi,xi+τ,…,xi+m-1τ}] (5)

      式中:[τ]為數字圖書館流量的歷史數據延遲時間;[m]為數字圖書館流量的歷史數據嵌入維。從式(5)可以看出,嵌入維和延遲時間決定了數字圖書館流量的歷史數據重構好壞,它們具體確定步驟如下。

      1.2.1? 延遲時間的確定

      延遲時間的確定步驟如下:

      Step1:數字圖書館流量歷史數據的相鄰兩個樣本點為[X(i)]和[X(j)],兩者的距離[rij(m)]為:

      [rij(m)=X(i)-X(j)] (6)

      Step2:重構后數字圖書館流量的歷史數據為:[Xt={xi,xi+τ,…,xi+m-1τ}],其關聯積分計算方式具體如下:

      [C(m,N,r,τ)=2M(M-1)1≤i≤j≤MH(r-X(i)-X(j))] (7)

      式中:[r]為鄰域的半徑;[M=(m-1)?τ]。

      Step3:將全部數字圖書館流量的歷史數據數量劃分為[t]個子集,這樣可以得到:

      [S(m,r,τ)=1tl=1t{Cl(m,r,τ)-Cl(l,r,τ)m}] (8)

      Step4:[S(m,r,τ)]極小值點計算公式為:

      [ΔS(t)=14m=25max[S(m,rj,t)]-min[S(m,rj,t)]] (9)

      Step5:當[ΔS(t)]達到最小值時,可以得到數字圖書館流量的歷史數據的最優(yōu)延遲時間值。

      1.2.2? 嵌入維的確定

      嵌入維的確定步驟如下:

      Step1:[Xi(m+1)]為重構后的數字圖書館流量的歷史數據第[i]個樣本,其距離最近的樣本為[Xn(i,m)(m+1)],建立如下等式:

      [α(i,m)=Xi(m+1)-Xn(i,m)(m+1)Xi(m)-Xn(i,m)(m)]? ?(10)

      Step2:當[E(m)=1N-mτi=1N-mτα(i,m)]值達到最大時,可以得到數字圖書館流量的歷史數據的最優(yōu)嵌入維值。

      1.3? 數字圖書館流量預測算法設計

      本文采用大數據分析技術中的最小二乘支持向量機作為數字圖書館流量預測算法,因為其建模速度要快于支持向量機,同時,建模精度要好于人工神經網絡。對于數字圖書館流量歷史數據,最小二乘支持向量機目標優(yōu)化函數可以表示為:

      [J1w,e=12wTw+12γi=1Ne2is.t.? ? yi=wTφxi+b+ei] (11)

      式中[γ]表示正則化參數。

      構造式(11)的拉格朗日函數,具體為:

      [L=Jw,e-i=1NαiwTφxi+b+ei-yi] (12)

      對式(11)求偏導,可以得到:

      [?L?w=0→w=i=1Nαiφxi?L?b=0→i=1Nαi=0?L?ei=0→αi=γei?L?αi=0→wTφxi+b+ei-yi] (13)

      消掉[w]和[e],得到一個線性方程,具體如下:

      [01Tv1vΩ+1γIN×bα=0y] (14)

      式中:[y=[y1,y2,…,yN]];[1v=1,…,1];[α=[α1,][α2,…,αN]];[Ω=φxφxi=Kx,xi]。

      數字圖書館流量預測結果可以表示為:

      [yx=i=1NαiKx,xi+b] (15)

      其中:

      [K(x,xi)=exp-x-xi2σ22]? ? ? (16)

      式中[σ]表示核寬度參數。核寬度參數和正則化參數直接影響數字圖書館流量預測效果,為此,本文采用蟻群算法確定它們的最優(yōu)值。

      1.4? 蟻群算法

      有[m]只螞蟻,[n]個節(jié)點,[dij]是節(jié)點[i]和[j]間的距離,[ηij]是節(jié)點[i]和[j]間邊[(i,j)]的能見度,[τij]是[(i,j)]上的信息素強度,[Δτkij]是第[k]只螞蟻在[(i,j)]上留下的信息素量,[pkij]為狀態(tài)轉移概率,其具體計算公式為:

      [pkij=ταijtηβijts∈allowedkταijtηβijt,? ? ? j∈allowedk0,? ? ? ?otherwise]? (17)

      式中[allowedk={0,1,2,…,n-1}]為沒有經過的節(jié)點集合。

      螞蟻信息素增量的局部更新規(guī)則為:

      [τij(t+1)=(1-ρ)τij(t)+Δτij(t,t+1)] (18)

      [Δτij(t,t+1)=k=1mΔτkijt,t+1] (19)

      式中:[ρ]為信息素衰減程度;[Δτkij]的計算公式為:

      [Δτkij=QLk,? ? ? (i,j)∈Lk0,? ? ? ? ?其他] (20)

      式中:[Q]為一常數;[Lk]為第[k]只螞蟻爬行的長度。

      1.5? 大數據的數字圖書館流量預測算法工作原理

      基于大數據的數字圖書館流量預測算法工作原理為:收集數字圖書館流量歷史數據,引入去噪算法對其進行處理;采用混沌算法得到多維的圖書館流量歷史數據;通過大數據分析技術對數字圖書館流量歷史數據進行建模,構建數字圖書館流量預測模型,并對數字圖書館流量預測模型的相關參數采用蟻群算法進行優(yōu)化,具體如圖1所示。

      2? 數字圖書館流量預測算法性能測試與分析

      2.1? 數字圖書館流量的歷史數據

      為驗證基于大數據的數字圖書館流量預測算法,選擇10所高校的數字圖書館流量歷史數據作為實驗對象,將數字圖書館流量歷史數據劃分為兩部分:一部分作為數字圖書館流量預測建模的訓練樣本集合;另一部分作為分析數字圖書館流量預測效果的驗證樣本集合。大數據的數字圖書館流量預測算法采用Matlab 2019編程實現,采用人工神經網絡中的BP神經網絡、支持向量機進行數字圖書館流量預測對照實驗。10所高校的數字圖書館流量歷史數據如表1所示。

      2.2? 混沌算法確定數字圖書館流量數據的延遲時間和嵌入維數

      采用1.2節(jié)的方法確定10所高校的數字圖書館流量歷史數據的延遲時間和嵌入維數,具體如表2所示。根據表2的結果得到相應的多維數字圖書館流量歷史數據,用于后期數字圖書館流量建模與預測。

      2.3? 數字圖書館流量預測模型的參數

      采用蟻群算法確定數字圖書館流量預測模型的核寬度參數和正則化參數,結果如表3所示。從表3可以看出,不同的高校數字圖書館流量歷史數據,有不同的核寬度參數和正則化參數,這樣建立的高校數字圖書館流量預測模型不一樣,可以適合不同類型的高校數字圖書館流量建模。

      2.4? 高校數字圖書館流量的預測精度對比

      所有數字圖書館流量預測算法的精度如圖2所示。

      從圖2的實驗結果可以得到如下結論:

      1) BP神經網絡的數字圖書館流量的預測精度最低,低于88%,其數字圖書館流量的預測錯誤差大于10%,無法滿足數字圖書館管理的實際應用要求。這主要是由于BP神經網絡的學習性能比較差,無法建立最優(yōu)的數字圖書館流量的預測模型。

      2) 支持向量機的數字圖書館流量的預測精度高于BP神經網絡的數字圖書館流量的預測精度,預測精度處于90%左右,數字圖書館流量的預測錯誤率得到了降低。這主要是由于支持向量機的學習性能要優(yōu)于BP神經網絡,得到了更優(yōu)的高校數字圖書館流量的預測模型。

      3) 在所有算法中,本文算法的數字圖書館流量的預測精度最高,超過了95%,數字圖書館流量的預測錯誤率遠小于BP神經網絡和支持向量機,克服了BP神經網絡和支持向量機在數字圖書館流量的預測過程中存在的局限性,建立了理想的數字圖書館流量預測模型。

      2.5? 高校數字圖書館流量的預測效率對比

      為全面描述數字圖書館流量預測算法的性能,計算三種算法的數字圖書館流量預測建模時間,結果如圖3所示。

      對圖3的數字圖書館流量建模時間進行對比和分析可以發(fā)現:支持向量機的數字圖書館流量預測建模時間最長,BP神經網絡的數字圖書館流量預測建模時間次之,而本文的數字圖書館流量預測建模時間最短,這主要是由于最小二乘支持向量機的學習效率更高,而且對數字圖書館流量歷史數據進行了去噪和混沌處理,提高了數字圖書館流量預測建模效率,可以用于大規(guī)模數字圖書館流量預測與建模,實際應用價值更高。

      3? 結? 語

      為了解決當前數字圖書館流量預測結果不穩(wěn)定、建模時間長等缺陷,以獲得更優(yōu)的數字圖書館流量預測結果為目標,本文設計提出了基于大數據的數字圖書館流量預測算法。采用去噪算法對數字圖書館流量歷史數據進行預處理,然后引入混沌算法重構數字圖書館流量歷史數據,最后引入大數據分析技術構建數字圖書館流量預測模型,并采用蟻群算法確定圖書館流量預測模型的參數。在Matlab 2017平臺上的數字圖書館流量預測的仿真測試實驗結果表明,本文算法是一種精度高、速度快的數字圖書館流量預測算法,數字圖書館流量預測整體效率明顯優(yōu)于當前其他數字圖書館流量預測算法,具有更加廣泛的實際應用范圍。

      參考文獻

      [1] 馬東.高校圖書館網絡異常流量分析與研究[J].現代情報,2012,32(12):149?151.

      [2] 費巍,徐軍.公共圖書館讀者流量影響因素研究[J].山東圖書館學刊,2012(2):56?58.

      [3] 王家勝,牟肖光.基于時間序列高校圖書館借閱流量分布統計分析[J].農業(yè)圖書情報學刊,2011,23(4):72?75.

      [4] 楊佳.以上海圖書館為例的到館讀者流量分析[J].圖書館界,2010(6):36?38.

      [5] 夏玲,張揚.黃岡師范學院圖書館紙質圖書流量統計分析[J].黃岡師范學院學報,2009,29(6):89?91.

      [6] 王靜,李丕仕.基于Lyapunov指數的高校圖書館圖書借閱流量混沌預測[J].現代情報,2009,29(9):7?10.

      [7] 吳紅艷.高校數字圖書館圖書流量的時間序列分布趨勢及預測分析[J].中原工學院學報,2008(4):3?7.

      [8] 鐘克吟.圖書館數字資源訪問流量統計分析系統的設計與實現[J].圖書館研究與工作,2007(4):25?28.

      [9] 尹志強.基于數據挖掘的高校圖書館圖書借閱流量建模與分析[J].微電子學與計算機,2018,35(11):95?99.

      [10] 趙惠,劉芳.湖南圖書館網站訪問流量分析研究報告[J].圖書館,2006(5):97?100.

      [11] 左麗.基于大數據分解的數字圖書館訪問流量預測[J].自動化技術與應用,2018,37(10):43?46.

      [12] 周靜晴.公共圖書館智能讀者流量系統大數據分析研究:以深圳圖書館為例[J].圖書館研究,2018,48(4):116?122.

      [13] 陳越華.神經網絡在高校圖書館圖書借閱流量預測中的應用[J].現代電子技術,2017,40(19):115?118.

      [14] 張振華,梅江林.高校圖書館引進英文數據庫的成本效益研究:以鹽城工學院圖書館為例[J].鹽城工學院學報(社會科學版),2016,29(4):85?88.

      [15] 張嵐.數字圖書館訪問流量預測方法研究[J].河南科技,2014(12):280?281.

      [16] 張明霞.GM(1,1)模型在大開間圖書館流量預測中的應用[J].數學的實踐與認識,2013,43(23):80?84.

      [17] 李靜.基于蝙蝠算法優(yōu)化LSSVM的圖書館訪問流量預測[J].信息技術,2018,42(12):5?8.

      [18] 杜慧敏.基于數據挖掘的讀者流量與圖書館開放能力分析系統[J].情報探索,2009(7):30?32.

      猜你喜歡
      歷史數據大數據分析數字圖書館
      基于充電策略估算動力電池容量的方法
      汽車電器(2025年1期)2025-02-03 00:00:00
      基于設備PF性能曲線和設備歷史數據實現CBM的一個應用模型探討
      智能制造(2021年4期)2021-11-04 08:54:36
      基于故障歷史數據和BP神經網絡的接地選線方案研究
      基于Hadoop技術實現銀行歷史數據線上化研究
      面向大數據遠程開放實驗平臺構建研究
      面向大數據分析的信息管理實踐教學體系構建
      傳媒變局中的人口電視欄目困境與創(chuàng)新
      科技傳播(2016年19期)2016-12-27 14:35:21
      大數據分析的移動端在網絡課堂教學中的應用
      高校數字圖書館資源整合的初探
      商情(2016年39期)2016-11-21 09:27:10
      基于云計算的數字圖書館建設與服務模式研究
      三穗县| 建瓯市| 广德县| 英超| 开化县| 苏州市| 拜泉县| 镇沅| 旺苍县| 五峰| 平南县| 榆中县| 横山县| 昔阳县| 清丰县| 丹东市| 安陆市| 湾仔区| 中卫市| 漳浦县| 祁东县| 贵阳市| 固始县| 瑞安市| 呼和浩特市| 新绛县| 柳江县| 习水县| 南丰县| 介休市| 康保县| 墨竹工卡县| 临夏市| 盐山县| 曲麻莱县| 普兰店市| 遂平县| 凌云县| 康马县| 德格县| 兴国县|