• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于量子遺傳SVM的公共圖書館每日讀者流通人次預測模型

      2019-01-02 09:01:18鄭戍嘉
      軟件 2019年12期
      關鍵詞:智慧服務公共圖書館

      摘 ?要: 本文以量子遺傳SVM為核心,構建數(shù)學模型,對公共圖書館每日讀者流通人次(借還書人次)進行預測。模型以上海市嘉定區(qū)圖書館為數(shù)據(jù)實例,考察各種影響因素后,以若干量化特征數(shù)據(jù)為輸入,每日讀者流通人次為輸出目標,在此基礎之上成功地訓練并獲取了預測模型。實驗表明,在全程貼近實際目標預測系統(tǒng)構建的指導思想下(適用、穩(wěn)定、準確),此方法建立的相應短期預測系統(tǒng)取得了較好的預測效果,系統(tǒng)的應用將有效地提升圖書館智慧服務的層級。

      關鍵詞: 量子遺傳算法;SVM;公共圖書館;智慧服務;每日讀者流通人次;量化特征

      中圖分類號: TP181;G251.5 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.12.042

      本文著錄格式:鄭戍嘉. 基于量子遺傳SVM的公共圖書館每日讀者流通人次預測模型[J]. 軟件,2019,40(12):188194

      Prediction System of “Public Library Daily Readers Throughput”

      Based on Quantum Genetic SVM

      ZHENG Shu-jia

      (Jiading District Library of Shanghai, Shanghai 201800, China)

      【Abstract】: Based on the Quantum Genetic SVM, this paper constructs mathematical models to predict “public library daily readers throughput”, i.e. the amount of daily library users who borrow/return books. The model is taking Jiading District Library of Shanghai as data source. After investigating and analyzing various potential influencing factors, the model takes several quantitative characteristic data as input and sets “public library daily throughput” as target output, on the basis of which the prediction model is trained and successfully obtained. Experiments show that the corresponding short-term forecasting system established by this method has achieved good forecasting results under the guidance of the construction of the forecasting system which is close to the actual target (applicable, stable and accurate). The application of the system will effectively improve the level of library intelligent service.

      【Key words】: Quantum genetic algorithm; SVM; Public library; Intelligent service; Daily readers throughput; Quantitative characteristics

      0 ?引言

      公共圖書館的每日讀者流通人次(借還書人次),是一個極有業(yè)務參考價值的指標式數(shù)據(jù),它是在多種復雜因素共同作用下產(chǎn)生的。

      目前國內(nèi)對圖書館流通人次(冊次)時間序列的預測,粒度多集中在月度、學期的時間跨度上,而預測每日流通人次的嘗試,則較為少見,有個別文獻使用基于某型神經(jīng)網(wǎng)絡的算法模型對高校圖書

      館的每日流通人次進行了成功的短期預測,但對公共圖書館的每日流通人次的高精度預測模型則未曾見諸公開發(fā)表。

      高校圖書館與公共圖書館流通人次的時間序列模型,雖看則相似,但實際存在著很大的不同。這主要是因為,兩者在流通模式、讀者特征、借閱行為模式、服務內(nèi)容、交通方式乃至天氣因素影響等方面存在著較大差異,簡單地套用模型將會導致不甚理想的結果。

      公共圖書館流通人次時間序列,相對于高校圖書館而言,其影響因素更復雜多變、隨機性更強,因而預測難度更大,在建立預測模型時,就不能單單以模型精度為唯一追求目標,造成預測精度偽高(模型實際應用時效果變差)或魯棒性差的問題,而應以適用、穩(wěn)定、準確的指導思想,恰當?shù)貥嫿蓪嶋H應用的模型。在這里,對于隨機性相對較強的小樣本時間序列而言,大規(guī)模的深度神經(jīng)網(wǎng)絡固然不適用,輕型神經(jīng)網(wǎng)絡的穩(wěn)定性又較差(即使采用了PSO等優(yōu)化算法),因此神經(jīng)網(wǎng)絡算法不能說是一個最佳的選擇。經(jīng)對比,本文最終采用量子遺傳SVM作為模型的核心算法,并著重關注了天氣因素對每日流通人次的影響。

      本文的核心是關于如何在全程貼近實際目標預測系統(tǒng)構建的指導思想下,建立一個基于量子遺傳SVM的數(shù)學模型,對公共圖書館的每日讀者流通人次進行短期預測。文章將以上海市嘉定區(qū)圖書館為例,對公共圖書館讀者流通人次的影響因素進行探討,引入天氣因素對讀者到館影響,隨之選擇若干因素的量化特征為模型輸入,以預測日(未來三日內(nèi))的讀者流通人次為輸出目標并進行模型訓練,嘗試獲取實用的高精度的預測模型。

      選取影響因素,一是要與預測目標關聯(lián)性強且注意本模型短期預測的目的;二是一定要保證能夠量化并能獲得真實、有效且足夠數(shù)量的數(shù)據(jù)。本文最終選擇的表征因素為:每日讀者流通人次數(shù)據(jù)、天氣(最高氣溫、最低氣溫、降水量)、雙休日標志。所對應的模型原始數(shù)據(jù)見下一節(jié)數(shù)據(jù)準備。

      2.2 ?數(shù)據(jù)準備

      本實驗所使用的嘉定區(qū)圖書館每日讀者流通人次(借還書人次)數(shù)據(jù),由上海市中心圖書館相關系統(tǒng)平臺獲取,去除了節(jié)日前后等特殊時間段的數(shù)據(jù)。歷史天氣(最高氣溫、最低氣溫、降水量)數(shù)據(jù),由某氣象記錄網(wǎng)站獲取。

      經(jīng)數(shù)據(jù)檢驗、清洗后,得到了近3年內(nèi)共840組每日數(shù)據(jù),分為12個字段,先將T+1預測日(明日)的讀者流通人次為模型訓練、預測的目標:

      ① 預測日的雙休日標志

      ② 預測日的最高氣溫

      ③ 預測日的最低氣溫

      ④ 預測日開放時間段的降水量

      ⑤-? 預測日前1日到前7日的流通人次

      ? 預測日的讀者流通人次

      值得指出的是,本實驗的目標序列極大值點呈周期性分布,占比較小而與均值之間的相對距離卻較大,因此在模型測試集的檢驗過程中,測試數(shù)據(jù)數(shù)量不宜太少,這樣才能更貼近長期預測的真實效果,否則將可能出現(xiàn)預測精度偽高(預測模型精度高、實際預測系統(tǒng)精度低)的情況。同時,如能確保較多組的跨季的測試集數(shù)據(jù),則可以檢驗某些中

      長期(季節(jié))因素少量變化后預測模型的適應能力,若日后構建實際應用的預測系統(tǒng),模型中長期的預測穩(wěn)定性是至關重要的。為此,本文選用數(shù)據(jù)集的前740組作SVM模型訓練用,而(近期的)后100組作為模型測試數(shù)據(jù)。

      2.3 ?數(shù)據(jù)歸一化

      因數(shù)據(jù)集中存在奇異樣本數(shù)據(jù),為消除其量綱影響,使計算結果能較好地回歸,必須進行歸一 ? 化操作。數(shù)據(jù)集進行歸一化操作的數(shù)值范圍限定 ? 為[1,3]。圖1為每日讀者流通人次數(shù)據(jù)的歸一化 ?圖形。

      圖1 ?每日讀者流通人次數(shù)據(jù)歸一化后圖像

      Fig.1 ?Normalized image of daily reader circulation data

      2.4 ?特征選擇

      本文采用遞歸特征消除[7][8](RFE:Recursive Feature Elimination)來對數(shù)據(jù)集的特征進行重要性的排序。方法如下:首先選定一個算法,以此算法訓練模型,去掉得分最小的特征,再用剩余的特征再訓練模型,如此重復,最終給出特征重要性的排序。

      根據(jù)經(jīng)驗,相對于特征數(shù),本實驗的數(shù)據(jù)組數(shù)足夠多而質(zhì)量較好,則無須經(jīng)過正則化處理也可獲得很好的RFE穩(wěn)定性,只是可能要注意關聯(lián)特征的問題。

      經(jīng)過RFE計算,得到數(shù)據(jù)集11個特征變量重要性的排序(從大到小),見表1。

      如表1所示,影響流通人次的各項因素中,預測日的氣溫狀況、當日是否為雙休日是兩個主要因素,而當日最低氣溫的影響比最高氣溫更大。因為存在著周期性因素,7天前的讀者流通人次數(shù)據(jù)是一個很重要的參考指標。預測日之前1到6天的讀者流通人次數(shù)據(jù)的重要性則較低。而預測日開放時間段降水量的影響最小,這表明至少對嘉定區(qū)圖書館而言,一般情況下,開放日是否下雨對讀者會否到圖書館來借還書的影響性不大。

      表1 ?數(shù)據(jù)集特征的重要性排序

      Tab.1 ?Sorting the importance of data set features

      RFE排序 特征

      1 預測日7天前的流通人次

      2 預測日的最低氣溫

      3 預測日的雙休日標志

      4 預測日的最高氣溫

      5 預測日2天前的流通人次

      6 預測日1天前的流通人次

      7 預測日6天前的流通人次

      8 預測日4天前的流通人次

      9 預測日3天前的流通人次

      10 預測日5天前的流通人次

      11 預測日開放時間段的降水量

      在之后進一步的模型運算中,嘗試對特征消減后的預測效果進行了多次分段實際檢驗,發(fā)現(xiàn)去除預測日之前1到6天的流通人次及降水量的特征會使預測效果略有下降,而保留所有11項特征時,預測效果更佳,對此判斷在這7個次要特征中,存在某種形態(tài)的隱變量對模型發(fā)生輕微作用(可能隱含某些中長期影響模式)。引入這7個特征,并不損傷或可增加模型的魯棒性,故此最終決定在模型的數(shù)據(jù)集中保留所有11項特征。

      2.5 ?量子遺傳算法(QGA)對SVM超參數(shù)的尋優(yōu)

      QGA[9-10]的具體算法如下:

      (1)生成包含一定數(shù)量個體的初始種群,每個個體有一串染色體,染色體的表達采用量子位的方式。

      (2)種群采用概率幅的形式繁衍下一代(染色體),并用評價函數(shù)保留最優(yōu)個體,如滿足停止條件則停止計算,否則采用量子旋轉門對種群進行更新后循環(huán)這一步。

      量子遺傳算法的參數(shù)選擇:

      本實驗在經(jīng)驗參數(shù)附近、對數(shù)據(jù)集進行了多種分段,在此基礎上又進行了多次計算,以排除小概率的早熟或停滯現(xiàn)象及確定最佳參數(shù)。

      最終選定的QGA參數(shù)為:最大遺傳代數(shù):200,種群大?。?60,單個變量的二進制長 [40 40]。

      采用以上參數(shù)構造的QGA模型的進化過程見圖2。

      QGA為SVM的超參數(shù)C、g尋優(yōu)的最終計算結果如下:

      最優(yōu)解C = 0.99658,g = 0.11421

      2.6 ?SVM模型訓練及測試

      將QGA超參數(shù)尋優(yōu)獲取到的最優(yōu)C、g數(shù)值代入SVM算法,使用訓練集740組數(shù)據(jù)進行訓練后,擬合情況如圖3。

      圖2 ?進化曲線

      Fig.2 ?Evolution curve

      圖3 ?SVM訓練集擬合圖形

      Fig.3 ?SVM training set fitting graphics

      之后,使用訓練得到的SVM模型進行測試集100組數(shù)據(jù)的實際檢驗。

      測試集的預測效果如圖4和圖5。

      模型訓練集、測試集總的回歸計算檢驗結果如表2。

      可以看到,此次基于量子遺傳SVM模型的預測實驗,在實際影響因素復雜、目標數(shù)據(jù)波動幅度較大、測試時間序列較長的情況下,仍獲得了較好的預測效果。如圖5所示,81%的預測點的百分 ? ?比誤差在15%以內(nèi)。此次實驗測試集數(shù)據(jù)的預測 ? 準確率(1-MAPE)為90.44%,平方相關系數(shù)R為96.07%。

      圖4 ?測試集回歸驗證圖形

      Fig.4 ?Test set regression verification graphics

      圖5 ?測試集預測結果的百分比誤差

      Fig.5 ?Percentage error of test set prediction results

      表2 ?訓練集與測試集的擬合結果

      Tab.2 ?Fitting results of training set and test set

      平均絕對百分誤差 MAPE(%) 平方相關系

      數(shù)R(%)

      訓練集 9.25 95.47

      測試集 9.56 96.07

      以上是對T+1預測日(明日)的讀者流通人次建模的預測結果。之后重新以相似方法建模,對預測日為T+2(后天)、T+3(大后天)的讀者流通人次進行預測(此時,預測日的前一至二日的讀者流通人次為未知數(shù),而預測日的天氣狀況視為已知)。實驗結果表明,訓練后得到的模型,預測準確率并未明顯降低,均接近90%,見表3,顯示采用此方法建構的預測模型適應性較強,預測效果較為穩(wěn)定。

      表3 ?三日預測效果對照表

      Tab.3 ?Contrast table of three-day prediction effect

      平均絕對百分

      誤差MAPE(%) 平方相關系

      數(shù)R(%)

      T+1 訓練集 9.25 95.47

      測試集 9.56 96.07

      T+2 訓練集 9.08 95.74

      測試集 10.08 95.86

      T+3 訓練集 9.40 95.63

      測試集 10.16 95.65

      3 ?結語

      本文在全程貼近實際目標預測系統(tǒng)構建的指導思想下(適用、穩(wěn)定、準確),以量子遺傳SVM算法為核心,構建數(shù)學模型,對公共圖書館的每日讀者流通人次進行短期預測,獲得了較好的預測效果。

      模型的數(shù)據(jù)實例來源于上海市嘉定區(qū)圖書館。建模步驟如下:首先對影響嘉定區(qū)圖書館每日讀者流通人次的因素進行分析和篩選,而后采集、量化、清洗選定的因素數(shù)據(jù),獲得近3年內(nèi)840組可用數(shù)據(jù)(包含11個特征字段),劃分為訓練集和測試集。接著將所獲數(shù)據(jù)集進行歸一化操作,使用RFE進行特征選擇,而后使用量子遺傳算法(QGA)對支持向量機(SVM)的超參數(shù)C、g進行尋優(yōu)。模型以預測日(三日內(nèi))的讀者流通人次作為訓練目標,使用訓練集數(shù)據(jù)進行SVM模型訓練,訓練完成后,加載此SVM模型對測試集數(shù)據(jù)進行了預測效果的檢驗。結果表明,采用此方法建立的模型,預測未來三日內(nèi)讀者流通人次,其總體預測準確率可達90%左右,有著較好的預測效果。

      從模型選擇、影響因素分析、數(shù)據(jù)采集、特征篩選到預測效果的評價,本文從始至終保持貼近實際預測系統(tǒng)的構建。如預測模型所使用特征數(shù)據(jù),均為可獲取或提前獲知的數(shù)據(jù):讀者流通人次的歷史數(shù)據(jù)一般可由相關流通系統(tǒng)的數(shù)據(jù)庫獲取、預測日的天氣數(shù)據(jù)(最高氣溫、最低氣溫、降雨量)可從天氣預報中獲取。節(jié)假日等特殊時間段的預測雖然不在本文論及范圍之內(nèi),但可以本模型預測數(shù)據(jù)為基準,輔以傳統(tǒng)統(tǒng)計學方法,分析、考量其變動,便可進一步對特殊時間段的流通人次進行自動化預測。

      一個全自動的、穩(wěn)定且高精度的以機器學習算法為核心的每日讀者流通人次短期預測系統(tǒng)的建立,將有效地提升圖書館智慧服務的層級,是人工智能深入?yún)⑴c到圖書館智慧服務中去的一個典型的范例。

      參考文獻

      [1]張學工. 關于統(tǒng)計學習理論與支持向量機[J]. 自動化學報, 2000, 26(1): 32-42.

      [2]祁亨年. 支持向量機及其應用研究綜述[J]. 計算機工程, 2004, 30(10): 6-9.

      [3]丁世飛, 齊丙娟, 譚紅艷. 支持向量機理論與算法研究綜述[J]. 電子科技大學學報, 2011, 40(1): 1-10.

      [4]馮振華, 楊潔明. SVM回歸的參數(shù)選擇探討[J]. 機械工程與自動化, 2007, (3): 17-18, 22.

      [5]潘妍, 孫立民, 馬曉燕. 一種支持向量機的動態(tài)自適應加權算法[J]. 煙臺大學學報(自然科學與工程版), 2009, 22(4): 282-285

      [6]費巍, 徐軍. 公共圖書館讀者流量影響因素研究[J]. 山東圖書館學刊, 2012, (2): 56-58, 64.

      [7]游偉, 李樹濤, 譚明奎. 基于SVM-RFE-SFS的基因選擇方法[J]. 中國生物醫(yī)學工程學報, 2010, 29(1): 93-99.

      [8]吳紅霞, 吳悅, 劉宗田, 等. 基于Relief和SVM-RFE的組合式SNP特征選擇[J]. 計算機應用研究, 2012, 29(6): 2074- 2077.

      [9]葛繼科, 邱玉輝, 吳春明, 等. 遺傳算法研究綜述[J]. 計算機應用研究, 2008, 25(10): 2911-2916.

      [10]梁昌勇, 柏樺, 蔡美菊, 等. 量子遺傳算法研究進展[J]. 計算機應用研究, 2012, 29(7): 2401-2405.

      猜你喜歡
      智慧服務公共圖書館
      基于“互聯(lián)網(wǎng)+”視閾下的智慧圖書館用戶服務
      基于服務角度的智慧景區(qū)建設思考
      商(2016年32期)2016-11-24 15:51:00
      MOOC時代公共圖書館服務探索研究
      互聯(lián)網(wǎng)時代公共圖書館引領社會閱讀舉措探析
      公共圖書館延伸服務的實踐與思考
      科技視界(2016年21期)2016-10-17 19:33:29
      談公共圖書館如何建立自助服務推廣長效機制
      商(2016年27期)2016-10-17 06:34:33
      以人為本的智慧圖書館服務淺析
      出版廣角(2016年6期)2016-08-04 22:04:51
      公共圖書館弱勢群體智慧信息服務模式探析
      商(2016年4期)2016-03-24 20:52:01
      金坛市| 广宁县| 池州市| 申扎县| 富平县| 张家川| 定兴县| 河北省| 临猗县| 泰来县| 吉水县| 新化县| 马边| 察哈| 科技| 三河市| 阜平县| 大渡口区| 济阳县| 光泽县| 木兰县| 唐山市| 英德市| 兴安县| 日喀则市| 宾阳县| 峨眉山市| 小金县| 扶沟县| 凭祥市| 南充市| 朝阳市| 宜川县| 蚌埠市| 论坛| 湘潭县| 兰溪市| 和静县| 乾安县| 惠来县| 霍邱县|