• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于神經(jīng)網(wǎng)絡(luò)方法的經(jīng)濟困難學(xué)生認定研究

      2021-10-16 12:45余楨偉李媛
      現(xiàn)代信息科技 2021年7期
      關(guān)鍵詞:學(xué)生資助人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘

      余楨偉 李媛

      摘要:隨著校園一卡通的應(yīng)用,學(xué)生在校行為數(shù)據(jù)得以客觀記錄。為了解決高校學(xué)生工作中對于經(jīng)濟困難學(xué)生認定存在的主觀性強,認定材料煩瑣等問題,文章采用數(shù)據(jù)挖掘方法,采集某高校校園一卡通消費數(shù)據(jù),應(yīng)用神經(jīng)網(wǎng)絡(luò)算法構(gòu)建高校經(jīng)濟困難學(xué)生精準認定模型。該方法有助于實現(xiàn)對學(xué)生經(jīng)濟困難等級的輔助預(yù)測,提高高校學(xué)生資助工作的科學(xué)化水平。

      關(guān)鍵詞:數(shù)據(jù)挖掘;人工神經(jīng)網(wǎng)絡(luò);學(xué)生資助

      中圖分類號:TP18? ? ? 文獻標識碼:A 文章編號:2096-4706(2021)07-0006-04

      Research on Identification of Students with Financial Difficulties Based on

      Neural Network Method

      YU Zhenwei,LI Yuan

      (Suzhou Institute of Technology,Jiangsu University of Science and Technology,Suzhou? 215600,China)

      Abstract:With the application of campus all-purpose card,studentsbehavior data in school can be recorded objectively. In order to solve the problem of strong subjectivity and cumbersome identification materials in the work of college students,this paper uses data mining method to collect the consumption data of the campus all-purpose card of a college,and uses neural network algorithm to construct the accurate identification model of college students with financial difficulties. This method is helpful to realize the auxiliary prediction of studentsfinancial difficulty level and improve the scientific level of college studentsfinancial aid work.

      Keywords:data mining;artificial neural network;studentsfinancial aid

      收稿日期:2021-03-18

      課題項目:2019年江蘇高校哲學(xué)社會科學(xué)研究項目(2019SJB905);2021年江蘇科技大學(xué)蘇州理工學(xué)院“暖心助困·勵志助學(xué)”暨學(xué)生工作精品項目(ZZKT202104)

      0? 引言

      隨著校園一卡通在各個學(xué)校流行,學(xué)生的日常消費行為被記錄,通過對學(xué)生行為數(shù)據(jù)尤其是消費類數(shù)據(jù)展開挖掘分析,進而客觀判斷學(xué)生經(jīng)濟困難情況,成為當前各個高校學(xué)生資助工作的研究熱點,許多學(xué)者對此展開深入探討。在高校學(xué)生資助工作研究方面,王煜等學(xué)者基于某所高校校園一卡通的數(shù)據(jù)和獎學(xué)金發(fā)放情況,通過構(gòu)建Logistic回歸模型確定影響獲得助學(xué)金與否的因素,為其建立數(shù)學(xué)模型,從而幫助到真正家庭困難的學(xué)生[1];柴政等學(xué)者在大數(shù)據(jù)應(yīng)用的背景下,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,分析“一卡通”消費數(shù)據(jù)來挖掘經(jīng)濟困難學(xué)生,提高了經(jīng)濟困難學(xué)生評定結(jié)果的準確性,但仍然存在著數(shù)據(jù)特征不夠細化的不足[2]。為了真正使資助工作落到實處,構(gòu)建嚴格的學(xué)生資助評估方案十分必要[3]。

      本論文提出的神經(jīng)網(wǎng)絡(luò)模型方法通過對學(xué)生“一卡通”消費數(shù)據(jù)進行提取和訓(xùn)練,對模型參數(shù)進行優(yōu)化改進,以最后得出的神經(jīng)網(wǎng)絡(luò)模型來預(yù)測貧困等級[4],有助于彌補上述方法的不足,挖掘潛在的經(jīng)濟困難學(xué)生,保護學(xué)生的隱私,同時緩解了學(xué)生的忌貧心理,更具有科學(xué)性和準確性,有助于做到精準挖掘貧困人群,以更人性化的方式幫助到真正家庭經(jīng)濟困難的學(xué)生,防止不貧困學(xué)生虛假申報或貧困學(xué)生不申請行為的產(chǎn)生。

      1? 數(shù)據(jù)準備

      本文的消費數(shù)據(jù)來源于校園一卡通,經(jīng)濟困難學(xué)生名單來源于某高校學(xué)生資助中心。校園一卡通中可以通過消費數(shù)據(jù)來反映學(xué)生在學(xué)校的日常消費情況,并為貧困等級評價提供數(shù)據(jù)[5]。

      1.1? 數(shù)據(jù)采集

      以某高校2019年的經(jīng)濟困難學(xué)生庫為例,采集他們自2019年3月1日至4月31日共兩個月的一卡通消費數(shù)據(jù),涉及743個學(xué)生個體(其中734人在3月和4月均有消費記錄),共121 694條消費記錄(3月65 366條,4月56 328條)。除此之外,還需要從學(xué)生資助中心部門采集2018年到2019年在經(jīng)濟困難學(xué)生庫中實際發(fā)放助學(xué)金的經(jīng)濟困難學(xué)生名單數(shù)據(jù),包含492名經(jīng)濟困難學(xué)生,一共匹配到72 684條消費記錄(3月39 446條,4月33 238條)。樣表如表1所示。

      1.2? 數(shù)據(jù)預(yù)處理

      將數(shù)據(jù)進行分類匯總,根據(jù)消費類型可分為“餐費支出”“購熱水支出”“淋浴支出”“商場購物”“用電支出”“用水支出”等,根據(jù)每項消費類型把每個學(xué)生的消費次數(shù)和消費金額表示出來,將這幾類消費類型的消費次數(shù)、消費金額、消費總次數(shù)、消費總金額作為人工神經(jīng)網(wǎng)絡(luò)模型輸入層的節(jié)點,讓模型學(xué)習(xí)其中的規(guī)律從而進行預(yù)測。變量描述性統(tǒng)計表如表2所示。

      從平均值、標準差、極小值和極大值四個方面對這492名經(jīng)濟困難學(xué)生兩個月的校園一卡通數(shù)據(jù)進行描述性統(tǒng)計分析,可以看出在餐費、購熱水、淋浴、商場購物支出、用水5種消費類型中,餐費支出金額的平均值最大,由此可見學(xué)生的日常消費地點以食堂居多,且標準差數(shù)值也最大,這說明每個學(xué)生食堂消費金額落差很大,這在很大程度上反映出了學(xué)生的個體差異。餐費支出作為必須支出,很大程度上能反映出學(xué)生是否貧困,如果某個學(xué)生一卡通的消費次數(shù)過少,那么屬于非正?,F(xiàn)象,如果將他的消費數(shù)據(jù)放進模型會對模型產(chǎn)生干擾,對于怎樣去界定一個學(xué)生消費次數(shù)過少的標準,本文經(jīng)過多次試驗得到一個更加利于提高預(yù)測準確性的預(yù)處理標準,將兩個月加起來的總消費次數(shù)低于15次和餐費次數(shù)低于5次的學(xué)生個體數(shù)據(jù)進行了去除處理,去除后最終減少了22個學(xué)生個體。

      2? 數(shù)據(jù)分析

      2.1? 數(shù)據(jù)導(dǎo)入

      本文將三月和四月的消費數(shù)據(jù)聚集在一起并進行數(shù)據(jù)預(yù)處理后的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,將訓(xùn)練集中的一半數(shù)據(jù)作為測試數(shù)據(jù)集。圖1為基于RapidMiner軟件神經(jīng)網(wǎng)絡(luò)的程序配置流程圖[6]。

      2.2? 參數(shù)設(shè)置

      輸入層由13個屬性項組成,輸出層有3個神經(jīng)元,分別代表貧困等級“A”“B”“C”。其中“A”等級代表助學(xué)金2 000元,“B”等級代表助學(xué)金1 500元,“C”等級代表助學(xué)金1 000元。為了計算效率的提高,本文只設(shè)置一個隱藏層,對于隱藏層節(jié)點數(shù)的選取,本文選用了眾多公式中相對有效的一種,h=(m+n)1/2+α,其中m為輸入層節(jié)點數(shù),n為輸出層節(jié)點數(shù),α∈[1,10],在本文中,m為13,n為3,所以h∈[5,14],經(jīng)過將本文選取的不同模型進行多次試驗后發(fā)現(xiàn)h取5、6、7、8時和10、11、12、13、14時預(yù)測準確率比h取9時略低,只有h取9時預(yù)測準確率最高,訓(xùn)練結(jié)果最佳,因而本文隱藏層節(jié)點數(shù)取9。本文經(jīng)過嘗試發(fā)現(xiàn)調(diào)試最大運行次數(shù)(Training cycles)和精確度(epsilon)也能提高模型精確度,經(jīng)過多次調(diào)試,最終設(shè)置最大運行次數(shù)為500,精確度為10-5,如果訓(xùn)練誤差低于精確度值,則不再優(yōu)化。參數(shù)設(shè)置界面如圖2所示。

      2.3? 模型建立

      在高校經(jīng)濟困難學(xué)生認定預(yù)測模型中,重點在于體現(xiàn)認定模型的精度而不是廣度,入選的變量一定要能夠客觀真實地表現(xiàn)學(xué)生的貧困情況。包括學(xué)生的基本信息(學(xué)號)、一卡通消費信息(消費總支出金額、消費總支出次數(shù)、餐費支出金額、餐費支出次數(shù),購熱水支出金額、購熱水支出次數(shù)、淋浴支出金額、淋浴支出次數(shù)、商場購物金額、商場購物次數(shù)、用水支出金額、用水支出次數(shù)等)。變量能反映學(xué)生的消費水平、貧困等級,在變量的選擇上,任何一項重要指標都不應(yīng)被遺漏,應(yīng)做到完整、全面、系統(tǒng)地反映學(xué)生的實際貧困情況。本文建立的高校經(jīng)濟困難學(xué)生認定模型,為了實現(xiàn)數(shù)據(jù)的可獲得性,選擇的變量一定要能夠被簡便獲取,為了提高模型的精確性,互斥變量一定要有相同的權(quán)重和測度,以實現(xiàn)橫向比較,選取的指標要直觀反映出學(xué)生的消費水平。模型運行配置界面如圖3所示[7]。

      2.4? 模型輸出

      人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一共有三部分組成,它們分別是輸入層、隱藏層、輸出層[4]。本文的輸入層有13個神經(jīng)節(jié)點,分別代表這兩個月的消費總支出金額、消費總支出次數(shù)、餐費支出金額、餐費支出次數(shù),購熱水支出金額、購熱水支出次數(shù)、淋浴支出金額、淋浴支出次數(shù)、商場購物金額、商場購物次數(shù)、用水支出金額、用水支出次數(shù)這些消費屬性。神經(jīng)網(wǎng)絡(luò)通過調(diào)整這些節(jié)點之間相互連接的關(guān)系來進行預(yù)測貧困等級,隱藏層負責根據(jù)接收輸入層數(shù)據(jù)源并通過計算輸出結(jié)果給輸出層,它是連接輸入層和輸出層的橋梁,最后的輸出層節(jié)點代表A、B、C三種貧困等級。人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

      通過圖5可以清楚地看到餐費消費金額與總消費金額的相關(guān)性。對于絕大部分經(jīng)濟困難學(xué)生,餐費消費金額占總消費金額比重較大,且明顯可以發(fā)現(xiàn)餐費消費的線性變化與總消費金額的線性變化相似,因此為了使預(yù)測模型得到更好的優(yōu)化,對餐費數(shù)據(jù)一定要做好異常值處理。

      2.5? 模型驗證

      本文在訓(xùn)練集為三月和四月按學(xué)號匯總后的數(shù)據(jù)集不變的基礎(chǔ)上,通過對測試數(shù)據(jù)集的標準優(yōu)化來提高預(yù)測準確率。

      第一次本文以訓(xùn)練集共492條數(shù)據(jù)(其中A類貧困等級占比為18%,B類貧困等級占比為64.2%,C類貧困等級占比為17.6%),測試集為訓(xùn)練集近1/2的數(shù)據(jù),共250條數(shù)據(jù),隱藏層節(jié)點數(shù)為9,最大運行次數(shù)為500,精確度為的預(yù)測條件得出預(yù)測準確率為75.6%的結(jié)果。第二次以與第一次訓(xùn)練集、測試集相同,并在此基礎(chǔ)上對數(shù)據(jù)進行預(yù)處理得出預(yù)測準確率為75.9%的結(jié)果。

      第三次仍然以與第一次訓(xùn)練集、測試集相同,并在此基礎(chǔ)上刪除兩個月消費總次數(shù)小于15次、餐費支出次數(shù)小于5次的學(xué)生個體數(shù)據(jù),得出預(yù)測準確率為76.3%的結(jié)果。第三次的預(yù)測準確率相對具有參考價值且足夠優(yōu)化,可以作為最優(yōu)模型。將測試數(shù)據(jù)集放入已經(jīng)建好的神經(jīng)網(wǎng)絡(luò)模型中,將本來標注好的貧困等級跟預(yù)測得出的貧困等級進行對比,測試數(shù)據(jù)共233條,其中有178條數(shù)據(jù)符合標簽數(shù)值,預(yù)測準確率為76.3%。部分結(jié)果如表3所示。

      3? 結(jié)? 論

      從實驗結(jié)果來看,本文得出的最終模型還有一定的提高空間,未來若能夠從多維的數(shù)據(jù),包括學(xué)生成績數(shù)據(jù)等,對學(xué)生進行綜合評價,在經(jīng)濟困難學(xué)生的貧困等級預(yù)測上能夠比單一的一卡通消費數(shù)據(jù)更具有說服力。在移動支付的普及的背景下,目前尚不能采集到使用手機支付的數(shù)據(jù),這也會使預(yù)測產(chǎn)生偏差,未來在多維數(shù)據(jù)的補充下,預(yù)測的準確率會得到一定的提升。

      本文基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的高校經(jīng)濟困難學(xué)生認定模型,一定程度上彌補了傳統(tǒng)方法主觀性較強的局限性。但當前計算機模型預(yù)測無法做到百分百準確,而一旦出現(xiàn)錯誤,會影響到經(jīng)濟困難學(xué)生享受學(xué)生資助政策。故本人認為當下經(jīng)濟困難學(xué)生判定工作最終仍要以人工決定為主要依據(jù),同時輔以信息化技術(shù),運用數(shù)據(jù)分析方法給高校工作人員提供決策依據(jù),進一步提升高校學(xué)生資助工作的科學(xué)化水平。

      參考文獻:

      [1] 王煜,劉彤彤,郭磊.基于校園大數(shù)據(jù)的助學(xué)金獲取關(guān)鍵因素分析——以某高校一卡通數(shù)據(jù)為例 [J].中國教育信息化,2018(17):64-66.

      [2] 柴政,屈莉莉,彭貴賓.高校貧困生精準資助的神經(jīng)網(wǎng)絡(luò)模型 [J].數(shù)學(xué)的實踐與認識,2018,48(16):85-91.

      [3] HUANG W,LI F,LIAO X,et al. More money,better performerce?The effects of student loans and need-based grants in Chinas higher education [J].China Economic Review,2018(51):208-227.

      [4] 王慧健.基于神經(jīng)網(wǎng)絡(luò)方法的時間序列預(yù)測方案研究 [D].南京:南京郵電大學(xué),2019.

      [5] 金琳.基于數(shù)據(jù)挖掘的用戶行為分析研究 [J].電子商務(wù),2020(4):41-42.

      [6] 李冠利.基于RapidMiner數(shù)據(jù)挖掘技術(shù)的NCRE成績預(yù)測分析 [J].南京廣播電視大學(xué)學(xué)報,2018(4):80-82.

      [7] 馮曉媛.大數(shù)據(jù)挖掘技術(shù)應(yīng)用研究 [J].數(shù)學(xué)技術(shù)與應(yīng)用,2019,37(1):127-128.

      作者簡介:余楨偉(1992.10—),男,漢族,湖北黃梅人,助教,碩士,研究方向:數(shù)據(jù)挖掘、管理信息系統(tǒng);李媛(1998.01—),女,漢族,江蘇揚州人,本科,研究方向:信息管理與信息系統(tǒng)。

      猜你喜歡
      學(xué)生資助人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘
      基于人工神經(jīng)網(wǎng)絡(luò)的故障診斷專利淺析
      人工神經(jīng)網(wǎng)絡(luò)發(fā)展歷史與訓(xùn)練算法概述
      數(shù)據(jù)挖掘綜述
      基于人工神經(jīng)網(wǎng)絡(luò)的優(yōu)化配置研究
      軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
      高?!皞呜毨爆F(xiàn)象成因分析與應(yīng)對策略探究
      新媒體時代學(xué)生資助工作的探索與實踐
      淺談獨立院校輔導(dǎo)員在學(xué)生資助工作中的角色定位
      基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
      基于人工神經(jīng)網(wǎng)絡(luò)的經(jīng)濟預(yù)測模型
      惠来县| 桐城市| 遂溪县| 顺义区| 哈密市| 海门市| 登封市| 廉江市| 沽源县| 安远县| 依安县| 彭泽县| 英德市| 崇州市| 彭州市| 大洼县| 方正县| 和林格尔县| 五大连池市| 绥阳县| 吕梁市| 耒阳市| 绥中县| 枞阳县| 镇宁| 汤原县| 宜阳县| 兴业县| 开阳县| 麻栗坡县| 石阡县| 玛沁县| 囊谦县| 黔西| 抚宁县| 抚州市| 洮南市| 南涧| 宜黄县| 大埔县| 青神县|