• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)驅(qū)動的學(xué)校疫情預(yù)測模型的構(gòu)建研究

      2021-01-07 07:27:40趙薈宇王琦崔占
      中國信息技術(shù)教育 2020年24期
      關(guān)鍵詞:生病神經(jīng)網(wǎng)絡(luò)變量

      趙薈宇 王琦 崔占

      1.北京師范大學(xué)教育學(xué)部

      2.北京師范大學(xué)未來教育高精尖創(chuàng)新中心

      3.清華大學(xué)附屬小學(xué)信息中心

      近年來,除極端天氣等原因外,季節(jié)性疫情造成北京市中小學(xué)多次區(qū)域性停課。我國中小學(xué)校在應(yīng)對突發(fā)疾病方面缺乏預(yù)警能力,除了定期進(jìn)行疾病防控以外,一般是在疫情出現(xiàn)后才開始消毒清潔,這種滯后的應(yīng)對方式效果較差,給學(xué)校的教學(xué)、管理等工作的開展造成困難,不利于相關(guān)教育衛(wèi)生資源的合理配置和使用。[1-2]因此,結(jié)合相關(guān)數(shù)據(jù)建立一套預(yù)警模型,為教育資源配置和疫情預(yù)警提供有針對性的指導(dǎo)是很有必要的。本文以北京市某小學(xué)一年內(nèi)的數(shù)據(jù)為基礎(chǔ),利用人工神經(jīng)網(wǎng)絡(luò)(ANN)在目標(biāo)預(yù)測領(lǐng)域的優(yōu)勢,構(gòu)建學(xué)校疫情預(yù)測模型,以期為區(qū)域教育信息化、深度學(xué)習(xí)技術(shù)在教育管理領(lǐng)域的應(yīng)用提供參考模型和實(shí)踐指導(dǎo)。

      圖1 基于BP神經(jīng)網(wǎng)絡(luò)的學(xué)校疫情預(yù)測模型

      ● 研究設(shè)計(jì)

      1.研究思路

      前饋神經(jīng)網(wǎng)絡(luò)是最基礎(chǔ)的人工神經(jīng)網(wǎng)絡(luò),其內(nèi)核是BP算法。人工神經(jīng)網(wǎng)絡(luò)采用分布式存儲、計(jì)算非線性數(shù)據(jù),避免人為因素的參與,并依靠其本身強(qiáng)大的計(jì)算能力與學(xué)習(xí)能力,使研究數(shù)據(jù)經(jīng)過大量數(shù)據(jù)的訓(xùn)練后更加接近實(shí)際,從而提高了目標(biāo)預(yù)測的精準(zhǔn)度。本文利用神經(jīng)網(wǎng)絡(luò)在目標(biāo)預(yù)測領(lǐng)域的優(yōu)勢,對學(xué)校疫情預(yù)測模型進(jìn)行構(gòu)建,如上頁圖1所示。本文首先將原始數(shù)據(jù)進(jìn)行處理,提取相關(guān)的特征變量,導(dǎo)入到設(shè)計(jì)好的神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練和測試。用戶可以對模型輸入指定的特征變量,隨后獲得學(xué)校生病人數(shù)的預(yù)測結(jié)果反饋。

      2.數(shù)據(jù)處理

      (1)數(shù)據(jù)來源

      本文的研究數(shù)據(jù)來源于北京市某所重點(diǎn)小學(xué),時(shí)間跨度為2018年2月至2019年6月。該數(shù)據(jù)的學(xué)生分布情況,以2019年數(shù)據(jù)為例,包括一年級學(xué)生(2018年9月入校)244人,二至五年級學(xué)生709人,總計(jì)學(xué)生953人。原始數(shù)據(jù)2320條。該數(shù)據(jù)主要由學(xué)生家長、教師每天填寫并提交到指定平臺,部分?jǐn)?shù)據(jù)內(nèi)容如表1所示。

      表1

      (2)數(shù)據(jù)清洗和預(yù)處理

      該數(shù)據(jù)的提交平臺于2018年2月投入使用,在初期,存在學(xué)生家長、教師對該平臺的熟悉度較差,使用頻率不足的現(xiàn)象。為避免此類原因造成的影響,本文已刪除前兩個(gè)月的數(shù)據(jù),保留2018年4月至2019年6月的數(shù)據(jù)作為總數(shù)據(jù)集。由于學(xué)生家長、教師誤操作或系統(tǒng)出錯(cuò)等原因,數(shù)據(jù)中會存在某一學(xué)生在某天請假多次的情況,本文按照每天每條數(shù)據(jù)的序號,以最后編輯提交的數(shù)據(jù)為準(zhǔn),剔除多余的重復(fù)數(shù)據(jù)。最終,清洗后的數(shù)據(jù)為2264條,其中病假1807條,事假457條。

      在神經(jīng)網(wǎng)絡(luò)訓(xùn)練前,需要將清洗后的數(shù)據(jù)集進(jìn)行整理。首先,本文按照日期排序,設(shè)置起始時(shí)間為2018年4月2日,結(jié)束時(shí)間為2019年6月30日,剔除事假人數(shù),將每天生病人數(shù)進(jìn)行統(tǒng)計(jì)匯總,得出當(dāng)天學(xué)校內(nèi)學(xué)生因病請假的總?cè)藬?shù),其中,不足1天的,按當(dāng)天1人次處理,最終獲得有效數(shù)據(jù)為455條。

      目前,呼吸道疾病是影響青少年健康和導(dǎo)致學(xué)生缺課的主要原因。[3]本文主要選取10個(gè)可能造成青少年呼吸道疾病的外部因素作為變量,如表2所示。

      表2

      選取的指標(biāo)主要包括季節(jié)(1~4)、月份(1~12)、是否為假期(0~1)、星期(1~7)、最高溫度、最低溫度、平均溫度、天氣(1~11)、平均風(fēng)速、空氣質(zhì)量(1~6)等。其中,天氣指標(biāo)的11個(gè)層級為晴、多云、陰、陣雨、小雨、中雨、大雨、雨夾雪、小雪、霾、揚(yáng)沙;空氣質(zhì)量指標(biāo)的6個(gè)層級為優(yōu)、良、輕度污染、中度污染、重度污染、嚴(yán)重污染。由于每學(xué)年學(xué)???cè)藬?shù)不同,需計(jì)算學(xué)校每天學(xué)生生病率,公式為(Sicked/N)*100%,其中Sicked為當(dāng)天生病人數(shù),N為當(dāng)前學(xué)校總?cè)藬?shù)。

      在本文的數(shù)據(jù)集中,有很多變量都屬于類型變量,如Season=1、2、3、4,分別代表四個(gè)季節(jié),而在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中不能將Season變量直接輸入到神經(jīng)網(wǎng)絡(luò),這是因?yàn)镾eason的數(shù)值越高并不表示與之對應(yīng)的信號強(qiáng)度越大。本文的解決方案是將該類型變量的不同數(shù)值用一個(gè)“一位熱碼”(One-hot)來編碼,如圖2所示,本文已對表2中的

      圖2 將Season變量進(jìn)行One-Hot編碼Season、Mnth、Vac、Week、Met、Airq等6個(gè)變量進(jìn)行了One-Hot編碼處理,并在剔除序號、日期等不相關(guān)特征后,得到該數(shù)據(jù)集的變量特征總數(shù)為45個(gè)。

      由于數(shù)據(jù)集中每個(gè)數(shù)值型變量都是相互獨(dú)立的,所以它們的數(shù)值絕對大小與研究問題的本身沒有關(guān)系,為了消除數(shù)值大小的差異,本文對每一個(gè)數(shù)值型變量進(jìn)行標(biāo)準(zhǔn)化處理,即讓每個(gè)變量的數(shù)值都圍繞著0左右波動。例如,對于平均溫度Atemp這個(gè)變量來說,它在整個(gè)數(shù)據(jù)集中的平均值為Mean(Atemp),方差為Std(Atemp),如下方公式所示,其目的是將不同的取值范圍的變量設(shè)置為讓它們處于一個(gè)平等的地位。本文已對Ttemp、Ltemp、Atemp、Wind等4個(gè)變量進(jìn)行了歸一化處理。

      3.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)

      (1)神經(jīng)網(wǎng)絡(luò)的構(gòu)建

      人工神經(jīng)網(wǎng)絡(luò)實(shí)際上就是多層復(fù)合函數(shù)的鏈?zhǔn)椒▌t,本文采用三層前饋神經(jīng)網(wǎng)絡(luò),如圖3所示,最左側(cè)X=(X1,X2,……,Xn)為輸入向量,中間Z=(Z1,Z2,……,Zt)是隱含層的輸出向量,最右側(cè)Y是輸出層的輸出向量,Wi是輸入層至隱含層的權(quán)重,Wj是隱含層至輸出層的權(quán)重,隱含層初始偏置為a。根據(jù)數(shù)據(jù)集的總特征數(shù),該神經(jīng)網(wǎng)絡(luò)輸入層有45個(gè)節(jié)點(diǎn),即n=45。本文采用1個(gè)隱含層的BP網(wǎng)絡(luò)來實(shí)現(xiàn),其中隱含層節(jié)點(diǎn)數(shù)量t為10,輸出節(jié)點(diǎn)數(shù)為1。

      (2)神經(jīng)網(wǎng)絡(luò)的初始化與訓(xùn)練

      由于數(shù)據(jù)量有限,為充分利用有限的數(shù)據(jù)訓(xùn)練該神經(jīng)網(wǎng)絡(luò),本文將前430天的數(shù)據(jù)作為訓(xùn)練集,將后7周(49天)的數(shù)據(jù)作為測試集,設(shè)置網(wǎng)絡(luò)的學(xué)習(xí)速率為0.01,將訓(xùn)練數(shù)據(jù)迭代訓(xùn)練1000次,設(shè)置每次訓(xùn)練的Batch大小為128。

      在神經(jīng)網(wǎng)絡(luò)向前傳輸?shù)倪^程中,先隨機(jī)初始化權(quán)重和偏置,經(jīng)過隱含層節(jié)點(diǎn)時(shí)選用Sigmoid函數(shù)作為激活函數(shù),將輸出結(jié)果加權(quán)求和后與真實(shí)值比較,并計(jì)算誤差,進(jìn)行反向傳輸和參數(shù)修正。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)主要蘊(yùn)含在權(quán)重和偏置中,從輸出層開始,神經(jīng)網(wǎng)絡(luò)首先對輸出值跟實(shí)際值進(jìn)行比較,將計(jì)算誤差的偏導(dǎo)數(shù)反向傳播給隱含層神經(jīng)元,隱含層神經(jīng)元利用這個(gè)偏導(dǎo)數(shù)進(jìn)行加權(quán)求和,從而調(diào)節(jié)隱含層到輸出層之間的連邊權(quán)重與偏置,同樣,根據(jù)隱含層神經(jīng)元的均方誤差,來調(diào)節(jié)輸入層到隱含層之間的連邊權(quán)重與偏置。

      ● 實(shí)驗(yàn)結(jié)果與啟示

      1.實(shí)驗(yàn)結(jié)果

      (1)神經(jīng)網(wǎng)絡(luò)的損失值

      本文將訓(xùn)練數(shù)據(jù)迭代訓(xùn)練1000次,并對每100次的損失值(誤差)進(jìn)行收集,通過Matplotlib進(jìn)行繪制后,結(jié)果如下頁圖4所示。其中,橫坐標(biāo)代表訓(xùn)練次數(shù),縱坐標(biāo)代表損失值??梢?,在每次訓(xùn)練過后,該神經(jīng)網(wǎng)絡(luò)的損失值均有所下降,大約在第400次訓(xùn)練以后,損失值降低至0.3以下。本次實(shí)驗(yàn)的最終損失值約為0.2492,表明該神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是成功的。

      (2)神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果

      最后,本文將最后7周(49天)的數(shù)據(jù)進(jìn)行預(yù)測,并通過Matplotlib進(jìn)行繪制,如下頁圖5所示。其中,實(shí)線代表數(shù)據(jù)的真實(shí)值,虛線為神經(jīng)網(wǎng)絡(luò)的預(yù)測值。可見,該神經(jīng)網(wǎng)絡(luò)可以模擬該學(xué)校學(xué)生生病人數(shù)的大致趨勢。

      觀察圖5可以發(fā)現(xiàn),圖中前兩周神經(jīng)網(wǎng)絡(luò)的預(yù)測值低于實(shí)際值,而后兩周的預(yù)測值高于實(shí)際值。在與該學(xué)校教師的交流后得知,5月中旬該校正在舉辦為期兩周的足球聯(lián)賽,許多學(xué)生在高溫天氣中訓(xùn)練、比賽、助威,其間的生病人數(shù)明顯多于其他時(shí)間段;而6月底正值該校的期末,為了加緊復(fù)習(xí),許多學(xué)生患病來校學(xué)習(xí),這是導(dǎo)致神經(jīng)網(wǎng)絡(luò)預(yù)測產(chǎn)生偏差的主要原因。

      圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

      圖4 預(yù)測模型的損失值曲線

      圖5 預(yù)測模型預(yù)測值與實(shí)際值曲線

      2.啟示

      從以上結(jié)果可以看出,基于人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的預(yù)測模型可以預(yù)測學(xué)校的生病人數(shù)及變化趨勢,教育管理者可針對預(yù)測結(jié)果提前做好疫情的防控工作,但該神經(jīng)網(wǎng)絡(luò)并不完善,發(fā)現(xiàn)并解決神經(jīng)網(wǎng)絡(luò)存在的問題,對充分發(fā)揮人工智能技術(shù)的優(yōu)勢、高效合理地利用教育資源具有積極意義。

      (1)數(shù)據(jù)的數(shù)量與質(zhì)量

      數(shù)據(jù)在作為訓(xùn)練樣本時(shí),其本身的復(fù)雜性、多樣性、稀疏性、冗余性和缺失值等將對模型的訓(xùn)練效果有很大影響。為此,學(xué)校、地區(qū)應(yīng)持續(xù)做好相應(yīng)疾病類別、數(shù)量、病因等的記錄與保留,而不僅限于記錄病假人數(shù)與事假人數(shù),從而為后續(xù)的研究提供數(shù)據(jù)支撐。

      (2)數(shù)據(jù)集的維度

      針對學(xué)生生病所選取的外部因素指標(biāo)仍需改善。本文僅列舉了10個(gè)外部因素變量,仍有其他導(dǎo)致學(xué)生生病的外部因素需要補(bǔ)充。此外,環(huán)境變量、生病人數(shù)也會對神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果造成影響,這就需要后續(xù)對數(shù)據(jù)集進(jìn)行修改,并引入LSTM等記憶類算法,對神經(jīng)網(wǎng)絡(luò)進(jìn)行完善,提高預(yù)測的精準(zhǔn)度。

      (3)其他神經(jīng)網(wǎng)絡(luò)算法

      當(dāng)深度學(xué)習(xí)模型應(yīng)用于其他教育問題,遇到類似數(shù)據(jù)量較少的問題時(shí),可以采用遷移學(xué)習(xí)的方式,將已有的、大批量的數(shù)據(jù)集進(jìn)行神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練,通過遷移學(xué)習(xí)算法對該神經(jīng)網(wǎng)絡(luò)進(jìn)行再訓(xùn)練,也可以提高神經(jīng)網(wǎng)絡(luò)預(yù)測的精準(zhǔn)度。

      ● 結(jié)語

      本文從數(shù)據(jù)角度出發(fā),利用已有數(shù)據(jù)對學(xué)校學(xué)生的生病人數(shù)進(jìn)行預(yù)測,以作案例研究。本文以2018年2月至2019年6月期間北京市某小學(xué)每天生病人數(shù)的數(shù)據(jù)為基礎(chǔ),建立疫情預(yù)測模型。從結(jié)果來看,預(yù)測值與實(shí)際值偏差較小、趨勢相近,擬合精度較高。因此,教育管理者可以根據(jù)該模型的輸出結(jié)果,做好衛(wèi)生疾病的防控工作,并合理配置相應(yīng)地區(qū)的教育衛(wèi)生資源。

      猜你喜歡
      生病神經(jīng)網(wǎng)絡(luò)變量
      預(yù)防做好 牛生病少
      抓住不變量解題
      也談分離變量
      “生病”的一天
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      生病的快樂
      生病真難受
      快樂語文(2019年12期)2019-06-12 08:41:56
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      SL(3,3n)和SU(3,3n)的第一Cartan不變量
      藁城市| 大足县| 大埔区| 微山县| 阳谷县| 泗洪县| 涟源市| 通榆县| 长泰县| 惠安县| 拉萨市| 六盘水市| 古浪县| 湖口县| 北票市| 神农架林区| 英吉沙县| 兰考县| 磐石市| 桦甸市| 民权县| 延长县| 林口县| 阿鲁科尔沁旗| 诏安县| 溧阳市| 曲麻莱县| 民权县| 咸宁市| 西盟| 龙门县| 广平县| 广德县| 桓仁| 新晃| 汶川县| 桓台县| 新丰县| 马关县| 同江市| 新巴尔虎右旗|