李書(shū)翔 趙裕慧 陳曉
摘要:現(xiàn)有的家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定方法都不可避免的出現(xiàn)主觀(guān)性、片面性的問(wèn)題,造成認(rèn)定結(jié)果的不準(zhǔn)確。文章通過(guò)探討數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的可行性,構(gòu)建理論模型,將數(shù)據(jù)挖掘技術(shù)運(yùn)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過(guò)程。
關(guān)鍵詞:家庭經(jīng)濟(jì)困難認(rèn)定;數(shù)據(jù)挖掘;理論模型
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)志碼:A文章編號(hào):2095-9214(2016)10-0293-01
一、問(wèn)題提出
根據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),2015年,全國(guó)高校在校學(xué)生人數(shù)超過(guò)2600萬(wàn)人,教育部2016年8月新聞發(fā)布會(huì)公布數(shù)據(jù)顯示,2015年,全國(guó)高等學(xué)校國(guó)家助學(xué)金受助學(xué)生達(dá)到1073萬(wàn)人次,由此可見(jiàn),2015年全國(guó)高校在校家庭經(jīng)濟(jì)困難學(xué)生比例已超過(guò)40%,這僅僅是得到認(rèn)定的家庭經(jīng)濟(jì)困難學(xué)生,而家庭經(jīng)濟(jì)困難學(xué)生申請(qǐng)人數(shù)遠(yuǎn)遠(yuǎn)高于這一比例。面對(duì)數(shù)量如此龐大的家庭經(jīng)濟(jì)困難學(xué)生群體,如何精確的確定學(xué)生家庭經(jīng)濟(jì)困難等級(jí)這一問(wèn)題是做好大學(xué)生精準(zhǔn)扶貧的先決條件,同時(shí)提高學(xué)生資助工作的效率和效益。
二、現(xiàn)有家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定方法述評(píng)
2007年,教育部、財(cái)政部聯(lián)合下發(fā)《關(guān)于認(rèn)真做好家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定工作的指導(dǎo)意見(jiàn)》,對(duì)于家庭經(jīng)濟(jì)困難學(xué)生的認(rèn)定工作進(jìn)行了規(guī)范。各高校根據(jù)學(xué)校、學(xué)生特點(diǎn)發(fā)展出一系列的困難生認(rèn)定辦法,這些辦法主要有:
1.民主評(píng)議法。學(xué)生填寫(xiě)《高等學(xué)校學(xué)生及家庭情況調(diào)查表》、《高等學(xué)校家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定申請(qǐng)表》;學(xué)校成立各級(jí)困難生認(rèn)定小組,根據(jù)學(xué)生條件及在校期間日常消費(fèi)行為等情況進(jìn)行評(píng)議,形成學(xué)生是否困難以及困難等級(jí)的初步結(jié)果;初評(píng)結(jié)果經(jīng)公示與學(xué)校再評(píng)之后確定學(xué)生困難等級(jí)并進(jìn)行資助;認(rèn)定結(jié)果半年之后再進(jìn)行復(fù)查,最終確定本學(xué)年家庭經(jīng)濟(jì)困難學(xué)生名單。
民主評(píng)議的結(jié)果存在主觀(guān)性太強(qiáng)的問(wèn)題,認(rèn)定結(jié)果很難做到公平、公正。主要因?yàn)椋阂皇菍W(xué)生由于趨利思想,提供的《家庭經(jīng)濟(jì)調(diào)查表》存在主觀(guān)性較強(qiáng),信息不準(zhǔn)確的問(wèn)題;二是認(rèn)定小組的成員無(wú)法保證對(duì)全部申請(qǐng)者全面了解,在認(rèn)定過(guò)程中也存在主觀(guān)臆測(cè)等問(wèn)題。
2.條件匹配法。不少學(xué)校意識(shí)到民主評(píng)議法存在的問(wèn)題,逐漸通過(guò)歸納家庭經(jīng)濟(jì)困難學(xué)生特點(diǎn)并用學(xué)生的具體情況進(jìn)行匹配的辦法完善認(rèn)定過(guò)程,主要有以下幾種[1]:(1)通過(guò)學(xué)生“一卡通”系統(tǒng)等信息歸納一定的標(biāo)準(zhǔn)來(lái)判定學(xué)生家庭經(jīng)濟(jì)情況;(2)根據(jù)高校所在地最低生活保障線(xiàn),學(xué)生消費(fèi)低于該水平則認(rèn)定為困難生;(3)設(shè)定一些特定指標(biāo),根據(jù)學(xué)生滿(mǎn)足指標(biāo)的數(shù)量確定其家庭經(jīng)濟(jì)困難程度。
條件匹配法能夠從一定程度上解決認(rèn)定過(guò)程中的主觀(guān)性問(wèn)題,但是以上的方法都存在指標(biāo)體系不明確、指標(biāo)不全面、缺乏統(tǒng)一標(biāo)準(zhǔn)、認(rèn)定標(biāo)準(zhǔn)過(guò)于單一沒(méi)有可比性、操作不規(guī)范主觀(guān)色彩濃重等特點(diǎn)。這種辦法可以確定學(xué)生的家庭經(jīng)濟(jì)是否困難,但是無(wú)法更進(jìn)一步的確定其家庭經(jīng)濟(jì)困難程度。
3.指標(biāo)打分法。近年來(lái),山東省內(nèi)部分高校逐步推行指標(biāo)打分法:建立起綜合評(píng)價(jià)家庭經(jīng)濟(jì)困難程度指標(biāo)體系,架構(gòu)困難生認(rèn)定系統(tǒng)。學(xué)生根據(jù)自身情況填寫(xiě)調(diào)查問(wèn)卷,系統(tǒng)根據(jù)學(xué)生填寫(xiě)情況自動(dòng)得出學(xué)生評(píng)分,全體申請(qǐng)學(xué)生根據(jù)這一評(píng)分綜合排序,從而確定家庭經(jīng)濟(jì)困難程度,依次開(kāi)展學(xué)生資助。
這種方式同時(shí)結(jié)合了定性與定量,相對(duì)來(lái)說(shuō)更加客觀(guān)合理。但是,也存在填寫(xiě)系統(tǒng)過(guò)程中存在主觀(guān)、趨利等現(xiàn)象。
困難生認(rèn)定經(jīng)過(guò)了從定性到定量的持續(xù)發(fā)展過(guò)程,困難生認(rèn)定的科學(xué)性、客觀(guān)性逐步加強(qiáng)。面對(duì)大量的家庭經(jīng)濟(jì)困難學(xué)生信息,提高認(rèn)定的準(zhǔn)確性需要長(zhǎng)期的探索。
三、數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的可行性分析
《高等學(xué)校學(xué)生及家庭情況調(diào)查表》中所調(diào)查的學(xué)生信息量十分大,加之還要綜合考慮學(xué)生在校期間具體消費(fèi)情況,因此一個(gè)學(xué)生所對(duì)應(yīng)的信息最多達(dá)到上百條。以一個(gè)三百人的年級(jí)為例,學(xué)生按照40%的比例申請(qǐng)認(rèn)定,一個(gè)年級(jí)困難生認(rèn)定所涉及到的數(shù)據(jù)就達(dá)到上萬(wàn)條,以此類(lèi)推,一個(gè)體量為三萬(wàn)人學(xué)校面臨的困難生認(rèn)定的信息將數(shù)以百萬(wàn)計(jì)。面對(duì)如此龐大的數(shù)據(jù)量,目前的應(yīng)用還停留在簡(jiǎn)單的備份、查詢(xún)、統(tǒng)計(jì)階段,可以說(shuō)是“數(shù)據(jù)豐富、知識(shí)匱乏”。
在海量數(shù)據(jù)背景下綜合考慮家庭經(jīng)濟(jì)困難學(xué)生各項(xiàng)指標(biāo),減少評(píng)價(jià)過(guò)程中的主觀(guān)因素,并進(jìn)一步的提取出有用的規(guī)則和相關(guān)的知識(shí)。基于此,我們引入數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是指從看似無(wú)規(guī)律的大量數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的信息的過(guò)程,他通過(guò)分析海量數(shù)據(jù)的每一條信息并從中尋找某種規(guī)律、關(guān)聯(lián)或者結(jié)論。數(shù)據(jù)挖掘技術(shù)應(yīng)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過(guò)程的可行性如下:首先,家庭經(jīng)濟(jì)困難學(xué)生數(shù)據(jù)庫(kù)儲(chǔ)存的海量數(shù)據(jù)為數(shù)據(jù)挖掘提供了“原材料”支持;其次,數(shù)據(jù)挖掘技術(shù)強(qiáng)調(diào)技術(shù)的發(fā)現(xiàn)與提取過(guò)程,側(cè)重于從全部數(shù)據(jù)中尋找有用的知識(shí),這就避免了以往認(rèn)定過(guò)程中有側(cè)重的虛報(bào)個(gè)人信息的行為,盡量做到客觀(guān)、全面;最后,隨著研究的深入,數(shù)據(jù)挖掘技術(shù)也愈加豐富,為分析海量困難生數(shù)據(jù)提供了技術(shù)支持。
四、數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的應(yīng)用探索
數(shù)據(jù)挖掘應(yīng)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過(guò)程的路徑如下:對(duì)已經(jīng)評(píng)價(jià)的貧困生數(shù)據(jù)進(jìn)行分類(lèi),找出與貧困生類(lèi)別相關(guān)的貧困因素,再對(duì)未知類(lèi)別的貧困生做出預(yù)測(cè),結(jié)果與原有結(jié)果比較,檢測(cè)模型效果,完成挖掘任務(wù)。最后提取規(guī)則應(yīng)用于家庭經(jīng)濟(jì)困難的評(píng)價(jià)和管理工作。建立如圖1的完整的基于數(shù)據(jù)挖掘技術(shù)的家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定系統(tǒng)。
1.家庭經(jīng)濟(jì)困難學(xué)生信息庫(kù)。該信息庫(kù)基于高校每年通過(guò)認(rèn)定的家庭經(jīng)濟(jì)困難學(xué)生數(shù)據(jù)建立,涵蓋學(xué)生個(gè)人及家庭的全部信息。
2.數(shù)據(jù)處理子系統(tǒng)。通過(guò)一定的數(shù)據(jù)清洗與預(yù)處理的手段,將信息庫(kù)中的數(shù)據(jù)調(diào)整為能夠被數(shù)據(jù)挖掘子系統(tǒng)使用的標(biāo)準(zhǔn)數(shù)據(jù)集。這個(gè)過(guò)程主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等幾個(gè)方面。
3.數(shù)據(jù)挖掘子系統(tǒng)。接著利用數(shù)據(jù)挖掘算法構(gòu)建貧困生評(píng)價(jià)模型,對(duì)貧困生進(jìn)行分類(lèi)。如果得到的模型不能滿(mǎn)足要求,需要返回前面的步驟,考慮算法的選擇、數(shù)據(jù)的預(yù)處理結(jié)果是否需要調(diào)整,經(jīng)過(guò)調(diào)優(yōu)得到較優(yōu)模型[1]。由于家庭經(jīng)濟(jì)困難學(xué)生的認(rèn)定主要涉及分類(lèi)與預(yù)測(cè)的問(wèn)題,常用于這些問(wèn)題的算法有貝葉斯網(wǎng)絡(luò)、決策樹(shù)、META等。
4.學(xué)生分類(lèi)與學(xué)生資助子系統(tǒng)。這兩個(gè)系統(tǒng)是對(duì)家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定結(jié)果的應(yīng)用。學(xué)生資助子系統(tǒng)的結(jié)果可以返回到學(xué)生信息庫(kù)中,為下一次的數(shù)據(jù)挖掘提供數(shù)據(jù)支持。
(作者單位:濟(jì)南大學(xué)外國(guó)語(yǔ)學(xué)院學(xué)生工作辦公室)
參考文獻(xiàn):
[1]楊知玲.數(shù)據(jù)挖掘在高校貧困生評(píng)價(jià)中的應(yīng)用研究[D].華南理工大學(xué), 2015