洪一洋+李玥玥
【摘 要】社團活動是高校第二課堂的重要載體,學生參與度不僅為評價高等教育質(zhì)量提供了新視角,其數(shù)據(jù)還可成為學生分類研究的基礎,對高校社團管理提供科學依據(jù)。本研究應用weka軟件對學生活動參與度進行數(shù)據(jù)挖掘的關聯(lián)分析,通過分析學生活動參與度不同時間的差異變化,將數(shù)據(jù)分析引入日常學生工作,對高校社團進行更科學有效的管理。
【關鍵詞】關聯(lián)分析;weka;活動參與度;社團管理;高校第二課堂
0 引言
以學生為中心是現(xiàn)代大學強調(diào)的教育理念,特別是在高等教育大眾化階段,學生群體類型隨著學生數(shù)量的增加出現(xiàn)了新變化,同時高校社團的管理也成為衡量教育質(zhì)量的一種方式。如今以大學生為主體的高校社團數(shù)量上急劇增加,但質(zhì)量卻逐漸產(chǎn)生很大的差異分化,許多社團疏于管理和引導,導致許多大學生對社團活動的參與度逐漸降低。
隨著學校共青團深化改革的不斷深入和推進,作為高校共青團具有戰(zhàn)略意義的制度創(chuàng)新和高校素質(zhì)教育的新探索——高校共青團“第二課堂成績單”逐漸引領新的趨勢。社團作為第二課堂載體的一部分,對學生從多方面進行性格和能力的補充,要想客觀地從第二課堂管理和引導學生,就應對不同類型學生的心理和行為特征進行分類個性化研究。
通過大學生參與社團活動的信息記錄,進行數(shù)據(jù)挖掘和分析,用科學的信息管理方法了解學生活動參與度變化的原因,從感性的方式轉(zhuǎn)變?yōu)榱炕慕嵌?,針對性地改善社團質(zhì)量、改變管理方式,真正做到“因材施教”。
1 理論與應用
1.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining)是指從數(shù)據(jù)庫中挖掘信息模式發(fā)現(xiàn)知識模式的一個完整過程,是從海量的、非完整的、模糊的、隨機的數(shù)據(jù)集中,提取隱含在人們事先不知道領域且具有潛在價值信息的過程。
數(shù)據(jù)挖掘的過程,大體分為四步——明確挖掘目的、數(shù)據(jù)預處理、數(shù)據(jù)挖掘、后續(xù)處理。關聯(lián)規(guī)則挖掘是指從事務數(shù)據(jù)庫、關系數(shù)據(jù)庫和其他信息存儲中的大量數(shù)據(jù)集之間發(fā)現(xiàn)頻繁出現(xiàn)的模式、關聯(lián)和相關性。
1.2 Weka軟件
Weka全稱為懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個基于純Java技術并應用于數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的開源項目。歷經(jīng)十多年的發(fā)展,Weka已成為如今最完備的數(shù)據(jù)挖掘工具之一,用于數(shù)據(jù)挖掘的二次開發(fā)和算法研究,被譽為數(shù)據(jù)挖掘和機器學習歷史上的里程碑。
1.3 關聯(lián)分析
關聯(lián)分析是一種自動型數(shù)據(jù)分析與挖掘技術,作為數(shù)據(jù)挖掘技術最常用的方法,最早應用于分析消費者交易記錄中隱藏的購物模式,主要目的是從大量數(shù)據(jù)中尋找商品間關聯(lián)性的描述,以制定商品組合的營銷策略。
運用關聯(lián)分析進行數(shù)據(jù)挖掘時,只需將收集的數(shù)據(jù)按專業(yè)軟件的要求進行適當?shù)某槿?、預處理,并組織形成分析用的數(shù)據(jù)集合,在事務數(shù)據(jù)庫中設定支持度和置信度等相關參數(shù)等強關聯(lián)規(guī)則,剩下的工作全部由軟件完成,用戶只需對處理結(jié)果進行檢驗和分析即可。
2 實證研究數(shù)據(jù)的選取
2.1 數(shù)據(jù)選取依據(jù)和來源
學生活動參與度記錄是由筆者所在社團組織部,每次活動指派人員負責現(xiàn)場簽到得到的,采取活動開始前和活動結(jié)束后兩次簽到的方式,保證樣本數(shù)據(jù)的科學性和準確性。
筆者所在社團新一屆成員共32名,從工作記錄中查閱本學期各項工作活動的簽到記錄,用Excel進行數(shù)據(jù)的錄入,同時將中文字符刪除更換為X1、X2、X3……X8,將“參加”更換為YES標簽,檢查無誤后即完成了學生活動參與度的原始數(shù)據(jù)統(tǒng)計。
2.2 數(shù)據(jù)處理過程
數(shù)據(jù)處理過程主要是對數(shù)據(jù)原格式進行轉(zhuǎn)換,學生活動參與度的原始數(shù)據(jù)是Excel文件保存的xlsx格式數(shù)據(jù),需轉(zhuǎn)換成Weka支持的arff或csv文件格式。由于Weka對arff格式的支持更好,故筆者優(yōu)先選擇arff格式作為分類器原始數(shù)據(jù)的保存格式,數(shù)據(jù)預處理如圖1所示。
將activity.xlsx另存為activity.csv文件,運行Weka軟件,打開剛才通過Excel保存得到的activity.csv,將其保存為Arff data files(*.arff)文件類型,最終得到的數(shù)據(jù)文件為activity.arff。
3 數(shù)據(jù)挖掘?qū)嵶C研究
橫向?qū)Ρ确治?,對原?shù)據(jù)設定8個標簽(X1、X2、X3、X4、X5、X6、X7、X8),用Excel表格中用函數(shù)=COUNTIF(B5:B36,$B$42)計算不同標簽出現(xiàn)真值(YES)的頻率,并計算其所占百分比。
為從學生社團活動參與度數(shù)據(jù)中挖掘出更可靠且可能給活動組織舉辦提供建議的活動項目組合,本實證研究將Weka軟件進行關聯(lián)分析算法的參數(shù)——最小支持度lower Bound Min Support設定為0.3,即參加了前一活動的社團成員至少有30%的可能性參加后一個活動;將最小置信度min Metric設定為0.6,即至少有60%的可能性同時參加兩次活動。
設定完參數(shù)后啟動關聯(lián)規(guī)則的數(shù)據(jù)挖掘,整個規(guī)則的挖掘過程都由軟件直接自動完成,最終從學生活動參與度的統(tǒng)計數(shù)據(jù)中獲得置信度最高的12條關聯(lián)規(guī)則,如表1所示。
縱向關聯(lián)分析:
通過Weka分析得出的關聯(lián)規(guī)則共21條,因考慮學生活動實際參與情況的影響,這里只考慮分析置信度最高的10條規(guī)則。
1.在參加暑期實踐報告會彩排的同學中,79%同時也參加團校培訓開班儀式;
2.在參加演講比賽初賽的同學中,75%同時也參加了內(nèi)部培訓;
……(規(guī)則解讀類似,此處省略)
9.在參加團校培訓開班儀式的同學中,71%同時也參加了內(nèi)部培訓;
10.在參加演講比賽初賽的同學中,69%同時也參加了團校培訓開班儀式。
4 結(jié)論與對策建議
4.1 研究結(jié)論
在筆者所在社團里,本學期學生活動參與度相比而言處于較低水平,結(jié)合當時實際情況,從兩個不同角度分析其原因,對社團管理提出建議。
橫向?qū)Ρ确治觯顒訁⑴c比例超過60%僅只有一個活動——X5內(nèi)部培訓,活動參與度百分比低于50%的卻有2個活動——X2演講比賽決賽、X7暑期實踐報告會彩排。
新生的入學為高校社團注入了新的活力,將開學以來每次活動按時間進行列舉分析(如圖2所示),新生在入學后對大學的適應過程存在著一定的波動起伏,對大學生活初次接觸的新奇和陌生導致9月初到9月中旬,社團成員對開展的學生活動參與度不是很高,呈下降趨勢。
而在9月中旬持續(xù)到10月中旬,近1個多月的時間里,社團成員對學生活動的參與度大幅度增加,原因分析有兩方面:一方面因為新生進入大學一段時間后,帶著全新的認識一定程度上調(diào)整了生活狀態(tài),逐漸進入正常軌跡;另一方面隨著對大學了解的深入,新生對社團活動新奇度不斷增加,促使其活動參與度也逐漸提高。
到達峰值點是10月中旬X5內(nèi)部培訓,因為在此活動中是office和Photoshop等常用軟件的應用教學,“純干貨”的知識和經(jīng)驗吸引了社團成員對活動的熱情,因此學生活動參與度達到22人,占比例68.8%。
10月中旬以后,社團成員對學生活動的參與度又出現(xiàn)降低現(xiàn)象,說明新生在入學后因活動頻繁、趣味性不強等原因,逐漸對活動失去了最初的熱情,同時因為進入大學生活后可能產(chǎn)生一定的厭倦情緒,導致對學生活動的參與度達不到之前的水平。
縱向關聯(lián)分析,通過對不同活動之間的關聯(lián)數(shù)據(jù)比較,可以發(fā)現(xiàn)暑期社會實踐與團校培訓開班儀式、演講比賽和內(nèi)部培訓、手繪涂鴉大賽和社團聚餐、暑期實踐報告會和內(nèi)部培訓的每兩個活動之間存在一定的聯(lián)系,如果利用好這些內(nèi)在關聯(lián),將活動“捆綁式”策劃,對社團人員管理和活動的開展有著重要的意義。
4.2 對策建議
橫向?qū)Ρ?,在對社團今后的管理上,可結(jié)合不同活動舉辦時的學生活動參與度進行考慮,轉(zhuǎn)變思維從參與人的角度進行策劃。舉辦不同活動時調(diào)整活動的形式,結(jié)合微博微信等網(wǎng)絡新媒體,讓活動更貼近青年的生活和興趣。
縱向關聯(lián)分析,比較不同活動之間的關聯(lián)信息,可在社團管理和活動舉辦前,考慮不同活動是否可以結(jié)合,盡可能提高活動的參與度。通過剛才的數(shù)據(jù)挖掘發(fā)現(xiàn),不同活動間存在一定的聯(lián)系,將此類活動同一時間舉辦不僅提高了活動內(nèi)容的豐富性,還對社團活動的整體效果和實際意義產(chǎn)生積極的作用。
第二課堂是引領青年學生成長成才的“指揮棒”,是促進當代大學生融入社會的“通行證”,高校社團作為第二課堂的重要載體,嘗試改革創(chuàng)新,改變原先固定傳統(tǒng)的活動形式,以科學的角度在高校社團的組織和管理上進行有效的調(diào)整,讓大學生真正從社團活動中得到成長和進步。
【參考文獻】
[1]盧媛媛,張劍,何海燕.基于WEKA的客戶分類信息系統(tǒng)研究[J].計算機工程與科學,2011(5):132-135.
[2]鄧曉梅.基于數(shù)據(jù)挖掘的電信客戶細分模型研究[D].大連理工大學,2006.
[責任編輯:楊玉潔]