李 莉
(云南機(jī)電職業(yè)技術(shù)學(xué)院 云南 昆明 650203)
隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,以及經(jīng)濟(jì)水平的提高,在信息化時(shí)代信息的總量在不斷增加,人們尋找信息的能力也在加強(qiáng),但是積累的數(shù)據(jù)越來越多,能有效從大量數(shù)據(jù)中找到有價(jià)值信息的方法十分欠缺,人們發(fā)現(xiàn)雖然信息量很大,但是能找到自己所需要的有價(jià)值的信息卻更加困難,最終導(dǎo)致信息爆炸,而人們卻處于信息匱乏中。因此,數(shù)據(jù)挖掘技術(shù)的產(chǎn)生成為人們找尋有價(jià)值信息的好幫手,目前數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用在商業(yè)、醫(yī)療和科技領(lǐng)域。針對當(dāng)前在教育領(lǐng)域數(shù)據(jù)挖掘技術(shù)還未被廣泛應(yīng)用的現(xiàn)狀,本文主要分析數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中可被利用的地方,然后對其改進(jìn)探索提幾點(diǎn)看法。
數(shù)據(jù)挖掘技術(shù)指的是在明確數(shù)據(jù)挖掘目標(biāo)的基礎(chǔ)上,利用人工智能、集合論、統(tǒng)計(jì)學(xué)等技術(shù)在大量的,隨機(jī)的數(shù)據(jù)堆中提取隱藏的,被人們忽視的,但是又十分有用的信息。然后對所提取的數(shù)據(jù)通過數(shù)據(jù)挖掘算法進(jìn)行分析,最后通過可視化的工具描述所提取的數(shù)據(jù)信息,并表達(dá)數(shù)據(jù)信息規(guī)則。數(shù)據(jù)挖掘的關(guān)鍵技術(shù)是關(guān)聯(lián)規(guī)制,也就是通過事務(wù)庫生成、頻繁項(xiàng)集生成和關(guān)聯(lián)規(guī)則庫生成來表達(dá)數(shù)據(jù)規(guī)則。
數(shù)據(jù)挖掘是一種開放性的思維方式,在挖掘的過程中可綜合利用多種模型中的方法或成果??偟膩碚f,數(shù)據(jù)挖掘技術(shù)有以下三個(gè)特點(diǎn):首先有效性,也就是數(shù)據(jù)挖掘技術(shù)可以有效發(fā)現(xiàn)被隱藏在數(shù)據(jù)堆中的有用信息,還能有效發(fā)現(xiàn)能體現(xiàn)某局部特征或規(guī)律的模型;其次是自動性,也就是該技術(shù)可以自動地分析和預(yù)測未來的發(fā)展趨勢,從而能自動地獲取新的數(shù)據(jù)信息;此外數(shù)據(jù)挖掘技術(shù)具有便捷性的特征,能在數(shù)據(jù)中便捷獲得規(guī)則,并實(shí)時(shí)更新。
數(shù)據(jù)挖掘技術(shù)的主要目的是提取被隱藏的,但是又非常有價(jià)值的信息,幫助人們從雜亂膨脹的信息堆中找到自己所需要的信息,并通過對隸屬數(shù)據(jù)和當(dāng)前數(shù)據(jù)的分析,預(yù)測未來數(shù)據(jù)信息趨勢。
數(shù)據(jù)挖掘技術(shù)挖掘信息的過程可以分成準(zhǔn)備、數(shù)據(jù)挖掘、分析評價(jià)和運(yùn)用四個(gè)階段。整體過程是利用相應(yīng)的數(shù)據(jù)挖掘技術(shù)和手段,從大量隨機(jī)的數(shù)據(jù)中發(fā)現(xiàn)還未被人發(fā)現(xiàn)的,并隱藏較大使用價(jià)值的信息,然后對這些發(fā)現(xiàn)的信息通過信息分析手段進(jìn)一步評估,最后將具有價(jià)值的信息提取出來并根據(jù)實(shí)際情況應(yīng)用到所需要的領(lǐng)域中。
數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用,主要是幫助教學(xué)工作者能全面了解學(xué)生的特點(diǎn),然后因材施教,制定合理的教學(xué)計(jì)劃,設(shè)置合理的課程,從而提高教學(xué)的效率和質(zhì)量,提高教學(xué)管理水平。具體應(yīng)用于挖掘?qū)W生基本信息、分析學(xué)生學(xué)習(xí)成績,以及利用該技術(shù)進(jìn)行合理的課程設(shè)置三個(gè)方面。
數(shù)據(jù)挖掘技術(shù)在學(xué)生信息方面的應(yīng)用,首先是利用該技術(shù)挖掘?qū)W生的基本信息,包括學(xué)生的年齡、個(gè)人情況等,然后對這些信息進(jìn)行分析,根據(jù)分析結(jié)果全面掌握學(xué)生結(jié)構(gòu),為將來的教學(xué)工作和對學(xué)生的評價(jià)工作做好鋪墊。具體方式是利用可視化技術(shù)挖掘?qū)W生相關(guān)信息,然后通過圖表或者報(bào)告的形式給予教師參考。數(shù)據(jù)挖掘技術(shù)還能從考試系統(tǒng)中挖掘?qū)W生的基本情況,教師在了解學(xué)生基本成績情況的基礎(chǔ)上,更能針對性地展開教學(xué)。
利用高校的教學(xué)管理系統(tǒng),或者大量的word和excel數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)挖掘?qū)W生學(xué)習(xí)成績,經(jīng)過分析找出影響學(xué)生成績的關(guān)鍵學(xué)科,并通過關(guān)聯(lián)規(guī)則發(fā)現(xiàn)關(guān)鍵學(xué)科能間接影響的其他學(xué)科。然后在教學(xué)中重點(diǎn)管理關(guān)鍵學(xué)科,加強(qiáng)關(guān)鍵學(xué)科的教學(xué)管理工作,從而可以提高關(guān)鍵學(xué)科的學(xué)習(xí)成績,并間接影響其他學(xué)科成績。舉一個(gè)例子,在數(shù)據(jù)挖掘中發(fā)現(xiàn),《計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)》是影響學(xué)生學(xué)習(xí)成績的關(guān)鍵學(xué)科,通過關(guān)聯(lián)規(guī)則又發(fā)現(xiàn)該學(xué)科成績在70分以上的學(xué)生,《局域網(wǎng)技術(shù)與組網(wǎng)工程》的成績在70分以上的可能性達(dá)70%以上,說明兩門學(xué)科之間有很強(qiáng)的關(guān)聯(lián)性。如果加強(qiáng)《計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)》課程的教學(xué)管理,自然也會影響《局域網(wǎng)技術(shù)與組網(wǎng)工程》課程的成績??傊?,通過數(shù)據(jù)挖掘可分析學(xué)生學(xué)習(xí)成績,為教學(xué)管理部門的決策提供參考,也為接下來的課程設(shè)置打下基礎(chǔ)。
利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則可以幫助教師進(jìn)行合理的課程設(shè)置,這是因?yàn)閷W(xué)生在學(xué)習(xí)的過程中一般都是從易到難的,而且課程之間應(yīng)該有銜接性和一定的關(guān)聯(lián)性,一般設(shè)置課程時(shí)先設(shè)置簡單的基礎(chǔ)課程,讓學(xué)生掌握基本的知識,然后再將難度逐漸增大,并把相關(guān)知識點(diǎn)串聯(lián)起來。利用關(guān)聯(lián)規(guī)則分析法,分析課程設(shè)置的合理性,然后作適當(dāng)?shù)母倪M(jìn)。比如.NET程序設(shè)計(jì)語言和數(shù)據(jù)庫兩個(gè)課程之間沒有太大的關(guān)聯(lián)性和順序性,則可以安排在同一個(gè)學(xué)期,也可以安排在不同學(xué)期,但是根據(jù)實(shí)際效果分析發(fā)現(xiàn)開設(shè)在同一學(xué)期的效果較好,則可以對課程安排作一定的調(diào)整。
從上文探討數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用可知,雖然目前數(shù)據(jù)挖掘技術(shù)已經(jīng)被應(yīng)用到高校管理、圖書館信息管理和高校教學(xué)中,但是總的來說還是處于初級發(fā)展階段,這是因?yàn)楫?dāng)前在高校領(lǐng)域可被挖掘的信息數(shù)據(jù)較少,另外高校各個(gè)院系和部門之間在信息數(shù)據(jù)的交流上也不普遍。所以筆者認(rèn)為可以從以下四個(gè)方面進(jìn)行改進(jìn):
首先高校環(huán)境中的數(shù)據(jù)量較少,除了教學(xué)數(shù)據(jù),就是教研數(shù)據(jù),所以在開展數(shù)據(jù)挖掘工作時(shí)應(yīng)主要做好基礎(chǔ)工作,也就是在有限的數(shù)據(jù)環(huán)境中挖掘、搜集和整理有價(jià)值的數(shù)據(jù)。其次,需要改進(jìn)的是高校各個(gè)院系和部門之間數(shù)據(jù)鏈缺失的問題,各個(gè)院系的老師或者各個(gè)部門的教研人員本身手上的數(shù)據(jù)信息就不多,彼此之間又不進(jìn)行數(shù)據(jù)交流,數(shù)據(jù)不集中,導(dǎo)致數(shù)據(jù)獨(dú)立,無法形成有效數(shù)據(jù)鏈。再次,數(shù)據(jù)挖掘人員的素質(zhì)也很關(guān)鍵,目前高校中的數(shù)據(jù)挖掘人員參差不齊,在數(shù)據(jù)挖掘人員培養(yǎng)和開發(fā)上不但要求其掌握基本的數(shù)據(jù)挖掘技術(shù),還應(yīng)該掌握數(shù)據(jù)定義和數(shù)據(jù)算法等技能。此外,加強(qiáng)高校的硬件環(huán)境建設(shè)也是改進(jìn)的內(nèi)容之一。因?yàn)閿?shù)據(jù)挖掘工作必須要在可靠的硬件設(shè)施上才能完成,如果沒有高運(yùn)算能力和大存儲量的計(jì)算機(jī),沒有穩(wěn)定高速的信息傳輸和共享網(wǎng)絡(luò),數(shù)據(jù)挖掘工作很難有效完成。
綜上所述,數(shù)據(jù)挖掘技術(shù)利用多種挖掘和分析手段,從大量隨機(jī)的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息,為人們的生活和工作帶去參考。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校教學(xué)中,可以幫助教學(xué)工作者全面掌握學(xué)生的基本信息和學(xué)生成績,然后合理地設(shè)置課程,調(diào)整人才培養(yǎng)方案。不僅可以幫助教學(xué)工作者合理安排教學(xué)工作,而且還能幫助輔導(dǎo)員加強(qiáng)對學(xué)生的管理,從而提高教學(xué)管理質(zhì)量。
[1]路延.數(shù)據(jù)挖掘技術(shù)在高等學(xué)校教學(xué)中的應(yīng)用研究[J].科技資訊,2013(13):201.
[2]甘文麗.基于Web的個(gè)性化遠(yuǎn)程學(xué)習(xí)模型的研究與應(yīng)用[J].科技信息,2012(08):78-83.
[3]宋愛波.Web挖掘研究綜述[J].計(jì)算機(jī)科學(xué),2011:514-518.