• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      項(xiàng)目驅(qū)動(dòng)的信管專業(yè)“數(shù)據(jù)挖掘”課程實(shí)踐教學(xué)設(shè)計(jì)

      2018-09-15 09:46朱慧云
      考試周刊 2018年84期
      關(guān)鍵詞:項(xiàng)目驅(qū)動(dòng)數(shù)據(jù)挖掘實(shí)踐教學(xué)

      摘 要:為解決數(shù)據(jù)挖掘課程教學(xué)過程中,學(xué)生理論知識儲(chǔ)備與實(shí)際工作應(yīng)用脫節(jié)的問題,設(shè)計(jì)演示型、驗(yàn)證型、案例型、項(xiàng)目參與型四個(gè)層次的實(shí)踐教學(xué)體系。在項(xiàng)目參與型實(shí)驗(yàn)中,要求學(xué)生基于CRISPDM模型開展數(shù)據(jù)挖掘項(xiàng)目,針對具體的業(yè)務(wù)背景,依次開展提出問題、分析問題和解決問題的全過程。

      關(guān)鍵詞:數(shù)據(jù)挖掘;實(shí)踐教學(xué);項(xiàng)目驅(qū)動(dòng);CRISPDM模型

      在大數(shù)據(jù)時(shí)代,社會(huì)各行各業(yè)都需要大量數(shù)據(jù)分析人才。許多院校正在積極探索數(shù)據(jù)分析人才的培養(yǎng)模式,在信息類、經(jīng)管類專業(yè)學(xué)生的本科階段開設(shè)“數(shù)據(jù)挖掘”課程,培養(yǎng)學(xué)生數(shù)據(jù)分析和處理的能力。然而,數(shù)據(jù)挖掘課程仍存在以課堂教學(xué)為主,沒有設(shè)置實(shí)驗(yàn)課時(shí)或?qū)嶒?yàn)課時(shí)設(shè)置過少等問題,使得學(xué)生難以在有限的教學(xué)時(shí)間內(nèi)掌握數(shù)據(jù)挖掘項(xiàng)目所必備的知識和技能,出現(xiàn)“理論知識儲(chǔ)備”與“實(shí)際工作應(yīng)用”脫節(jié)的問題。

      目前,針對數(shù)據(jù)挖掘課程的教改探討有:黃嵐提出通過建設(shè)開放數(shù)據(jù)挖掘?qū)嵺`教學(xué)資源庫提升教學(xué)效果,激發(fā)學(xué)生的學(xué)習(xí)興趣。白楊依據(jù)應(yīng)用型本科院校人才培養(yǎng)目標(biāo)需求,將傳統(tǒng)教學(xué)法與現(xiàn)象教學(xué)法、翻轉(zhuǎn)課堂教學(xué)法相結(jié)合,提高學(xué)生的學(xué)習(xí)興趣和實(shí)踐能力。趙曉凡針對公安高等院校學(xué)生就業(yè)狀況和數(shù)據(jù)挖掘課程實(shí)際教學(xué)效果,提出結(jié)合公安大數(shù)據(jù)業(yè)務(wù)、重點(diǎn)介紹數(shù)據(jù)挖掘算法的應(yīng)用、案例驅(qū)動(dòng)教學(xué)等三點(diǎn)改革措施。胡敏指出商務(wù)智能實(shí)踐課程需要讓學(xué)生實(shí)現(xiàn)由問題找方法,進(jìn)而深入理解方法的過程。

      南京信息工程大學(xué)信管專業(yè)依據(jù)專業(yè)發(fā)展內(nèi)容創(chuàng)建了“大數(shù)據(jù)分析”專業(yè)方向,培養(yǎng)能做業(yè)務(wù)咨詢、商務(wù)智能的數(shù)據(jù)分析人才。在“數(shù)據(jù)挖掘”課程的教學(xué)過程中,總結(jié)出“重方法,輕算法;重應(yīng)用,輕研究”的教學(xué)理念,培養(yǎng)學(xué)生數(shù)據(jù)分析能力、文字表達(dá)和人際溝通等能力。

      一、 實(shí)踐教學(xué)思路

      在實(shí)驗(yàn)課設(shè)計(jì)過程中,根據(jù)信管專業(yè)人才培養(yǎng)的特點(diǎn)和要求,從企業(yè)大數(shù)據(jù)分析的實(shí)際應(yīng)用出發(fā),培養(yǎng)學(xué)生將實(shí)際的商業(yè)問題轉(zhuǎn)化為數(shù)據(jù)挖掘目標(biāo)、理解和收集數(shù)據(jù)、應(yīng)用數(shù)據(jù)挖掘工具建模、評估模型以判斷是否符合商業(yè)目的,并將發(fā)現(xiàn)的結(jié)果組織成可讀文本的能力,使學(xué)生的理論知識和實(shí)踐技能得到共同發(fā)展。

      在此基礎(chǔ)上,從系統(tǒng)演示、軟件模擬、案例教學(xué)、項(xiàng)目驅(qū)動(dòng)四個(gè)方面開展實(shí)踐教學(xué),設(shè)計(jì)演示型、驗(yàn)證型、案例型、項(xiàng)目參與型等四個(gè)層次的實(shí)踐教學(xué)體系(見表1)。在鞏固和理解理論知識的基礎(chǔ)上,培養(yǎng)學(xué)生的分析能力、動(dòng)手能力和綜合運(yùn)用知識的能力,解決教學(xué)中的“理論知識”與“實(shí)際動(dòng)手”、“算法設(shè)計(jì)”與“工具實(shí)用”的兩個(gè)嚴(yán)重脫節(jié)的問題。

      設(shè)計(jì)數(shù)據(jù)挖掘軟件認(rèn)識的演示型實(shí)驗(yàn),對數(shù)據(jù)挖掘軟件的基本操作和環(huán)境進(jìn)行講解,使學(xué)生對數(shù)據(jù)挖掘軟件有一個(gè)初步的認(rèn)識。設(shè)計(jì)數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則挖掘、分類挖掘和聚類挖掘幾個(gè)驗(yàn)證型實(shí)驗(yàn),實(shí)驗(yàn)和數(shù)據(jù)挖掘的理論知識模塊一一對應(yīng),使得學(xué)生夯實(shí)理論知識。通過案例型實(shí)驗(yàn)使學(xué)生掌握數(shù)據(jù)挖掘的方法論,初步理解數(shù)據(jù)挖掘過程,為學(xué)生獨(dú)立完成數(shù)據(jù)挖掘項(xiàng)目打好基礎(chǔ)。通過項(xiàng)目參與型實(shí)驗(yàn)使學(xué)生深刻理解數(shù)據(jù)挖掘的全過程。

      項(xiàng)目參與型實(shí)驗(yàn)采用項(xiàng)目的形式,將學(xué)生分為若干項(xiàng)目組,將相對獨(dú)立的數(shù)據(jù)挖掘項(xiàng)目交予學(xué)生獨(dú)立完成。從業(yè)務(wù)目標(biāo)的確定、數(shù)據(jù)的處理、算法的選擇,到模型的評價(jià)、商業(yè)的部署,都由學(xué)生具體負(fù)責(zé)。選題主要結(jié)合學(xué)院教師現(xiàn)有的縱向和橫向科研項(xiàng)目,由教師擬出一個(gè)或者多個(gè)可供選擇的課題,同時(shí)也鼓勵(lì)學(xué)生根據(jù)自己的想法并在教師的幫助下擬定課題。

      二、 項(xiàng)目驅(qū)動(dòng)的“數(shù)據(jù)挖掘”課程實(shí)踐教學(xué)設(shè)計(jì)

      跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程CRISPDM(crossindustry standard process for data mining)是業(yè)界認(rèn)可的用于指導(dǎo)數(shù)據(jù)挖掘全過程的方法。通過近幾年的發(fā)展,CRISPDM模型在各種KDD過程模型中占據(jù)領(lǐng)先位置,2014年統(tǒng)計(jì)表明,采用量達(dá)到43%。

      因此,在項(xiàng)目驅(qū)動(dòng)的“數(shù)據(jù)挖掘”課程實(shí)踐教學(xué)設(shè)計(jì)中,要求學(xué)生基于CRISPDM模型開展數(shù)據(jù)挖掘項(xiàng)目,針對具體的業(yè)務(wù)背景,依次開展提出問題、分析問題和解決問題的全過程。

      (一) 業(yè)務(wù)理解

      在開展數(shù)據(jù)挖掘項(xiàng)目之前,先要確定業(yè)務(wù)目標(biāo),確定想通過數(shù)據(jù)挖掘項(xiàng)目達(dá)到什么目標(biāo)。在這個(gè)階段,需要學(xué)生收集有關(guān)業(yè)務(wù)情況的背景信息,從應(yīng)用角度討論具體的業(yè)務(wù)目標(biāo),并把這些理解轉(zhuǎn)換成數(shù)據(jù)挖掘問題的定義;最后確定從業(yè)務(wù)角度判定的數(shù)據(jù)挖掘成功與否的標(biāo)準(zhǔn)。業(yè)務(wù)目標(biāo)的定義非常重要,如果開始方向錯(cuò)了,那么無論模型多么準(zhǔn)確都只能得出錯(cuò)誤的結(jié)論。

      (二) 數(shù)據(jù)理解

      學(xué)生在數(shù)據(jù)理解階段需要理解項(xiàng)目相關(guān)的數(shù)據(jù)資源以及這些資源的特征。如購物籃分析項(xiàng)目中需要確定:哪些數(shù)據(jù)可以用來進(jìn)行購物籃分析和識別客戶群體的購物偏好?這些數(shù)據(jù)是否已經(jīng)獲得?還有哪些數(shù)據(jù)資源還沒有獲得,用什么方法可以得到這些數(shù)據(jù)資源?獲得所需數(shù)據(jù)資源之后,學(xué)生用表格、圖表和其他可視化工具探索數(shù)據(jù),為關(guān)鍵屬性計(jì)算基本的統(tǒng)計(jì)數(shù)據(jù),并對數(shù)據(jù)資源的質(zhì)量進(jìn)行評估。

      (三) 數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)準(zhǔn)備階段要求學(xué)生選擇和數(shù)據(jù)挖掘項(xiàng)目相關(guān)的數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理,為建模做好準(zhǔn)備。由于現(xiàn)實(shí)世界中的數(shù)據(jù)不可避免地存在不完整、不一致和包含噪聲等情況,因此需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)清理、數(shù)據(jù)集成等預(yù)處理工作,從而提高數(shù)據(jù)挖掘的質(zhì)量。

      (四) 建模

      學(xué)生根據(jù)數(shù)據(jù)挖掘項(xiàng)目的目標(biāo)和數(shù)據(jù)的實(shí)際情況,選擇合適的算法,設(shè)置合理的參數(shù),構(gòu)建模型。建模的過程通常情況下要進(jìn)行多次迭代,可能會(huì)進(jìn)行算法的調(diào)整、參數(shù)的調(diào)整,甚至是重新準(zhǔn)備數(shù)據(jù)。

      (五) 評估

      在這個(gè)階段,評估數(shù)據(jù)挖掘的結(jié)果是否明確,是否滿足之前確立的業(yè)務(wù)目標(biāo)。為了保證項(xiàng)目評估的客觀性,評估工作可以交叉進(jìn)行,每一個(gè)項(xiàng)目組對另外一個(gè)項(xiàng)目組的數(shù)據(jù)挖掘結(jié)果進(jìn)行評估。

      (六) 部署

      這個(gè)階段是數(shù)據(jù)挖掘結(jié)果的實(shí)際應(yīng)用階段。項(xiàng)目組要基于數(shù)據(jù)挖掘的結(jié)果設(shè)計(jì)策略進(jìn)行模型的應(yīng)用及預(yù)演。如可以基于購物籃分析得出的關(guān)聯(lián)規(guī)則設(shè)計(jì)交叉銷售策略、貨架陳放方案等。

      三、 基于CRISPDM模型的零售公司客戶價(jià)值提升應(yīng)用

      以FoodMart公司的客戶價(jià)值提升項(xiàng)目為例,闡述基于CRISPDM模型的數(shù)據(jù)挖掘項(xiàng)目全過程。數(shù)據(jù)挖掘工具使用IBM SPSS Modeler,它是一款基于CRISPDM模型的商業(yè)數(shù)據(jù)挖掘軟件。

      (一) 業(yè)務(wù)理解

      1. 業(yè)務(wù)背景:FoodMart公司在美國、加拿大、墨西哥的連鎖店銷售商品,目前面臨來自其他零售公司的競爭日益加劇。公司老板提出一個(gè)解決方案是培養(yǎng)現(xiàn)有客戶關(guān)系,以便最大化現(xiàn)有客戶的價(jià)值。

      2. 業(yè)務(wù)目標(biāo):通過提供更好的推薦增加交叉銷售的數(shù)量;通過提供更個(gè)性化的服務(wù)提高客戶的忠誠度。

      3. 數(shù)據(jù)挖掘目標(biāo):基于客戶購物數(shù)據(jù)識別商品之間的關(guān)聯(lián)規(guī)則;基于客戶購物數(shù)據(jù)和客戶人口統(tǒng)計(jì)數(shù)據(jù)確定不同的客戶群體,并識別客戶群體的購物偏好。

      (二) 數(shù)據(jù)理解

      FoodMart數(shù)據(jù)庫中有食品連鎖店經(jīng)營業(yè)務(wù)所產(chǎn)生的數(shù)據(jù),本項(xiàng)目中需要的客戶數(shù)據(jù)、購物交易數(shù)據(jù)、產(chǎn)品數(shù)據(jù)都可以在數(shù)據(jù)庫中找到。IBM SPSS Modeler的數(shù)據(jù)審核、表格等節(jié)點(diǎn)可以用來對數(shù)據(jù)資源進(jìn)行探索性分析和質(zhì)量評估。

      (三) 數(shù)據(jù)準(zhǔn)備

      以識別商品之間的關(guān)聯(lián)規(guī)則為例,闡述數(shù)據(jù)準(zhǔn)備工作。

      1. 不同數(shù)據(jù)源數(shù)據(jù)的合并

      表sale_fact_1998(1998年交易數(shù)據(jù)表)中只有產(chǎn)品號字段,不利于用戶對挖掘出的關(guān)聯(lián)規(guī)則的理解,因此需要再添加表product(商品列表),從而獲得產(chǎn)品名稱。在IBM SPSS Modeler中添加兩個(gè)數(shù)據(jù)庫源節(jié)點(diǎn),分別導(dǎo)入表sale_fact_1998和表product,并通過合并節(jié)點(diǎn)合并和過濾數(shù)據(jù)。

      2. 挖掘算法所需新字段的生成

      SPSS Modeler軟件中關(guān)聯(lián)規(guī)則模型使用的數(shù)據(jù)可能是事務(wù)處理格式,也可能是表格格式。事務(wù)處理格式數(shù)據(jù)對于每個(gè)交易或項(xiàng)目具有一個(gè)單獨(dú)的記錄,要求有一個(gè)交易標(biāo)識字段TID。交易數(shù)據(jù)表sale_fact_1998是事物處理格式的,但它缺少交易標(biāo)識字段TID。因此,根據(jù)time_id字段和customer_id字段生成交易標(biāo)識字段TID,將同一個(gè)客戶在同一個(gè)時(shí)間的紀(jì)錄視為一個(gè)交易。

      3. 字段的過濾和重排

      用過濾器節(jié)點(diǎn)去掉建模不需要的字段,用字段重排節(jié)點(diǎn)調(diào)整字段的前后順序。

      (四) 建模

      選擇Aprior節(jié)點(diǎn),設(shè)置規(guī)則的最低條件支持度和最小規(guī)則置信度,執(zhí)行數(shù)據(jù)流。從使用默認(rèn)的參數(shù)開始挖掘,不能找到有效的關(guān)聯(lián)規(guī)則,調(diào)整參數(shù)重新挖掘,仍不能得到理想的挖掘結(jié)果。結(jié)果發(fā)現(xiàn)在原始層數(shù)據(jù)中進(jìn)行挖掘,得不到理想的挖掘結(jié)果。

      重新回到數(shù)據(jù)準(zhǔn)備節(jié)點(diǎn),對數(shù)據(jù)進(jìn)行泛化,將商品的低層概念(product)用對應(yīng)的高層概念(product subcategory或product category等)替換,挖掘高層概念的關(guān)聯(lián)規(guī)則。在商品的高層概念層次上挖掘,可以得到較好的結(jié)果。

      (五) 評估和部署

      在商品的高層概念上挖掘,得到商品之間的關(guān)聯(lián)規(guī)則。使用這些規(guī)則設(shè)計(jì)交叉銷售策略,從而提供更好的商品推薦,增加交叉銷售的數(shù)量。

      四、 結(jié)語

      在數(shù)據(jù)挖掘課程的教學(xué)過程中,實(shí)行基于項(xiàng)目實(shí)踐的綜合實(shí)習(xí),可以使學(xué)生能夠從工程的角度,對數(shù)據(jù)挖掘的全過程有深入地了解,理論知識和實(shí)踐技能得到共同發(fā)展,解決“理論知識儲(chǔ)備”與“實(shí)際工作應(yīng)用”脫節(jié)的問題。

      參考文獻(xiàn):

      [1]白楊.應(yīng)用型本科“數(shù)據(jù)挖掘”課程的構(gòu)建研究[J].無線互聯(lián)科技,2018(5):95-96.

      [2]趙曉凡.公安高等院校數(shù)據(jù)挖掘課程教改研究[J].計(jì)算機(jī)教育,2018(1):39-42.

      [3]黃嵐.數(shù)據(jù)挖掘課程實(shí)踐教學(xué)資源庫建設(shè)[J].計(jì)算機(jī)教育,2014(12):89-92.

      [4]胡敏.商務(wù)智能實(shí)踐教學(xué)內(nèi)容設(shè)計(jì)與方法研究[J].教育現(xiàn)代化,2016,3(23):127-128.

      [5]百度百科.CRISPDM[EB/OL].[2018-5-9]https://baike.baidu.com/item/CRISPDM/7002457?fr=aladdin.

      [6]IBM SPSS Modeler 18.0建模節(jié)點(diǎn)[EB/OL]. [2018-5-22]. http://bbs.pinggu.org/thread-4463720-1-1.html.

      作者簡介:朱慧云,江蘇省南京市,南京信息工程大學(xué)管理工程學(xué)院。

      猜你喜歡
      項(xiàng)目驅(qū)動(dòng)數(shù)據(jù)挖掘實(shí)踐教學(xué)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      依托工作室的軟件工程實(shí)踐教學(xué)研究
      基于物聯(lián)網(wǎng)項(xiàng)目驅(qū)動(dòng)的嵌入式系統(tǒng)教學(xué)改革的研究與實(shí)踐
      基于“紅色之旅”項(xiàng)目驅(qū)動(dòng)的《調(diào)酒與咖啡》工作室制人才培養(yǎng)機(jī)制探討
      高職院校商務(wù)禮儀課程教學(xué)改革探索芻議
      《數(shù)據(jù)庫高級應(yīng)用》教學(xué)創(chuàng)新方法研究
      試論基于項(xiàng)目驅(qū)動(dòng)的機(jī)械制圖教學(xué)改革
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      武穴市| 锡林浩特市| 葫芦岛市| 开封市| 额敏县| 四会市| 密云县| 南召县| 大厂| 呼伦贝尔市| 永福县| 沙雅县| 高平市| 三穗县| 伊通| 蓬溪县| 洱源县| 丽江市| 尚义县| 南城县| 乐至县| 元阳县| 青海省| 彰化市| 喀喇| 重庆市| 广安市| 三台县| 恩施市| 远安县| 霍山县| 佛教| 留坝县| 衡阳市| 义乌市| 阳高县| 建水县| 朝阳县| 庆城县| 天津市| 桑植县|