王婧娟 那麗春 方玉玲
關(guān)鍵詞:數(shù)據(jù)分析;數(shù)據(jù)可視化;教學(xué)設(shè)計(jì);課程建設(shè)
隨著信息技術(shù)和數(shù)據(jù)存儲(chǔ)技術(shù)的快速發(fā)展,海量數(shù)據(jù)噴涌而出。如何從雜亂無(wú)章的數(shù)據(jù)中提取對(duì)人們有用的信息,并將結(jié)果以可視化圖形模式提供給用戶,是至關(guān)重要的問(wèn)題。目前各高校均在自己傳統(tǒng)專業(yè)的基礎(chǔ)上,增添了人工智能、大數(shù)據(jù)等前沿技術(shù)課程。例如筆者所在的上海立信會(huì)計(jì)金融學(xué)院,面向各個(gè)學(xué)院的本科生開(kāi)設(shè)了數(shù)據(jù)分析與可視化、Python數(shù)據(jù)處理技術(shù)、人工智能基礎(chǔ)與應(yīng)用等數(shù)據(jù)與信息素養(yǎng)課程[1]。這些課程均聚焦企業(yè)需求,在傳統(tǒng)專業(yè)的基礎(chǔ)上進(jìn)行更新,目標(biāo)是培養(yǎng)出高素質(zhì)的綜合型人才。
本文主要以數(shù)據(jù)分析與可視化課程為例,闡述在當(dāng)今大數(shù)據(jù)時(shí)代的背景下,如何將前沿的數(shù)據(jù)分析與可視化技術(shù)融入本財(cái)經(jīng)院校各院系課程建設(shè)和教學(xué)中。
1 數(shù)據(jù)分析與可視化課程的現(xiàn)狀與挑戰(zhàn)
數(shù)據(jù)分析與可視化課程是公共通識(shí)課模塊長(zhǎng)學(xué)段限定選修課程,課程內(nèi)容豐富全面[2]。大數(shù)據(jù)專業(yè)將此課程設(shè)計(jì)為專業(yè)基礎(chǔ)課程,以培養(yǎng)大學(xué)生數(shù)據(jù)分析和編程能力[3]。數(shù)據(jù)分析與可視化通識(shí)課程旨在培養(yǎng)廣泛的基礎(chǔ)知識(shí)和技能,側(cè)重點(diǎn)不是“專”,而是“識(shí)”和“通”。
數(shù)據(jù)分析與可視化課程的目標(biāo)是讓學(xué)生學(xué)習(xí)數(shù)據(jù)分析與可視化的基本方法,使學(xué)生掌握數(shù)據(jù)分析、設(shè)計(jì)和可視化開(kāi)發(fā)的技能,且具備較好的分析和解決問(wèn)題的能力,為未來(lái)從事數(shù)據(jù)科學(xué)相關(guān)領(lǐng)域的工作奠定牢固的基礎(chǔ)[4]。因此,如何進(jìn)行該課程的建設(shè)以達(dá)到人才培養(yǎng)目標(biāo)是一個(gè)非常重要的問(wèn)題[5]。
彭煥卜等[6]分析云南大學(xué)本科生某門課程的選修者的相關(guān)數(shù)據(jù),對(duì)選修者的成績(jī)、學(xué)習(xí)能力、學(xué)習(xí)內(nèi)容等進(jìn)行分析并可視化展示,增強(qiáng)數(shù)據(jù)分析與可視化在教育教學(xué)中的應(yīng)用。楊艷霞等[7]采取案例教學(xué)法對(duì)網(wǎng)絡(luò)爬蟲(chóng)得到的數(shù)據(jù)進(jìn)行分析及可視化操作。然而這些探究對(duì)于非計(jì)算機(jī)專業(yè)的數(shù)據(jù)分析與可視化課程的建設(shè)借鑒意義不大。原因有:1) 上述參考文獻(xiàn)面向的是計(jì)算機(jī)相關(guān)專業(yè)的數(shù)據(jù)分析與可視化課程,對(duì)專業(yè)知識(shí)要求較高,而公共通識(shí)課大部分的選修同學(xué)編程基礎(chǔ)薄弱,應(yīng)在課程教學(xué)設(shè)計(jì)中考慮到此學(xué)情及通識(shí)課的構(gòu)建目標(biāo),培養(yǎng)學(xué)生更廣的知識(shí)面和處理問(wèn)題的綜合能力;2) 數(shù)據(jù)分析與可視化課程內(nèi)容較多但學(xué)時(shí)有限,面對(duì)豐富的課程內(nèi)容不能只采取線下教學(xué),否則內(nèi)容設(shè)置和計(jì)劃難以落地實(shí)施。
以下將從教學(xué)研究和教學(xué)效果等方面對(duì)本課程建設(shè)進(jìn)行探究,為數(shù)據(jù)分析與可視化課程及后續(xù)相關(guān)課程建設(shè)提供參考。
2 數(shù)據(jù)分析與可視化課程教學(xué)研究
數(shù)據(jù)分析與可視化課程的教學(xué)目標(biāo)是培養(yǎng)學(xué)生的信息數(shù)據(jù)可視化處理技能。本節(jié)提出此課程的教學(xué)內(nèi)容設(shè)計(jì)和實(shí)施方案。
2.1 課程定位與設(shè)計(jì)思路
由于Python簡(jiǎn)單易學(xué),具有豐富的第三方庫(kù),現(xiàn)成為眾多非計(jì)算機(jī)專業(yè)首選的編程語(yǔ)言。本課程使用Python語(yǔ)言,基于Numpy、Pandas、Matplotlib第三方庫(kù),IDE是Jupyter Notebook(anaconda3) 。通過(guò)本課程的教授,讓學(xué)生掌握數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)可視化等內(nèi)容。在教學(xué)的過(guò)程中,對(duì)教學(xué)方法進(jìn)行變革,提高學(xué)生的編程能力和計(jì)算思維,讓學(xué)生學(xué)會(huì)運(yùn)用所學(xué)知識(shí)解決實(shí)際問(wèn)題,培育具備數(shù)據(jù)素養(yǎng)和數(shù)據(jù)分析技能的應(yīng)用型人才。此外,激發(fā)學(xué)生動(dòng)手編程的興趣,為將來(lái)高年級(jí)的學(xué)習(xí)打好扎實(shí)的基礎(chǔ)。
2.2 分層次教學(xué)模式設(shè)計(jì)
課程教學(xué)模式設(shè)計(jì)依據(jù)“認(rèn)識(shí)數(shù)據(jù)、數(shù)據(jù)存儲(chǔ)訪問(wèn)、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化”分層次逐層展開(kāi),如圖1所示。第一層是認(rèn)識(shí)數(shù)據(jù),即掌握基本的Py?thon編程基礎(chǔ),建立從現(xiàn)實(shí)世界去理解計(jì)算機(jī)領(lǐng)域的抽象知識(shí);第二層涉及數(shù)據(jù)文件的讀寫操作;第三層是針對(duì)特定應(yīng)用領(lǐng)域的數(shù)據(jù)進(jìn)行處理與分析;第四層是可視化展示數(shù)據(jù)分析的結(jié)果。
第一層,認(rèn)識(shí)數(shù)據(jù),掌握編程基礎(chǔ)。此內(nèi)容由淺入深,指引學(xué)生理解并運(yùn)用Python語(yǔ)言基本語(yǔ)法,開(kāi)發(fā)設(shè)計(jì)簡(jiǎn)單應(yīng)用。首先讓學(xué)生逐步領(lǐng)會(huì)計(jì)算機(jī)編程的思維方式,掌握Python編程基礎(chǔ),理解變量、數(shù)據(jù)類型、操作符、表達(dá)式、字符串、流程控制語(yǔ)句等相關(guān)概念。讓學(xué)生熟練使用Jupyter Notebook進(jìn)行簡(jiǎn)單編程。接著深入講解Python內(nèi)建數(shù)據(jù)結(jié)構(gòu),包括:列表、元組、字典和集合,以及函數(shù)的定義和調(diào)用。演示典型示例,強(qiáng)化學(xué)生編程能力,幫助學(xué)生構(gòu)建模塊化程序設(shè)計(jì)思維。
第二層,數(shù)據(jù)存儲(chǔ)訪問(wèn)。此內(nèi)容讓學(xué)生了解不同文件的類型及文件處理的過(guò)程和數(shù)據(jù)文件的讀寫訪問(wèn)方法。通過(guò)實(shí)際操作向?qū)W生展示常用的txt和csv文件的讀寫操作,讓學(xué)生掌握如何通過(guò)程序?qū)ν獠看鎯?chǔ)文件進(jìn)行操作。
第三層,數(shù)據(jù)處理與分析。數(shù)據(jù)處理與分析絕對(duì)繞不過(guò)兩個(gè)強(qiáng)大的第三方庫(kù),即Numpy和Pandas。此內(nèi)容通過(guò)學(xué)習(xí)這兩個(gè)庫(kù),讓學(xué)生掌握常用的數(shù)據(jù)處理操作技能,通過(guò)具體的案例應(yīng)用,進(jìn)一步增強(qiáng)學(xué)生的編程思維。Numpy專門用來(lái)處理多維數(shù)組,其運(yùn)算效果遠(yuǎn)高于普通的列表。Pandas是基于Numpy的數(shù)據(jù)分析工具,能方便地操作大型數(shù)據(jù)集。通過(guò)第三方庫(kù)的學(xué)習(xí),學(xué)生可快速掌握常用的數(shù)據(jù)預(yù)處理、數(shù)據(jù)選擇、排序、統(tǒng)計(jì)、查詢、透視表等方法。
第四層,數(shù)據(jù)可視化。此內(nèi)容是讓學(xué)生能用可視化工具對(duì)數(shù)據(jù)進(jìn)行可視化展示。該內(nèi)容主要是基于第三方庫(kù)matplotlib,讓學(xué)生掌握折線圖、散點(diǎn)圖、柱狀圖、直方圖、餅圖和箱線圖等常用繪圖方法。針對(duì)不同的數(shù)據(jù)和不同的應(yīng)用場(chǎng)景,選擇合適的繪圖方法是關(guān)鍵。至此,學(xué)生能靈活選擇數(shù)據(jù)繪圖方法,對(duì)數(shù)據(jù)分析的結(jié)果圖形化展示,實(shí)現(xiàn)數(shù)據(jù)分析完整流程。
2.3 教學(xué)實(shí)施方案
由于非計(jì)算機(jī)專業(yè)學(xué)生對(duì)編程普遍不感興趣,很難建立良好的程序設(shè)計(jì)思維,以下從教、學(xué)、評(píng)三方面來(lái)探討教學(xué)實(shí)施方案。
2.3.1 線上線下教學(xué)
本課程采取線上和線下混合式教學(xué)方式。首先,在課前,利用線上超星學(xué)習(xí)通平臺(tái),推送知識(shí)點(diǎn)學(xué)習(xí)視頻,讓學(xué)生在課前預(yù)習(xí)將要學(xué)習(xí)的基礎(chǔ)知識(shí),找出各自的疑惑點(diǎn)。其次,在線下教學(xué)過(guò)程中,學(xué)生帶著疑惑聽(tīng)課,教師在授課時(shí),通過(guò)學(xué)生互動(dòng)反饋,重點(diǎn)解決學(xué)生課前預(yù)習(xí)過(guò)程中的疑難點(diǎn),這樣線下授課更具針對(duì)性。然后,在線發(fā)布課程作業(yè),進(jìn)一步鞏固課程學(xué)習(xí)的知識(shí)及技能。教師課后批改課程作業(yè),了解學(xué)生對(duì)知識(shí)點(diǎn)的掌握情況,針對(duì)常見(jiàn)問(wèn)題可進(jìn)一步強(qiáng)調(diào)重難點(diǎn)。基于學(xué)生課前預(yù)習(xí)、課上互動(dòng)、課程作業(yè)測(cè)試等過(guò)程,更全面地了解學(xué)生的學(xué)習(xí)情況,針對(duì)常見(jiàn)問(wèn)題,實(shí)行“精準(zhǔn)教學(xué)”。
2.3.2 以學(xué)生為中心的分組學(xué)習(xí)
該課程是公共選修課,由于不同學(xué)院的學(xué)生對(duì)編程的掌握快慢不同,比如數(shù)學(xué)院的學(xué)習(xí)者利用自身的專業(yè)優(yōu)勢(shì),學(xué)習(xí)編程知識(shí)較快,但外國(guó)語(yǔ)學(xué)院的學(xué)生就難以適應(yīng)快節(jié)奏學(xué)習(xí),因此,教師要注重異質(zhì)分組,互補(bǔ)共進(jìn)。每組由5至8名學(xué)生構(gòu)成,以小組為單位完成數(shù)據(jù)分析與可視化項(xiàng)目設(shè)計(jì)等任務(wù)。小組教學(xué)已被證實(shí)在計(jì)算機(jī)教學(xué)中具有較好效果[8],不僅能促進(jìn)學(xué)生交流,還能創(chuàng)建濃厚的課堂研討互動(dòng)氣氛。與個(gè)人相比,分組的優(yōu)勢(shì)是小組成員能發(fā)揮各自的所長(zhǎng)并在協(xié)作中彌補(bǔ)自身不足,共同進(jìn)步。每次課程實(shí)驗(yàn)在超星平臺(tái)發(fā)布,由小組長(zhǎng)提交,內(nèi)容包括代碼、小組內(nèi)的分工、組內(nèi)互評(píng)等。線下上課時(shí),每組進(jìn)行匯報(bào),教師對(duì)共性問(wèn)題及各組的情況進(jìn)行評(píng)價(jià),如數(shù)據(jù)解讀、任務(wù)的設(shè)計(jì)與實(shí)現(xiàn)、程序設(shè)計(jì)思路等,通過(guò)組內(nèi)和組外兩層學(xué)習(xí)反饋,增強(qiáng)學(xué)生對(duì)知識(shí)的領(lǐng)悟和應(yīng)用。
2.3.3 多元考核評(píng)價(jià)
數(shù)據(jù)分析與可視化課程涵蓋的知識(shí)面較廣,不僅包括基本語(yǔ)法,還包含應(yīng)用能力的培養(yǎng),單一的課程考核方式不能全面測(cè)驗(yàn)學(xué)生的學(xué)習(xí)程度。本課程的總成績(jī)包括平時(shí)考核成績(jī)和終結(jié)性考核成績(jī)。平時(shí)考核成績(jī)包括課堂考勤、超星視頻、課程實(shí)驗(yàn)、階段性測(cè)驗(yàn),占總成績(jī)的70%;終結(jié)性考核是以小組為單位的期末綜合大作業(yè),占總成績(jī)的30%。其中,期末大作業(yè)是讓每個(gè)小組的學(xué)生根據(jù)其感興趣的領(lǐng)域采集、分析數(shù)據(jù)再可視化展示結(jié)果。在課程的最后一個(gè)教學(xué)周,讓每個(gè)小組長(zhǎng)提交本組的數(shù)據(jù)集、源代碼和分析報(bào)告,每個(gè)小組派代表在課程上進(jìn)行匯報(bào)。期末大作業(yè)的打分從小組的選題是否新穎、數(shù)據(jù)獲取及處理的工作量、可視化展示的效果、復(fù)雜度等評(píng)價(jià)。組內(nèi)可根據(jù)成員對(duì)大作業(yè)的貢獻(xiàn)度以及參與度互相評(píng)分。除此之外,為了調(diào)動(dòng)學(xué)生在課堂上的積極性及主動(dòng)性,教學(xué)互動(dòng)等也考慮在評(píng)分中。
3 課程教學(xué)效果分析
2021年第一學(xué)期面向非計(jì)算機(jī)專業(yè)本科二年級(jí)學(xué)生開(kāi)設(shè)了數(shù)據(jù)分析與可視化課程。學(xué)生已在一年級(jí)通過(guò)《Python程序設(shè)計(jì)基礎(chǔ)》學(xué)習(xí)了基本的語(yǔ)法和程序設(shè)計(jì)思維,由于課時(shí)有限僅學(xué)習(xí)到列表的相關(guān)知識(shí),且所學(xué)內(nèi)容非常淺,學(xué)生對(duì)編程的興趣普遍不高。課程開(kāi)始前對(duì)學(xué)生做了問(wèn)卷調(diào)查,95%的學(xué)生認(rèn)為本課程對(duì)未來(lái)的學(xué)習(xí)及就業(yè)有益,62%的同學(xué)感覺(jué)編程較難。
3.1 知識(shí)難點(diǎn)分析
根據(jù)2021年第一輪的教學(xué)經(jīng)驗(yàn),發(fā)現(xiàn)學(xué)生對(duì)于基礎(chǔ)的Python語(yǔ)法掌握較好,函數(shù)和控制結(jié)構(gòu)掌握情況相對(duì)較弱。對(duì)于Numpy學(xué)習(xí)的難點(diǎn)在于多維數(shù)組,Pandas的學(xué)習(xí)難點(diǎn)在于兩個(gè)Pandas數(shù)據(jù)結(jié)構(gòu)——Se?ries和DataFrame的運(yùn)用。在學(xué)習(xí)Matplotlib這部分內(nèi)容時(shí),由于函數(shù)較多,且每個(gè)函數(shù)的參數(shù)也較多,學(xué)生對(duì)于圖形的選擇和圖的格式設(shè)置會(huì)產(chǎn)生眼花繚亂的感覺(jué),因此,針對(duì)這些難點(diǎn)在教學(xué)中需要重點(diǎn)突破。
3.2 應(yīng)用實(shí)踐能力評(píng)價(jià)
期末綜合大作業(yè)讓學(xué)生分組選擇他們感興趣的數(shù)據(jù),由于本門課程針對(duì)的是非計(jì)算機(jī)專業(yè)的學(xué)生,主要包括以下學(xué)院:金融學(xué)院、國(guó)際經(jīng)貿(mào)學(xué)院、保險(xiǎn)學(xué)院、法學(xué)院、統(tǒng)計(jì)與數(shù)學(xué)學(xué)院、人文藝術(shù)學(xué)院、金融科技學(xué)院。上交的大作業(yè)的數(shù)據(jù)集涉及金融、房地產(chǎn)、就業(yè)等多類數(shù)據(jù)集。期末綜合大作業(yè)的考核方式是百分制,包括數(shù)據(jù)的選?。?%) 、數(shù)據(jù)的導(dǎo)入導(dǎo)出(5%) 、數(shù)據(jù)預(yù)處理(20%) 、數(shù)據(jù)分析(30%) 、數(shù)據(jù)可視化(20%) 和小組匯報(bào)講解(20%) 。期末綜合大作業(yè)的評(píng)價(jià)結(jié)果如圖2所示。
每個(gè)小組均有自主設(shè)計(jì)分析問(wèn)題的能力。對(duì)于問(wèn)題的提出和對(duì)分析結(jié)果的闡釋方面,得分率較高;對(duì)于數(shù)據(jù)的圖形化展示方面,圖形選取的合理性和表達(dá)的精準(zhǔn)性等方面有待增強(qiáng)。
針對(duì)非計(jì)算機(jī)專業(yè)的學(xué)生,雖然他們編程基礎(chǔ)弱,但通過(guò)小組合作的方式學(xué)生可以提交高質(zhì)量的項(xiàng)目大作業(yè)。各個(gè)小組對(duì)擅長(zhǎng)領(lǐng)域的數(shù)據(jù)集進(jìn)行了深刻分析,較好地完成了數(shù)據(jù)分析與可視化作業(yè)。
4 結(jié)束語(yǔ)
數(shù)據(jù)分析與可視化作為一門新課程,為實(shí)現(xiàn)教育培養(yǎng)目標(biāo),需持續(xù)從教學(xué)內(nèi)容、教學(xué)方法和過(guò)程等方面不斷完善。本文針對(duì)數(shù)據(jù)分析與可視化課程,基于分層次教學(xué)模式的教學(xué)理念和線上線下混合式教學(xué)模式,從課程定位、設(shè)計(jì)思路、以學(xué)生為中心的分組學(xué)習(xí)和多元考核評(píng)價(jià)等多方面進(jìn)行了設(shè)計(jì)和探究。通過(guò)小組展示項(xiàng)目大作業(yè),能看出課程教學(xué)改革效果顯著,學(xué)生能應(yīng)用所學(xué)知識(shí)對(duì)某領(lǐng)域或某行業(yè)的數(shù)據(jù)進(jìn)行挖掘與分析實(shí)踐,進(jìn)而挖掘出數(shù)據(jù)潛在的聯(lián)系和價(jià)值。未來(lái)將進(jìn)一步完善內(nèi)容體系,精練課程內(nèi)容和方法,爭(zhēng)取打造具有高階性、創(chuàng)新性和挑戰(zhàn)度的雙一流課程。