◆李 斌 羅 芳
基于數(shù)據(jù)挖掘的統(tǒng)計(jì)思維及程序設(shè)計(jì)人才的培養(yǎng)對(duì)策探討
◆李 斌 羅 芳
(東莞職業(yè)技術(shù)學(xué)院研究中心 廣東 523808)
大數(shù)據(jù)背景下,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為人們關(guān)注的焦點(diǎn),同時(shí)統(tǒng)計(jì)學(xué)知識(shí)、理論與統(tǒng)計(jì)思想等也被應(yīng)用到各領(lǐng)域中。通過(guò)近年來(lái)大多研究發(fā)現(xiàn),數(shù)據(jù)挖掘技術(shù)應(yīng)用下很大程度上推動(dòng)統(tǒng)計(jì)學(xué)發(fā)展,但對(duì)人才的要求也有所提高,要想培養(yǎng)適應(yīng)社會(huì)的復(fù)合型人才首要任務(wù)就是培養(yǎng)具備統(tǒng)計(jì)思維的程序設(shè)計(jì)人才。本文從數(shù)據(jù)挖掘、統(tǒng)計(jì)思維概念入手,對(duì)二者之間關(guān)系進(jìn)行了論述,并提出了培養(yǎng)程序設(shè)計(jì)人才具體實(shí)踐策略。
數(shù)據(jù)挖掘;統(tǒng)計(jì)思想;程序設(shè)計(jì)人才;培養(yǎng)途徑
在云計(jì)算、移動(dòng)互聯(lián)網(wǎng)等新技術(shù)不斷發(fā)展下,大數(shù)據(jù)迅速踴躍出現(xiàn),特別是一些大型企業(yè),如電商、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)公司等等,大數(shù)據(jù)改變了人們生產(chǎn)生活方式,對(duì)社會(huì)發(fā)展有著巨大作用。從目前看,管理數(shù)據(jù)能力已經(jīng)成為一個(gè)企業(yè)發(fā)展的核心價(jià)值和能力,但是很多企業(yè)在數(shù)據(jù)挖掘以及程序設(shè)計(jì)人才培養(yǎng)方面還存在一定不足,因此,本文對(duì)數(shù)據(jù)挖掘統(tǒng)計(jì)思維以及程序設(shè)計(jì)人才培養(yǎng)對(duì)策的研究,有著重要意義。
統(tǒng)計(jì)思維主要是指,學(xué)生在學(xué)習(xí)統(tǒng)計(jì)基礎(chǔ)知識(shí)以及基本技能時(shí),具備數(shù)據(jù)分析理念和隨機(jī)思想思維方式以及解決問(wèn)題的方式。主要包含數(shù)據(jù)整理和收集意識(shí),掌握分析數(shù)據(jù)和解析數(shù)據(jù)技巧,同時(shí)也夠結(jié)合數(shù)據(jù)結(jié)果進(jìn)行科學(xué)推斷,進(jìn)而做出決策。此外,數(shù)據(jù)具有不確定、隨機(jī)性等特征,簡(jiǎn)言之,統(tǒng)計(jì)思維主要體現(xiàn)在數(shù)據(jù)收集、整理、敘述、分析以及解析等多方面[1]。
所謂數(shù)據(jù)挖掘,是從大量數(shù)據(jù)中挖掘有價(jià)值的信息,可以從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、互聯(lián)網(wǎng)以及其他信息庫(kù)中挖掘。針對(duì)那些大量信息、未知信息和有利于決策潛在價(jià)值數(shù)據(jù)進(jìn)行深層探索的過(guò)程?;蛘呖梢岳斫鉃椋媒y(tǒng)計(jì)、計(jì)算、分析、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)等多種途徑,將隱藏在海量數(shù)據(jù)中的價(jià)值信息挖掘出來(lái)。
在數(shù)據(jù)挖掘過(guò)程中,主要目的是將監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行分析,分析方法有很多種,如回歸分析、預(yù)測(cè)分析以及可視化分析等,通過(guò)分析發(fā)現(xiàn)那些未知關(guān)系并進(jìn)行匯總。在分析過(guò)程中,可以通過(guò)不同途徑,借助不同輔助工具等,利用數(shù)據(jù)建模和關(guān)系發(fā)現(xiàn)有利于輔助處理大量數(shù)據(jù),進(jìn)而輔助預(yù)測(cè)和決策[2]。
在眾多數(shù)據(jù)挖掘算法中,體現(xiàn)出統(tǒng)計(jì)學(xué)方法在數(shù)據(jù)挖掘工作具有重要作用。數(shù)據(jù)挖掘過(guò)程中,不斷對(duì)數(shù)據(jù)進(jìn)行收集、歸納、分析進(jìn)行整理。由此可見,統(tǒng)計(jì)思維一直處于數(shù)據(jù)挖掘工作中,數(shù)據(jù)挖掘本質(zhì)就是獲取統(tǒng)計(jì)思維并對(duì)其不斷進(jìn)行強(qiáng)化的過(guò)程。在這期間也體現(xiàn)了統(tǒng)計(jì)思維應(yīng)用價(jià)值,并在使用過(guò)程中對(duì)其進(jìn)一步創(chuàng)新。統(tǒng)計(jì)思維對(duì)數(shù)據(jù)挖掘工作也具有一定指導(dǎo)作用。通過(guò)充分利用統(tǒng)計(jì)思維,不同統(tǒng)計(jì)方法、統(tǒng)計(jì)分析法,實(shí)現(xiàn)進(jìn)一步挖掘數(shù)據(jù)??傊?,數(shù)據(jù)挖掘和統(tǒng)計(jì)思維是相互作用關(guān)系,另外可以通過(guò)統(tǒng)計(jì)學(xué)或是數(shù)理統(tǒng)計(jì)的學(xué)習(xí),繼續(xù)加強(qiáng)統(tǒng)計(jì)思維訓(xùn)練,促使其在數(shù)據(jù)挖掘過(guò)程中充分發(fā)揮引導(dǎo)價(jià)值[3]。
程序設(shè)計(jì),是對(duì)特定問(wèn)題程序進(jìn)行解決的過(guò)程。程序設(shè)計(jì)主要利用程序設(shè)計(jì)語(yǔ)言,通過(guò)基礎(chǔ)算法,實(shí)現(xiàn)數(shù)據(jù)處理的過(guò)程。其設(shè)計(jì)過(guò)程分為分析、設(shè)計(jì)、編碼、測(cè)試以及查錯(cuò)等步驟。
現(xiàn)代社會(huì)需求應(yīng)用型、復(fù)合型人才,對(duì)人才培養(yǎng)主要是對(duì)其進(jìn)行教育,加強(qiáng)專業(yè)培訓(xùn)。促使人才形成良好綜合素質(zhì),具備社會(huì)責(zé)任感,并且專業(yè)度強(qiáng)同時(shí)要有一定自主學(xué)習(xí)能力、創(chuàng)新精神和能力。一方面在基礎(chǔ)和實(shí)際應(yīng)用兩方面研究進(jìn)行訓(xùn)練,使得人才具備扎實(shí)理論知識(shí)和實(shí)踐技能,培養(yǎng)動(dòng)手能力提高綜合素質(zhì)。另一方面,培養(yǎng)人才形成一定的科學(xué)思維,運(yùn)用科學(xué)思維獲取更多知識(shí),激發(fā)專業(yè)人才探索精神、創(chuàng)新能力以及良好職業(yè)素養(yǎng)。在當(dāng)今信息化大數(shù)據(jù)時(shí)代背景下,結(jié)合多年教學(xué)實(shí)踐經(jīng)驗(yàn),以下進(jìn)行了三方面培養(yǎng)策略的分析[4]。
在以往程序設(shè)計(jì)教學(xué)過(guò)程中,無(wú)論是學(xué)習(xí)還是教學(xué)主要是學(xué)習(xí)基本語(yǔ)法規(guī)則,掌握程序設(shè)計(jì)基礎(chǔ)方法,具備語(yǔ)言表達(dá)能力。在實(shí)驗(yàn)或是訓(xùn)練中主要從幾方面進(jìn)行:常規(guī)性計(jì)算、實(shí)際問(wèn)題計(jì)算機(jī)表示、算法空間以及時(shí)間復(fù)雜度分析、數(shù)據(jù)組織方式及輸入、輸出等能力。大數(shù)據(jù)時(shí)代,傳統(tǒng)教學(xué)方式已經(jīng)滿足不了社會(huì)、行業(yè)以及企業(yè)對(duì)程序設(shè)計(jì)工作人員的要求,因此,培養(yǎng)程序設(shè)計(jì)人員首要任務(wù)是加強(qiáng)統(tǒng)計(jì)學(xué)、數(shù)理統(tǒng)計(jì)、統(tǒng)計(jì)方法訓(xùn)練[5]。
統(tǒng)計(jì)學(xué)是一門數(shù)據(jù)分析、數(shù)據(jù)處理綜合性學(xué)科,其中包括隨機(jī)事件、概率分析、統(tǒng)計(jì)分析等基本理論。所以,在進(jìn)行實(shí)驗(yàn)或者實(shí)訓(xùn)時(shí),要加強(qiáng)設(shè)計(jì)有關(guān)隨機(jī)事件、概率統(tǒng)等方面問(wèn)題??梢岳觅N近生活實(shí)際案例,比如設(shè)置這樣的問(wèn)題:分析高速公路中流量情況、分析城市交通要道堵塞時(shí)間段、統(tǒng)計(jì)交通事故等等?;谶@樣的問(wèn)題設(shè)計(jì),要求程序設(shè)計(jì)人員要通過(guò)大量實(shí)踐、隨機(jī)取樣等進(jìn)行豐富驗(yàn)證,最終得到有價(jià)值的方法。
要充分利用概率事件創(chuàng)設(shè)問(wèn)題,加強(qiáng)訓(xùn)練程度設(shè)計(jì)人員概率思維,逐步培養(yǎng)統(tǒng)計(jì)思維能力,通過(guò)不斷實(shí)踐,完善程序設(shè)計(jì)人才培養(yǎng)以及訓(xùn)練方法。從而為數(shù)據(jù)挖掘培養(yǎng)出符合社會(huì)需求乃至大數(shù)據(jù)需求的綜合型人才[6]。
目前,在程序設(shè)計(jì)人員培養(yǎng)和教學(xué)方法上,主要表現(xiàn)為研究確定的軟件架構(gòu)和實(shí)現(xiàn)方法,研究數(shù)據(jù)庫(kù)中現(xiàn)有結(jié)構(gòu)化數(shù)據(jù)應(yīng)用情況。但在當(dāng)前大數(shù)據(jù)時(shí)代下,所呈現(xiàn)出無(wú)結(jié)構(gòu)化或半結(jié)構(gòu)化,并且其數(shù)量正在不斷增加,而這些結(jié)構(gòu)中還隱藏著巨大應(yīng)用研究?jī)r(jià)值,這就要求當(dāng)今程序設(shè)計(jì)人員要具備先進(jìn)科技應(yīng)用水平和新型科技知識(shí)。如云計(jì)算、云儲(chǔ)存、人工智能、機(jī)器學(xué)習(xí)等,要加強(qiáng)程序設(shè)計(jì)人員對(duì)這些先進(jìn)科技的學(xué)習(xí)和研究,從海量并且不確定事件中挖掘潛在價(jià)值知識(shí)。從而為我國(guó)國(guó)防、交通、教育、科技等各行各業(yè)更好地提供優(yōu)勢(shì)服務(wù),全面實(shí)現(xiàn)社會(huì)主義建設(shè)。
運(yùn)用統(tǒng)計(jì)分析法實(shí)現(xiàn)數(shù)據(jù)挖掘算法,工作方向體現(xiàn)在方法論研究層面,進(jìn)而尋找普遍性規(guī)律。此外,還有諸多算法可一應(yīng)用到實(shí)際工作中,例如:機(jī)器學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)算法、模式識(shí)別算法等。事實(shí)上,很多數(shù)據(jù)是沒有規(guī)律可以尋找的,這對(duì)程序設(shè)計(jì)人員以及數(shù)據(jù)分析人員等提出了更高要求,要對(duì)大量數(shù)據(jù)進(jìn)行個(gè)多方面統(tǒng)計(jì)或是實(shí)時(shí)統(tǒng)計(jì),在個(gè)別數(shù)據(jù)值達(dá)到統(tǒng)計(jì)量時(shí),就很大程度上會(huì)發(fā)現(xiàn)規(guī)律,挖掘出隱藏價(jià)值信息[7]。
上文提到的屬于形式統(tǒng)計(jì)思維,有效解決了數(shù)據(jù)挖掘依賴統(tǒng)計(jì)分析絕對(duì)性。簡(jiǎn)單說(shuō),如果找不到統(tǒng)計(jì)法方法,完全可以利用這種機(jī)械式統(tǒng)計(jì)方法,對(duì)大量數(shù)據(jù)進(jìn)行反復(fù)統(tǒng)計(jì)和計(jì)算分析,也是能發(fā)現(xiàn)更多具有價(jià)值的規(guī)律和知識(shí)。例如,可以對(duì)具有大流量一百條高速公路中指定路段,其中過(guò)往轎車車牌號(hào)、車型等進(jìn)行連續(xù)100天統(tǒng)計(jì),結(jié)果可能會(huì)使得用戶提高對(duì)轎車滿意度,而指定車輛出現(xiàn)頻率、歸屬地頻率等,從分析結(jié)果看,也有可能會(huì)為轎車廠家以及交管部門提供價(jià)值信息。總的來(lái)說(shuō),純形式的統(tǒng)計(jì)思維對(duì)數(shù)據(jù)挖掘工作也有一定作用。
基于大數(shù)據(jù)背景,數(shù)據(jù)挖掘工作主要是找尋數(shù)據(jù)之間的關(guān)聯(lián),通過(guò)這種關(guān)聯(lián)關(guān)系能很好幫助進(jìn)行決策,利用科學(xué)方法進(jìn)而創(chuàng)造更大價(jià)值,使得事物之間形成一種相互促進(jìn)相互協(xié)調(diào)發(fā)展?fàn)顟B(tài)。為促使社會(huì)不斷進(jìn)步,要通過(guò)教學(xué)對(duì)程序設(shè)計(jì)人才進(jìn)行有計(jì)劃有針對(duì)性的培養(yǎng),要求不僅要了解計(jì)算機(jī)基礎(chǔ)知識(shí)和技能,還要掌握程序設(shè)計(jì)基礎(chǔ)理論、基礎(chǔ)方法,具備設(shè)計(jì)能力。更重要的是要通過(guò)當(dāng)今時(shí)代背景,融合科學(xué)間的關(guān)系,利用統(tǒng)計(jì)分析方法挖掘?qū)W科之間潛在價(jià)值,從而培養(yǎng)出適應(yīng)社會(huì)的全方位人才。
[1]黃磊.計(jì)算機(jī)程序設(shè)計(jì)專業(yè)人才培養(yǎng)模式探索[J].職業(yè), 2017(23):18-20.
[2]邱麗萍.基于大數(shù)據(jù)與統(tǒng)計(jì)新思維的研究[J].經(jīng)貿(mào)實(shí)踐, 2017(18):24-27.
[3]方芳,王軍華.程序設(shè)計(jì)課程中計(jì)算思維能力的培養(yǎng)[J]. 福建電腦,2018,34(12):176-177.