• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)時(shí)代數(shù)據(jù)科學(xué)課程建設(shè)與人才培養(yǎng)的探索

      2018-01-04 11:35:20姚力朱龍飛崔晨
      計(jì)算機(jī)時(shí)代 2018年11期
      關(guān)鍵詞:專業(yè)建設(shè)人才培養(yǎng)大數(shù)據(jù)

      姚力 朱龍飛 崔晨

      摘 要: 隨著信息技術(shù)與人類生產(chǎn)生活的交匯融合,數(shù)據(jù)迅猛增長(zhǎng),數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源。大數(shù)據(jù)給科學(xué)研究帶來了巨大變化,數(shù)據(jù)驅(qū)動(dòng)的研究范式在各學(xué)科領(lǐng)域興起,數(shù)據(jù)科學(xué)人才培養(yǎng)成了應(yīng)對(duì)大數(shù)據(jù)時(shí)代所面臨挑戰(zhàn)的關(guān)鍵。文章從數(shù)據(jù)科學(xué)人才培育的機(jī)遇與現(xiàn)狀出發(fā),調(diào)研了國(guó)內(nèi)外高校在數(shù)據(jù)科學(xué)專業(yè)建設(shè)方面的案例。在此基礎(chǔ)上,探索并提出數(shù)據(jù)科學(xué)教育體系中可采用的具體策略和方法,為高等院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)相關(guān)專業(yè)的發(fā)展提供了思路。

      關(guān)鍵詞: 大數(shù)據(jù); 數(shù)據(jù)科學(xué); 人才培養(yǎng); 專業(yè)建設(shè)

      中圖分類號(hào):TP309 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2018)11-87-04

      Abstract: The convergence of information technology and human life has led to the rapid growth of data, which becomes the basic strategic resource of the country. Big data brings great changes to scientific research, and data driven research paradigms are rising in various disciplines. Data science education is the key to success in coping with the challenges in the era of big data. This paper reviews the opportunity and current situation in data science education, and investigates on the cases of data science specialty construction in colleges and universities. Specific strategies and methods that can be used in the data science education system are proposed, which provides a way for the development of data science and big data specialties in universities.

      Key words: big data; data science; talent cultivation; specialty construction

      0 引言

      數(shù)據(jù)科學(xué)在20世紀(jì)60年代被提出,在當(dāng)時(shí)并未獲得學(xué)術(shù)界的注意和認(rèn)可。1974年,計(jì)算機(jī)科學(xué)家、圖靈獎(jiǎng)獲得者Peter Naur在其著作《計(jì)算機(jī)方法的簡(jiǎn)明調(diào)研》的前言中首次明確提出了數(shù)據(jù)科學(xué)(Data Science)的概念,“數(shù)據(jù)科學(xué)是一門基于數(shù)據(jù)處理的科學(xué),一旦數(shù)據(jù)與其代表事物的關(guān)系被建立起來,將為其他領(lǐng)域與科學(xué)提供借鑒”。2001年美國(guó)統(tǒng)計(jì)學(xué)教授William Cleveland發(fā)表了《數(shù)據(jù)科學(xué):拓展統(tǒng)計(jì)學(xué)的技術(shù)領(lǐng)域的行動(dòng)計(jì)劃》,首次將數(shù)據(jù)科學(xué)作為一個(gè)單獨(dú)學(xué)科,并把數(shù)據(jù)科學(xué)定義為統(tǒng)計(jì)學(xué)領(lǐng)域擴(kuò)展到以數(shù)據(jù)作為現(xiàn)金計(jì)算對(duì)象相結(jié)合的部分,奠定了數(shù)據(jù)科學(xué)的理論基礎(chǔ)[1]。數(shù)據(jù)科學(xué)作為一門較為新興的學(xué)科,所關(guān)注的正是在大數(shù)據(jù)時(shí)代的背景下,如何應(yīng)用和數(shù)據(jù)相關(guān)的技術(shù)和理論來服務(wù)社會(huì)。

      在數(shù)據(jù)科學(xué)課程理論的研究中,經(jīng)常會(huì)提及數(shù)據(jù)、信息和知識(shí)這三個(gè)概念。一個(gè)稱為“知識(shí)金字塔”(圖1)的模型被廣泛用于表示三者之間的關(guān)系。如今,由于大量的數(shù)據(jù)正在以前所未有的速度產(chǎn)生,而這些數(shù)據(jù)沒有被有效地處理轉(zhuǎn)化成信息,從而延誤了知識(shí)的提取和產(chǎn)生。從原始數(shù)據(jù)中提取價(jià)值需要一種明確的系統(tǒng)和方法,數(shù)據(jù)科學(xué)代表了解決大數(shù)據(jù)挑戰(zhàn)所必需的一門學(xué)科。教育應(yīng)發(fā)揮其作用,培養(yǎng)具備適應(yīng)數(shù)據(jù)科學(xué)領(lǐng)域知識(shí),能批判性地思考并正確利用相應(yīng)技術(shù)來解決大數(shù)據(jù)問題的人才[2]。

      1 大數(shù)據(jù)、數(shù)據(jù)科學(xué)和數(shù)據(jù)科學(xué)家的概念

      1.1 大數(shù)據(jù)

      大數(shù)據(jù)描述了我們正面臨的數(shù)據(jù)挑戰(zhàn)。一家產(chǎn)業(yè)咨詢服務(wù)機(jī)構(gòu)的研究報(bào)告稱,2016年,全球大數(shù)據(jù)產(chǎn)業(yè)市場(chǎng)規(guī)模為1403億美元,預(yù)計(jì)到2020年將達(dá)到10270億美元。促成大數(shù)據(jù)時(shí)代出現(xiàn)的兩個(gè)主要因素是計(jì)算技術(shù)的快速發(fā)展和由此產(chǎn)生的數(shù)據(jù)爆炸。前者包括硬件技術(shù),如CPU速度和網(wǎng)絡(luò)帶寬,以及軟件技術(shù),如分布式并行處理框架的出現(xiàn);后者包括基于網(wǎng)絡(luò)的軟件的日益普及以及各種傳感器的廣泛使用。

      如何定義大數(shù)據(jù)?Gartner將其定義為3V特征,即“高容量,高速度和高多樣性的信息資產(chǎn),這些資產(chǎn)具有成本效益,創(chuàng)新形式的信息處理形式,以增強(qiáng)洞察力和決策能力”[3]。在此定義的基礎(chǔ)上,IBM提出了大數(shù)據(jù)5V特點(diǎn)。①Volume:數(shù)據(jù)量大,包括采集、存儲(chǔ)和計(jì)算的量都非常大。②Variety:數(shù)據(jù)類型、來源和處理方式的多樣性。③Value:數(shù)據(jù)價(jià)值密度相對(duì)較低。隨著互聯(lián)網(wǎng)及物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在,信息海量,但價(jià)值密度較低,價(jià)值是迄今為止最具挑戰(zhàn)性的維度。④Velocity:數(shù)據(jù)增長(zhǎng)速度快,處理速度也快,時(shí)效性要求高。⑤Veracity:數(shù)據(jù)的準(zhǔn)確性是指數(shù)據(jù)的質(zhì)量、可靠性和不確定性。

      1.2 數(shù)據(jù)科學(xué)

      數(shù)據(jù)科學(xué)是門包羅萬象的學(xué)科涉及很多方面的內(nèi)容,涵蓋數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、模式識(shí)別、分布式計(jì)算、圖形學(xué)等多個(gè)領(lǐng)域的技術(shù)和理論。我們可以這樣定義數(shù)據(jù)科學(xué):數(shù)據(jù)科學(xué)是一門通過系統(tǒng)性研究來獲取與數(shù)據(jù)相關(guān)的知識(shí)體系的科學(xué)[4]。這里有兩個(gè)層面的含義:一是研究數(shù)據(jù)本身,數(shù)據(jù)的各種類型、結(jié)構(gòu)、狀態(tài)、屬性、變化形式和變化規(guī)律;二是通過對(duì)數(shù)據(jù)的研究,為自然科學(xué)和社會(huì)科學(xué)的研究提供一種新的方法,稱為科學(xué)研究的數(shù)據(jù)方法,其目的在于揭示自然界和人類行為的現(xiàn)象和規(guī)律。

      2010年,Drew Conway提出了第一張揭示數(shù)據(jù)科學(xué)的學(xué)科地位的維恩圖(圖2),首次明確探討了數(shù)據(jù)科學(xué)的學(xué)科定位問題。從數(shù)據(jù)科學(xué)維恩圖的中心部分可看出,數(shù)據(jù)科學(xué)位于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)和某一領(lǐng)域知識(shí)的交叉之處,具備較為顯著的交叉型學(xué)科的特點(diǎn),即數(shù)據(jù)科學(xué)是一門以統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和領(lǐng)域知識(shí)為理論基礎(chǔ)的新興學(xué)科。同時(shí),從該圖的外圍可看出,數(shù)據(jù)科學(xué)家需要具備數(shù)學(xué)與統(tǒng)計(jì)學(xué)知識(shí)、領(lǐng)域?qū)崙?zhàn)和黑客精神,即數(shù)據(jù)科學(xué)具有三個(gè)基本要素:理論知識(shí)(數(shù)學(xué)與統(tǒng)計(jì)學(xué))、實(shí)踐經(jīng)驗(yàn)(領(lǐng)域?qū)崉?wù))和精神(黑客精神)。

      1.3 數(shù)據(jù)科學(xué)家

      “數(shù)據(jù)科學(xué)家”是在2009年由Natahn Yau首次提出,其概念是采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具尋找新的數(shù)據(jù)洞察的工程師。數(shù)據(jù)科學(xué)家通過精深的專業(yè)知識(shí),包括數(shù)學(xué),統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué),在某具體學(xué)科解決復(fù)雜的數(shù)據(jù)問題。

      數(shù)據(jù)科學(xué)家專注于從數(shù)據(jù)中提取可操作的知識(shí),以解決業(yè)務(wù)問題。他們?cè)谝欢ǖ钠谙迌?nèi),完成假設(shè)驅(qū)動(dòng)的分析,深入持續(xù)的對(duì)那些容量大,且結(jié)構(gòu)錯(cuò)綜復(fù)雜的數(shù)據(jù)進(jìn)行探索和挖掘。他們利用簡(jiǎn)單的方法,并通過簡(jiǎn)單明了的可視化操作,把科學(xué)家的復(fù)雜的想法傳達(dá)到人們手中,從而領(lǐng)導(dǎo)一個(gè)團(tuán)隊(duì)進(jìn)行方法選擇、評(píng)估結(jié)果以實(shí)施效果[5]。

      數(shù)據(jù)科學(xué)家所需硬件技能主要包括計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)數(shù)學(xué)、數(shù)據(jù)挖掘、數(shù)據(jù)可視化、領(lǐng)導(dǎo)力和軟技能。目前,許多數(shù)據(jù)科學(xué)家在接受正規(guī)數(shù)據(jù)科學(xué)學(xué)位課程的教育,國(guó)內(nèi)外一些大學(xué)也正在或計(jì)劃提供這類課程。

      2 數(shù)據(jù)科學(xué)教育的現(xiàn)狀

      在國(guó)外,數(shù)據(jù)科學(xué)專業(yè)是以數(shù)據(jù)分析學(xué)專業(yè)為基礎(chǔ)發(fā)展而來的,可追溯至2007年北卡羅來納州立大學(xué)率先設(shè)立的數(shù)據(jù)分析碩士學(xué)位。之后,美國(guó)諸多高校也都陸續(xù)開始在計(jì)算機(jī)、管理、金融等專業(yè)中開設(shè)數(shù)據(jù)科學(xué)的系列課程。其中,數(shù)據(jù)科學(xué)概論課程起到一個(gè)統(tǒng)領(lǐng)的作用。以美國(guó)哈佛大學(xué)“數(shù)據(jù)科學(xué)”課程為例,其內(nèi)容全面廣泛,強(qiáng)調(diào)學(xué)生動(dòng)手實(shí)踐能力的培養(yǎng)。華盛頓大學(xué)開設(shè)的“數(shù)據(jù)科學(xué)導(dǎo)論”課程同樣表現(xiàn)出內(nèi)容的豐富性。麻省理工學(xué)院開設(shè)了“計(jì)算思維和數(shù)據(jù)科學(xué)導(dǎo)論”課程,介紹如何利用計(jì)算機(jī)來理解真實(shí)世界的現(xiàn)象。該課程為學(xué)生提供許多主題的淺顯介紹, 讓學(xué)生知道在他們的職業(yè)生涯中可以用計(jì)算機(jī)完成什么樣的任務(wù)。華盛頓大學(xué)開設(shè)了“數(shù)據(jù)科學(xué)簡(jiǎn)介”,介紹了關(guān)系型數(shù)據(jù)庫、MapReduce、NoSQL、基礎(chǔ)數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、可視化、圖論等。

      通過這些知名高校的網(wǎng)站上的數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),“概率統(tǒng)計(jì)”和“數(shù)據(jù)挖掘”是最受歡迎的課程。在數(shù)據(jù)科學(xué)中,概率和統(tǒng)計(jì)是最基本和必要的知識(shí)。數(shù)據(jù)挖掘在數(shù)據(jù)科學(xué)出現(xiàn)之前便是一門受歡迎的課程,其在數(shù)據(jù)科學(xué)課程中仍然很重要。進(jìn)一步調(diào)研了碩士的數(shù)據(jù)科學(xué)課程發(fā)現(xiàn),在碩士課程中教授許多不同的高級(jí)課程,如“信息檢索”、“信息和社會(huì)網(wǎng)絡(luò)分析”、“文本挖掘”。 一些課程則同時(shí)出現(xiàn)在學(xué)士課程和碩士課程中,包括“數(shù)據(jù)挖掘”、“數(shù)據(jù)庫”、“機(jī)器學(xué)習(xí)”、“數(shù)據(jù)可視化”、“統(tǒng)計(jì)建模”、“算法”和“數(shù)據(jù)科學(xué)導(dǎo)論”。 最普遍開設(shè)的課程是統(tǒng)計(jì)學(xué)相關(guān)的如“探索性數(shù)據(jù)分析”和“數(shù)據(jù)庫”,這表明,統(tǒng)計(jì)學(xué)是數(shù)據(jù)科學(xué)教育和計(jì)算機(jī)科學(xué)的另一個(gè)核心組成部分。

      相比而言,國(guó)內(nèi)數(shù)據(jù)科學(xué)專業(yè)起步較晚,2015年,教育部首次設(shè)立了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)。包括清華大學(xué)、北京大學(xué)、中國(guó)科學(xué)院大學(xué)等開設(shè)了大數(shù)據(jù)和數(shù)據(jù)科學(xué)相關(guān)課程。其中,中國(guó)人民大學(xué)信息資源管理學(xué)院朝樂門老師編寫的《數(shù)據(jù)科學(xué)》,是國(guó)內(nèi)較早的關(guān)于數(shù)據(jù)科學(xué)的教材。清華大學(xué)成立了“數(shù)據(jù)科學(xué)研究院”,是國(guó)內(nèi)首批培養(yǎng)數(shù)據(jù)科學(xué)人才的研究院,目的是培養(yǎng)更多有跨界意識(shí)和跨界實(shí)踐的人才。

      基于上述調(diào)研,我們觀察到:數(shù)據(jù)科學(xué)學(xué)士課程還處于起步階段,數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和數(shù)據(jù)可視化是最受歡迎的核心課程,而統(tǒng)計(jì)學(xué)和數(shù)據(jù)庫是學(xué)士和碩士課程的兩個(gè)基礎(chǔ)通識(shí)課程。

      3 數(shù)據(jù)科學(xué)教育的途徑

      根據(jù)前文對(duì)數(shù)據(jù)科學(xué)教育的調(diào)查和學(xué)科研究,我們提出以下數(shù)據(jù)科學(xué)教育實(shí)現(xiàn)的途徑。

      3.1 開設(shè)CDO相關(guān)技能課程

      首席數(shù)據(jù)官(Chief Data Officer,簡(jiǎn)稱CDO)是以數(shù)據(jù)為中心的組織高層管理角色,是大數(shù)據(jù)戰(zhàn)略的制定者和推動(dòng)者,負(fù)責(zé)數(shù)據(jù)資產(chǎn)的管理和開發(fā)利用,通過數(shù)據(jù)推動(dòng)業(yè)務(wù)的創(chuàng)新和發(fā)展。我們將CDO定義為一位高級(jí)數(shù)據(jù)科學(xué)家,他們有很強(qiáng)的領(lǐng)導(dǎo)能力、溝通能力、項(xiàng)目管理技能、系統(tǒng)思考能力和數(shù)據(jù)方面的技術(shù)知識(shí)。他們還需要對(duì)大數(shù)據(jù)技術(shù)和解決方案、大數(shù)據(jù)分析生命周期、數(shù)據(jù)管理有很好的理解。雖然要同時(shí)具備上述全部知識(shí)和技能并不容易,然而一個(gè)大數(shù)據(jù)項(xiàng)目的領(lǐng)導(dǎo)者應(yīng)該在這些領(lǐng)域擁有盡可能多的知識(shí)。

      3.2 在教學(xué)中牢記數(shù)據(jù)分析生命周期

      數(shù)據(jù)分析生命周期是專門為大數(shù)據(jù)問題和數(shù)據(jù)科學(xué)項(xiàng)目而設(shè)計(jì)的。它定義了從項(xiàng)目開始到項(xiàng)目結(jié)束整個(gè)分析流程的最佳實(shí)踐,脫胎于數(shù)據(jù)分析和決策科學(xué)領(lǐng)域中的成熟方法,并建立在廣泛收集了數(shù)據(jù)科學(xué)家的反饋并參考了其他成熟的流程的基礎(chǔ)上。

      最著名和最廣泛使用的數(shù)據(jù)挖掘過程模型是CRISP-DM,即“跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程”[6]。該框架提供了一種用于數(shù)據(jù)分析項(xiàng)目的方法,其中涉及組織技能、數(shù)據(jù)集以及領(lǐng)導(dǎo)者的參與。在此基礎(chǔ)上,我們重新完善了數(shù)據(jù)分析生命周期的6個(gè)階段。如圖3所示,這6個(gè)階段形成一個(gè)循環(huán)。

      下面概述數(shù)據(jù)分析生命周期主要階段的任務(wù)。第1階段:發(fā)現(xiàn)。在這個(gè)階段,成員需要學(xué)習(xí)業(yè)務(wù)領(lǐng)域的相關(guān)知識(shí),重點(diǎn)把業(yè)務(wù)問題轉(zhuǎn)化為分析挑戰(zhàn)以待在后續(xù)解決。第2階段:數(shù)據(jù)準(zhǔn)備。團(tuán)隊(duì)需要執(zhí)行提取、加載和轉(zhuǎn)換,將數(shù)據(jù)導(dǎo)入準(zhǔn)備好的分析沙盤中,以便在項(xiàng)目過程中進(jìn)行數(shù)據(jù)和進(jìn)行數(shù)據(jù)分析。第3階段:規(guī)劃模型。在該階段,團(tuán)隊(duì)需要確定在后續(xù)模型構(gòu)建階段所采用的方法、技術(shù)和工作流程,挑選最合適的模型。第4階段:建立模型。團(tuán)隊(duì)在這個(gè)階段構(gòu)建并運(yùn)行由上階段確定的模型,創(chuàng)建用于測(cè)試、培訓(xùn)和生產(chǎn)的數(shù)據(jù)集。第5階段:溝通結(jié)果。團(tuán)隊(duì)需要與主要利益相關(guān)人進(jìn)行合作,以第1階段所制定的標(biāo)準(zhǔn)來判斷項(xiàng)目結(jié)果是成功還是失敗。第6階段:實(shí)施。團(tuán)隊(duì)?wèi)?yīng)該提交最終報(bào)告、簡(jiǎn)報(bào)、代碼和技術(shù)文檔。

      每個(gè)學(xué)院可以在不同的階段中找到自己的優(yōu)勢(shì)。例如,商學(xué)院在商業(yè)理解方面有優(yōu)勢(shì),信息學(xué)院在數(shù)據(jù)理解方面有優(yōu)勢(shì),統(tǒng)計(jì)學(xué)系在模型規(guī)劃方面有優(yōu)勢(shì),計(jì)算機(jī)科學(xué)系則在建模方面有優(yōu)勢(shì)。

      3.3 傳授大數(shù)據(jù)技術(shù)和建模技術(shù)

      大數(shù)據(jù)技術(shù)和模型建立技術(shù)是數(shù)據(jù)科學(xué)的兩個(gè)最技術(shù)性的組成部分,應(yīng)在教學(xué)方案中作為重點(diǎn)。重要的大數(shù)據(jù)技術(shù)包括Hadoop及其生態(tài)系統(tǒng)和分布式并行處理框架[7]。這兩類技術(shù)被廣泛應(yīng)用于處理社交網(wǎng)絡(luò)數(shù)據(jù)、傳感器位置流數(shù)據(jù)和Web日志數(shù)據(jù)。其他重要的大數(shù)據(jù)技術(shù)包括NoSQL數(shù)據(jù)庫、內(nèi)存計(jì)算、云計(jì)算、大數(shù)據(jù)倉庫和數(shù)據(jù)虛擬化。

      在模型構(gòu)建方面的挑戰(zhàn)主要包括處理實(shí)時(shí)流數(shù)據(jù)、可伸縮的機(jī)器學(xué)習(xí)算法。機(jī)器學(xué)習(xí)允許數(shù)據(jù)學(xué)習(xí)的范式,并提供了從大數(shù)據(jù)集中發(fā)現(xiàn)知識(shí)的有效方法,是數(shù)據(jù)科學(xué)教育的重要組成部分。在數(shù)據(jù)科學(xué)教育中,應(yīng)有效地將機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析結(jié)合起來,以應(yīng)對(duì)大數(shù)據(jù)時(shí)代不斷發(fā)展的挑戰(zhàn)。

      3.4 將研究方法納入數(shù)據(jù)分析的教學(xué)

      數(shù)據(jù)科學(xué)學(xué)生應(yīng)接受科學(xué)思維、推理和分析方法的培訓(xùn)。盡管大數(shù)據(jù)問題本質(zhì)上是基于發(fā)現(xiàn)和學(xué)習(xí)的,但學(xué)生應(yīng)該學(xué)會(huì)如何提出一個(gè)研究問題,如何處理這個(gè)問題,以及如何驗(yàn)證結(jié)果。學(xué)生應(yīng)該能夠區(qū)分基于發(fā)現(xiàn)的研究問題和傳統(tǒng)的假設(shè)驅(qū)動(dòng)的研究問題。研究方法相關(guān)的課程可以幫助學(xué)生提高批判性思維的能力,吸收來自各個(gè)學(xué)科的知識(shí),用科學(xué)的方法解決問題,并評(píng)估結(jié)果,因此建議將研究方法納入數(shù)據(jù)分析課程。

      3.5 為學(xué)生提供真實(shí)的工程項(xiàng)目

      數(shù)據(jù)科學(xué)通過使用真實(shí)數(shù)據(jù)來解決現(xiàn)實(shí)世界的問題,這意味著傳統(tǒng)的以教科書為基礎(chǔ)的教育方式不適合數(shù)據(jù)科學(xué)教育。通過參與現(xiàn)實(shí)世界的實(shí)際項(xiàng)目或案例研究來學(xué)習(xí)是數(shù)據(jù)科學(xué)教育的重要組成部分。也就是說,學(xué)生應(yīng)該在一個(gè)通過實(shí)踐學(xué)習(xí)的環(huán)境中學(xué)習(xí),在這個(gè)環(huán)境中,學(xué)生可以獲得關(guān)于數(shù)據(jù)科學(xué)如何使用大數(shù)據(jù)技術(shù)來解決現(xiàn)實(shí)世界問題的經(jīng)驗(yàn)。這是數(shù)據(jù)科學(xué)教育的一個(gè)必修課。

      3.6 與多個(gè)教學(xué)部門協(xié)作

      數(shù)據(jù)科學(xué)是一門多學(xué)科的研究,其課程通常是在大學(xué)內(nèi)聯(lián)合各系部級(jí)提供的。例如,數(shù)據(jù)科學(xué)課程可以由計(jì)算機(jī)科學(xué)系、統(tǒng)計(jì)學(xué)系或商學(xué)院聯(lián)合提供,也可以通過共享教師資源來實(shí)現(xiàn)協(xié)作。又或者,由計(jì)算機(jī)科學(xué)系提供數(shù)據(jù)科學(xué)教育方案,而其他院系負(fù)責(zé)講授一些相關(guān)課程。

      3.7 與產(chǎn)業(yè)界和政府部門合作

      產(chǎn)業(yè)界和政府是真實(shí)世界數(shù)據(jù)的良好來源,不僅是針對(duì)數(shù)據(jù)的教學(xué)資源,也包括其他教學(xué)外的組成部分,如計(jì)算資源、培訓(xùn)、證書、學(xué)生實(shí)習(xí)和工作。產(chǎn)學(xué)研合作研究是推動(dòng)教育向前發(fā)展的既定模式,公司會(huì)很樂意招聘這些曾實(shí)習(xí)過的學(xué)生,因?yàn)檫@些學(xué)生已經(jīng)參與了這些項(xiàng)目,并且很清楚他們的業(yè)務(wù)問題。大學(xué)也可以通過與產(chǎn)業(yè)界和政府的合作獲得資金,以促進(jìn)數(shù)據(jù)科學(xué)教育。

      4 結(jié)束語

      大數(shù)據(jù)改變了人們的工作、生活與思維模式,已成為包括計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)在內(nèi)的多個(gè)學(xué)科領(lǐng)域的新研究方向?,F(xiàn)代社會(huì)需要一門新學(xué)科來系統(tǒng)研究大數(shù)據(jù)時(shí)代的新現(xiàn)象、理念、理論、方法、技術(shù)、工具和實(shí)踐,即數(shù)據(jù)科學(xué)。

      本文探討了數(shù)據(jù)科學(xué)的發(fā)展、學(xué)科地位、知識(shí)體系等基本問題,并提出了數(shù)據(jù)科學(xué)專業(yè)建設(shè)的核心內(nèi)容,即對(duì)數(shù)據(jù)進(jìn)行管理和分析,從而提取其價(jià)值,獲得對(duì)事物洞察的各種技術(shù)手段,把學(xué)生引進(jìn)數(shù)據(jù)科學(xué)的大門。

      與傳統(tǒng)科學(xué)不同,數(shù)據(jù)科學(xué)人才培養(yǎng)既要有傳統(tǒng)科學(xué)中的理論與實(shí)踐,還需要有數(shù)據(jù)科學(xué)家的精神素質(zhì),即原創(chuàng)性設(shè)計(jì)、批判性思考、好奇心等。未來數(shù)據(jù)科學(xué)專業(yè)的建設(shè)應(yīng)圍繞數(shù)據(jù)科學(xué)的三個(gè)基本要素,加強(qiáng)數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等學(xué)科之間的合作,調(diào)動(dòng)社會(huì)、產(chǎn)業(yè)界的數(shù)據(jù)資源,更好的培養(yǎng)“理論、實(shí)踐和精神為一體”的綜合性人才。

      參考文獻(xiàn)(References):

      [1] Data science: history [EB /OL]. https://en.wikipedia.org/wiki/Data_science.

      [2] 甘容輝,何高大.大數(shù)據(jù)時(shí)代高等教育改革的價(jià)值取向及實(shí)現(xiàn)路徑[J].中國(guó)電化教育,2015.11:70-76

      [3] 王新才,丁家友.大數(shù)據(jù)知識(shí)圖譜:概念、特征、應(yīng)用與影響[J].情報(bào)科學(xué),2013.9:10-14

      [4] 朱建平,章貴軍,劉曉葳.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計(jì)研究,2014.31(2):10-19

      [5] 秦小燕,初景利.國(guó)外數(shù)據(jù)科學(xué)家能力體系研究現(xiàn)狀與啟示[J].圖書情報(bào)工作,2017.61(23):40-50

      [6] CRISP-DM [EB /OL].https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining.

      [7] 陳吉榮,樂嘉錦.基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)解決方案綜述[J].計(jì)算機(jī)工程與科學(xué),2013.35(10):25-35

      猜你喜歡
      專業(yè)建設(shè)人才培養(yǎng)大數(shù)據(jù)
      以就業(yè)為導(dǎo)向的計(jì)算機(jī)信息管理專業(yè)建設(shè)探索
      高職院校新開設(shè)無人機(jī)專業(yè)的探討
      人間(2016年26期)2016-11-03 17:52:40
      服務(wù)地鐵工學(xué)結(jié)合
      職業(yè)(2016年10期)2016-10-20 22:26:18
      基于人才培養(yǎng)的中職生日常管理研究
      成才之路(2016年25期)2016-10-08 10:18:35
      基于人才培養(yǎng)的高校舞蹈教育研究
      成才之路(2016年25期)2016-10-08 10:02:22
      女子中專班級(jí)管理共性問題與解決策略研究
      成才之路(2016年25期)2016-10-08 09:56:03
      基于人才培養(yǎng)的技工學(xué)校德育實(shí)效性研究
      成才之路(2016年25期)2016-10-08 09:51:08
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      雅江县| 泰安市| 来宾市| 巴林左旗| 靖江市| 乡宁县| 仪陇县| 曲阳县| 荣成市| 镶黄旗| 攀枝花市| 金坛市| 临西县| 兴隆县| 闵行区| 利辛县| 剑阁县| 习水县| 响水县| 晋中市| 甘南县| 牙克石市| 晋中市| 红原县| 田林县| 富民县| 孟村| 大渡口区| 嘉鱼县| 绥德县| 北宁市| 清徐县| 正安县| 台前县| 科尔| 浠水县| 南康市| 齐齐哈尔市| 台东县| 沙洋县| 乌什县|