羅軍鋒+徐菲
摘 要:隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)從簡(jiǎn)單的處理對(duì)象開始轉(zhuǎn)變?yōu)榛A(chǔ)性資源,如何更好地管理和利用好大數(shù)據(jù)已經(jīng)成為普遍關(guān)注的話題,各行各業(yè)的信息化因此都會(huì)發(fā)生深層次的變革,高校也不例外。本文將聚焦大數(shù)據(jù)時(shí)代下的高校信息化這個(gè)話題,首先討論了大數(shù)據(jù)的基本概念、關(guān)鍵技術(shù)、高校信息化在大數(shù)據(jù)時(shí)代的主要挑戰(zhàn),最后介紹了我校大數(shù)據(jù)處理的基本框架平臺(tái)。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;高校信息化
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2014)03-0011-04
引言
近年來(lái),隨著以博客、社交網(wǎng)、微博、微信為代表的新媒體地不斷出現(xiàn),特別是信息獲取技術(shù)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的興起,引發(fā)了數(shù)據(jù)規(guī)模爆炸式的增長(zhǎng),學(xué)術(shù)界、企業(yè)界、政府機(jī)構(gòu)紛紛開始關(guān)注大數(shù)據(jù)問(wèn)題。學(xué)術(shù)界最早是《Nature》于2008年就推出了Big Data專刊。[1]全球知名的咨詢公司麥肯錫2011年6月份發(fā)布了一份關(guān)于大數(shù)據(jù)的報(bào)告“Big data:The next frontier for innovation,competition,and productivity”,對(duì)大數(shù)據(jù)的影響、關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域等都進(jìn)行了很詳細(xì)的分析。[2]美國(guó)奧巴馬政府啟動(dòng)了“大數(shù)據(jù)研究和發(fā)展倡議”,計(jì)劃在生物醫(yī)學(xué)、環(huán)境、科研等領(lǐng)域利用大數(shù)據(jù)進(jìn)行技術(shù)突破。我國(guó)在《國(guó)家中長(zhǎng)期科技發(fā)展規(guī)劃綱要(2006-2020)》提出:“信息領(lǐng)域要重點(diǎn)研究開發(fā)……海量信息處理及知識(shí)挖掘的理論與方法……”。另一方面,著名的連鎖超市沃爾瑪每小時(shí)需要處理100萬(wàn)條用戶請(qǐng)求,維護(hù)著超過(guò)2.5PB的數(shù)據(jù)庫(kù);社交網(wǎng)絡(luò)Facebook存儲(chǔ)超過(guò)500億張照片;IDC多年的研究結(jié)果證實(shí):全球數(shù)據(jù)量大約每?jī)赡攴环?,每年產(chǎn)生的數(shù)據(jù)量按指數(shù)級(jí)增長(zhǎng),目前全球有46億移動(dòng)電話用戶,有20億人訪問(wèn)互聯(lián)網(wǎng),所有這些都證明了大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),甚至有人認(rèn)為,大數(shù)據(jù)是繼物聯(lián)網(wǎng)、云計(jì)算后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革。
本文試圖從大數(shù)據(jù)的基本概念、定義出發(fā),分析了大數(shù)據(jù)時(shí)代的關(guān)鍵技術(shù),大數(shù)據(jù)時(shí)代的高等教育信息化面臨的挑戰(zhàn)、對(duì)策、未來(lái)的應(yīng)用前景等。
一、大數(shù)據(jù)的基本概念及特點(diǎn)
對(duì)于大數(shù)據(jù)目前尚沒(méi)有一個(gè)公認(rèn)的定義,維基百科對(duì)大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集。[3]麥肯錫將大數(shù)據(jù)定義為:無(wú)法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。[4]大數(shù)據(jù)不是一種新技術(shù),也不是新產(chǎn)品,而是一種新現(xiàn)象,大數(shù)據(jù)強(qiáng)調(diào)對(duì)數(shù)據(jù)的抓取、管理和處理。
1.大數(shù)據(jù)具有以下4個(gè)特點(diǎn),既4個(gè)“V”[5]
(1)數(shù)量(Volumes):是指數(shù)據(jù)規(guī)模超大。數(shù)量級(jí)別從TB(1TB=1024GB)級(jí)別,躍升到 PB(1PB=1024TB)、EB(1 EB = 1 024 PB )乃至 ZB (1 ZB =1 024 EB )級(jí)別。
(2)多樣性(Variety):是指管理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)來(lái)自多種數(shù)據(jù)源如傳感器、智能設(shè)備, 數(shù)據(jù)種類和格式?jīng)_破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,包括文本、微博、音頻、視頻等等。
(3)速度(Velocity):是指處理數(shù)據(jù)快,包含大量或?qū)崟r(shí)數(shù)據(jù)分析處理的時(shí)間要求非常短,1秒定律。速度影響數(shù)據(jù)時(shí)延,從數(shù)據(jù)創(chuàng)建或獲取到數(shù)據(jù)可以訪問(wèn)的時(shí)間差。
(4)價(jià)值(Value):是指價(jià)值密度低,商業(yè)價(jià)值高。以視頻為例 ,連續(xù)不間斷的監(jiān)控過(guò)程中 ,可能有用的數(shù)據(jù)僅僅有一兩秒。
大數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫(kù)也有明顯的區(qū)別,兩者在數(shù)據(jù)來(lái)源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等各個(gè)方面都有很大的變化。正像孟小峰所言,兩者的區(qū)別就是“池塘捕魚”和“大海捕魚”的區(qū)別,前者代表著傳統(tǒng)數(shù)據(jù)庫(kù)時(shí)代的數(shù)據(jù)管理方式,后者則對(duì)應(yīng)著大數(shù)據(jù)時(shí)代的數(shù)據(jù)管理方式,其在數(shù)據(jù)規(guī)模、數(shù)據(jù)類型、數(shù)據(jù)模式、數(shù)據(jù)對(duì)象、處理工具上都有巨大的差異。[6]這意味著面對(duì)大數(shù)據(jù)時(shí)代,應(yīng)該采取全新的數(shù)據(jù)思維來(lái)應(yīng)對(duì),這種數(shù)據(jù)思維將數(shù)據(jù)看作一種基礎(chǔ)資源,用這種資源來(lái)協(xié)同解決諸多領(lǐng)域的問(wèn)題。
2.大數(shù)據(jù)來(lái)源
那么大數(shù)據(jù)來(lái)源于哪里呢?人類經(jīng)過(guò)幾千年的發(fā)展,今天數(shù)據(jù)的產(chǎn)生已經(jīng)不受時(shí)間、地點(diǎn)的限制。目前,大數(shù)據(jù)的來(lái)源主要有以下幾個(gè)部分。
(1)信息系統(tǒng)?;蛘呓羞\(yùn)營(yíng)系統(tǒng),數(shù)據(jù)庫(kù)的出現(xiàn)促使了這一階段的快速發(fā)展,常見(jiàn)的超市管理系統(tǒng)、銀行管理系統(tǒng),高校人事管理信息系統(tǒng),每一筆業(yè)務(wù),都會(huì)在數(shù)據(jù)庫(kù)中產(chǎn)生一系列數(shù)據(jù),該系統(tǒng)經(jīng)過(guò)多年的發(fā)展,已經(jīng)趨于穩(wěn)定與成熟。
(2)互聯(lián)網(wǎng)廣大用戶?;ヂ?lián)網(wǎng)的誕生促使了人類交流新篇章的開啟,尤其是微博、微信為代表的新媒體的發(fā)展和以智能手機(jī)、平板電腦為代表的新型移動(dòng)職能終端的出現(xiàn),促使了以用戶原創(chuàng)內(nèi)容(User Generated Content,UGC)這類數(shù)據(jù)的爆炸式增長(zhǎng),其產(chǎn)生的數(shù)據(jù)量更是無(wú)可比擬的。
(3)物聯(lián)網(wǎng)系統(tǒng)。傳感器的廣泛布置,將人類的觸角實(shí)時(shí)伸向了社會(huì)的各個(gè)角落,這些設(shè)備源源不斷地產(chǎn)生新數(shù)據(jù)。
數(shù)據(jù)是廣泛的,龐大的,巨量的,所缺乏的是從中提取出知識(shí)的能力是更需要的。大數(shù)據(jù)的根本目的也就是提取有用的知識(shí),并將用到具體的領(lǐng)域。這才是大數(shù)據(jù)的真正挑戰(zhàn)。
二、大數(shù)據(jù)的關(guān)鍵技術(shù)
隨著大數(shù)據(jù)時(shí)代的來(lái)到,要處理的數(shù)據(jù)量越來(lái)越大,傳統(tǒng)的常規(guī)數(shù)據(jù)處理技術(shù)已經(jīng)無(wú)法應(yīng)對(duì),為了解決這些難題就需要突破傳統(tǒng)技術(shù),根據(jù)大數(shù)據(jù)的特點(diǎn)進(jìn)行技術(shù)變革,因此就需要解決一系列針對(duì)大數(shù)據(jù)收集、存儲(chǔ)、管理、處理、分析和可視化等技術(shù),這些關(guān)鍵技術(shù)包括以下幾類。
(1)分布式文件系統(tǒng):該系統(tǒng)提供最底層存儲(chǔ)能力的支持,是支撐上層應(yīng)用的基礎(chǔ)。Google公司最早開發(fā)除了自己的文件系統(tǒng)GFS(Google File System),該系統(tǒng)主要針對(duì)文件較大,讀遠(yuǎn)大于寫的場(chǎng)景,采用主從結(jié)構(gòu),通過(guò)數(shù)據(jù)分塊、追加更新等方式實(shí)現(xiàn)海量數(shù)據(jù)的高效存儲(chǔ)。GFS的架構(gòu)如圖1所示。另外在GFS以及在它基礎(chǔ)上衍生出來(lái)的開源分布式文件系統(tǒng)HDFS與KFS。Google公司針對(duì)GFS無(wú)法滿足新形勢(shì)需要的問(wèn)題,進(jìn)行了重新設(shè)計(jì),新系統(tǒng)的名稱為Colosuss,具體實(shí)現(xiàn)尚未公開?,F(xiàn)在常用的分布式系統(tǒng)存在著對(duì)小文件的支持受限、元數(shù)據(jù)節(jié)點(diǎn)單一等問(wèn)題。
(2)分布式數(shù)據(jù)庫(kù)系統(tǒng):由于關(guān)系模型的分布式數(shù)據(jù)庫(kù)不能應(yīng)對(duì)大數(shù)據(jù)時(shí)代大規(guī)模的壓力、不能應(yīng)對(duì)多樣化的數(shù)據(jù)類型等,相應(yīng)的提出了許多新型數(shù)據(jù)庫(kù)系統(tǒng),如Google的Bigtable、Amazon的Dynamo等等,直到現(xiàn)在形成了統(tǒng)一稱為NoSQL(not only SQL)數(shù)據(jù)庫(kù)。雖然NoSQL沒(méi)有準(zhǔn)確的定義,但一般認(rèn)為具有模式自由、簡(jiǎn)易備份、最終一致性、支持海量數(shù)據(jù)等特征。是指那些非關(guān)系型的、分布式的、不保證遵循ACID原則的數(shù)據(jù)存儲(chǔ)系統(tǒng),分為key-value存儲(chǔ)、文檔數(shù)據(jù)庫(kù)和圖數(shù)據(jù)庫(kù)等3類。[6] NoSQL和關(guān)系型數(shù)據(jù)庫(kù)的簡(jiǎn)單對(duì)比如表所示。[7]
典型的NoSQL包括開源的HBase、Cassandra等。本系統(tǒng)包括對(duì)應(yīng)的查詢問(wèn)題,在大數(shù)據(jù)時(shí)代,針對(duì)海量數(shù)據(jù)下的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)快速、準(zhǔn)確的查詢功能也是非常困難的,其中的難點(diǎn)就是索引的更新問(wèn)題。目前主流查詢索引技術(shù)是以Google公司的BigTable為代表的列簇式NoSQL數(shù)據(jù)庫(kù)。但針對(duì)NoSQL數(shù)據(jù)庫(kù)上的查詢優(yōu)化技術(shù)仍有很多關(guān)鍵性問(wèn)題亟待解決。
(3)數(shù)據(jù)分析:對(duì)大數(shù)據(jù)進(jìn)行挖掘分析,發(fā)現(xiàn)蘊(yùn)含的知識(shí),研究社會(huì)運(yùn)行的規(guī)律與發(fā)展趨勢(shì)是大數(shù)據(jù)的根本價(jià)值所在。在大數(shù)據(jù)時(shí)代,傳統(tǒng)的挖掘和計(jì)算方法在性能和效用上遇到了嚴(yán)重的瓶頸。因此需要對(duì)傳統(tǒng)的分析方法進(jìn)行變革。在計(jì)算模型上最著名的為Google的MapReduce,目前,Google公司針對(duì)MapReuce的離線處理模式的不足,提出了基于Web數(shù)據(jù)級(jí)別的交互式數(shù)據(jù)分析系統(tǒng)Dremel,能夠?qū)崿F(xiàn)極短時(shí)間內(nèi)的海量數(shù)據(jù)分析。在離線與實(shí)時(shí)處理模式上,已經(jīng)出現(xiàn)了二者融合的趨勢(shì)。
(4)大數(shù)據(jù)處理工具:Hadoop是目前最為流行的大數(shù)據(jù)處理平臺(tái),目前,將該平臺(tái)進(jìn)行改進(jìn),以便應(yīng)用到各種場(chǎng)景是研究的熱點(diǎn)之一。當(dāng)然,除了Hadoop,還有其他的處理工具,這里就不一一提出。
三、大數(shù)據(jù)時(shí)代高校信息化面臨的挑戰(zhàn)
高校也是數(shù)據(jù)生產(chǎn)大戶,首先中國(guó)高校規(guī)模一般都比較大,萬(wàn)人以上的大學(xué)非常多。其次,在高校里上學(xué)的學(xué)生從招生、學(xué)籍、選課、成績(jī)、飯?zhí)谩⒒顒?dòng)等等都會(huì)產(chǎn)生大量的數(shù)據(jù);教師的上課音視頻、課件、實(shí)驗(yàn)數(shù)據(jù)等也會(huì)有龐大的數(shù)據(jù);校務(wù)系統(tǒng)運(yùn)行、圖書館、微博、博客等都會(huì)產(chǎn)生很大的數(shù)據(jù);尤其重要的是科研和教學(xué)數(shù)據(jù),是高等教育的兩大核心功能的重要數(shù)據(jù)。在這個(gè)大數(shù)據(jù)的時(shí)代,只有用好這些數(shù)據(jù),才能更好地幫助教學(xué)、科研,做好招生推廣,學(xué)生管理等各個(gè)方面的工作,用好這些數(shù)據(jù),毋庸置疑將會(huì)大大提高高校的信息化水平。要用好大數(shù)據(jù),至少面臨以下幾個(gè)方面的挑戰(zhàn):
(1)大數(shù)據(jù)集成與分析:大數(shù)據(jù)多樣性的特點(diǎn)就決定了數(shù)據(jù)來(lái)源的廣泛性、復(fù)雜性,這種數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來(lái)了很大的挑戰(zhàn),必須對(duì)多種數(shù)據(jù)來(lái)源進(jìn)行抽取集成,首先進(jìn)行數(shù)據(jù)的清洗、經(jīng)過(guò)關(guān)聯(lián)和聚合,采用統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)這些數(shù)據(jù)。大數(shù)據(jù)分析無(wú)疑是整個(gè)大數(shù)據(jù)時(shí)代的核心所在,因?yàn)榇髷?shù)據(jù)的價(jià)值就產(chǎn)生于數(shù)據(jù)分析過(guò)程中。當(dāng)然,數(shù)據(jù)分析是基于集成處理后的數(shù)據(jù)作為數(shù)據(jù)分析的原始數(shù)據(jù)。數(shù)據(jù)分析一般是根據(jù)不用的應(yīng)用需求從數(shù)據(jù)中的部分或者全部進(jìn)行分析。傳統(tǒng)的分析技術(shù)如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析在大數(shù)據(jù)時(shí)代需要作出調(diào)整,主要原因是大數(shù)據(jù)時(shí)代的“大”字,具體的調(diào)整包括分析前數(shù)據(jù)的預(yù)處理、算法、評(píng)價(jià)質(zhì)量等等。
(2)大數(shù)據(jù)的存儲(chǔ):需要研究低成本、高效率的數(shù)據(jù)存儲(chǔ)方式,眾所周知,低成本一般意味著低效率,但是在數(shù)據(jù)時(shí)代,如果處理效率低下,則大數(shù)據(jù)毫無(wú)意義,因此,必須打破常規(guī),要處理好大數(shù)據(jù)的存儲(chǔ)。另外,還要做好大數(shù)據(jù)時(shí)代數(shù)據(jù)存儲(chǔ)的管理問(wèn)題,因?yàn)榇鎯?chǔ)空間巨大無(wú)疑給存儲(chǔ)硬件帶來(lái)壓力。同時(shí),非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)進(jìn)行有序、高效的存儲(chǔ)管理也是面臨的挑戰(zhàn)。
(3)大數(shù)據(jù)的融合與使用:數(shù)據(jù)不融合就發(fā)揮不出數(shù)據(jù)的大價(jià)值,大數(shù)據(jù)面臨的一個(gè)非技術(shù)性的重要問(wèn)題就是數(shù)據(jù)的融合。作為高等院校,大數(shù)據(jù)的融合應(yīng)該走在前列,必須徹底打通數(shù)據(jù)孤島,將各個(gè)業(yè)務(wù)充分整合,有效融合,只有如此,才能形成高質(zhì)量的大數(shù)據(jù),才能發(fā)揮大數(shù)據(jù)時(shí)代高等教育信息化對(duì)學(xué)校發(fā)展的具體推動(dòng)作用。
四、大數(shù)據(jù)時(shí)代高校信息化建設(shè)框架
盡管大數(shù)據(jù)的來(lái)源廣泛,需求和數(shù)據(jù)類型、結(jié)構(gòu)都不相同,但最基本的處理流程是相同的。筆者們認(rèn)為:大數(shù)據(jù)時(shí)代下的高校信息化建設(shè)工作就是做好大數(shù)據(jù)的抽取、存儲(chǔ)、分析、管理、應(yīng)用等工作,因此大數(shù)據(jù)的處理流程才是高校信息化工作的重點(diǎn)。大數(shù)據(jù)的處理平臺(tái)的總體架構(gòu)如圖2所示,整個(gè)大數(shù)據(jù)的處理流程可以定義為對(duì)廣泛異構(gòu)的數(shù)據(jù)源進(jìn)行數(shù)據(jù)抽取和數(shù)據(jù)集成,結(jié)果形成統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)進(jìn)行存儲(chǔ)。利用合適的數(shù)據(jù)分析挖掘技術(shù)對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行分析挖掘,從中得到有用的知識(shí)并用適當(dāng)?shù)姆绞綄⒔Y(jié)果展現(xiàn)給終端用戶??蚣芊譃樗膶?,分別為數(shù)據(jù)提取層、分析層、展現(xiàn)層、用戶應(yīng)用層。該平臺(tái)準(zhǔn)備應(yīng)用到我校未來(lái)大數(shù)據(jù)處理平臺(tái)上,以實(shí)現(xiàn)對(duì)我校大數(shù)據(jù)的抽取、存儲(chǔ)、分析管理。
(1)數(shù)據(jù)提取層:上文提到大數(shù)據(jù)的一個(gè)重要特點(diǎn)就是多樣性,意味著數(shù)據(jù)來(lái)源廣泛、數(shù)據(jù)類型多樣,要想處理大數(shù)據(jù),必須對(duì)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行提取和集成。為了提取高質(zhì)量的數(shù)據(jù),首先需要獲取高質(zhì)量的數(shù)據(jù),解決從多數(shù)據(jù)源中有效地獲取高質(zhì)量的數(shù)據(jù),同時(shí)建立健全多模態(tài)大數(shù)據(jù)融合計(jì)算的理論和算法,實(shí)現(xiàn)數(shù)據(jù)的精準(zhǔn)整合,在集成前做到數(shù)據(jù)錯(cuò)誤的自動(dòng)檢測(cè)與修復(fù)。從學(xué)校各個(gè)系統(tǒng),本校老師學(xué)生的博客、微博,學(xué)校的公開課程視頻等等數(shù)據(jù)中進(jìn)行數(shù)據(jù)的提取與集成,加工成我校統(tǒng)一標(biāo)準(zhǔn)的大數(shù)據(jù),統(tǒng)一存儲(chǔ),以方便下一步數(shù)據(jù)的分析。
(2)數(shù)據(jù)分析層:數(shù)據(jù)分析是大數(shù)據(jù)處理流程的重中之重,體現(xiàn)大數(shù)據(jù)價(jià)值所在。傳統(tǒng)的分析技術(shù)和算法如聚類分析、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等必須作出變革才能適應(yīng)大數(shù)據(jù)時(shí)代的需要。特別是算法和分析技術(shù)在面對(duì)海量數(shù)據(jù)方面效率不足的問(wèn)題需要重點(diǎn)解決,形成具有淺層、深層語(yǔ)義分析的引擎。
(3)數(shù)據(jù)展現(xiàn)層:就是將數(shù)據(jù)分析的結(jié)果如何恰當(dāng)?shù)恼故境鰜?lái)。最簡(jiǎn)單的比如文本展示這些初級(jí)展示技術(shù),必須引入可視化技術(shù)來(lái)展現(xiàn)大量數(shù)據(jù)分析結(jié)果,以用戶容易理解的方式進(jìn)行展示,最好采用人機(jī)交互技術(shù),實(shí)現(xiàn)很高的用戶體驗(yàn)度。
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項(xiàng)目,以最終為廣大師生提供高質(zhì)量、個(gè)性化的服務(wù)。
通過(guò)建立我校大數(shù)據(jù)處理統(tǒng)一平臺(tái),將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲(chǔ)、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時(shí)、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個(gè)性化的學(xué)習(xí)、生活等服務(wù)。
為了實(shí)現(xiàn)這一目標(biāo),應(yīng)對(duì)大數(shù)據(jù)時(shí)代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時(shí)代的各種技術(shù),切實(shí)轉(zhuǎn)變到大數(shù)據(jù)時(shí)代的思維,與學(xué)校相關(guān)計(jì)算機(jī)專家學(xué)者一道,借鑒兄弟院校和國(guó)外的成功案例,以早日實(shí)現(xiàn)這一藍(lán)圖。
五、結(jié)束語(yǔ)
2013年被稱為中國(guó)的大數(shù)據(jù)元年,未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。本文介紹了大數(shù)據(jù)的含義和特點(diǎn)、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對(duì)高校信息化中的挑戰(zhàn)進(jìn)行了梳理,同時(shí)提出來(lái)高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來(lái)看還處在起步階段,在大數(shù)據(jù)時(shí)代,將高等教育信息化做好仍有很長(zhǎng)的路要走,但只要我們一步步的努力,大數(shù)據(jù)時(shí)代的高校信息化也必將更加強(qiáng)大。
參考文獻(xiàn):
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計(jì)算機(jī)行業(yè)-大數(shù)據(jù)(Big Data)專題報(bào)告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報(bào),2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項(xiàng)目,以最終為廣大師生提供高質(zhì)量、個(gè)性化的服務(wù)。
通過(guò)建立我校大數(shù)據(jù)處理統(tǒng)一平臺(tái),將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲(chǔ)、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時(shí)、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個(gè)性化的學(xué)習(xí)、生活等服務(wù)。
為了實(shí)現(xiàn)這一目標(biāo),應(yīng)對(duì)大數(shù)據(jù)時(shí)代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時(shí)代的各種技術(shù),切實(shí)轉(zhuǎn)變到大數(shù)據(jù)時(shí)代的思維,與學(xué)校相關(guān)計(jì)算機(jī)專家學(xué)者一道,借鑒兄弟院校和國(guó)外的成功案例,以早日實(shí)現(xiàn)這一藍(lán)圖。
五、結(jié)束語(yǔ)
2013年被稱為中國(guó)的大數(shù)據(jù)元年,未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。本文介紹了大數(shù)據(jù)的含義和特點(diǎn)、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對(duì)高校信息化中的挑戰(zhàn)進(jìn)行了梳理,同時(shí)提出來(lái)高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來(lái)看還處在起步階段,在大數(shù)據(jù)時(shí)代,將高等教育信息化做好仍有很長(zhǎng)的路要走,但只要我們一步步的努力,大數(shù)據(jù)時(shí)代的高校信息化也必將更加強(qiáng)大。
參考文獻(xiàn):
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計(jì)算機(jī)行業(yè)-大數(shù)據(jù)(Big Data)專題報(bào)告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報(bào),2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項(xiàng)目,以最終為廣大師生提供高質(zhì)量、個(gè)性化的服務(wù)。
通過(guò)建立我校大數(shù)據(jù)處理統(tǒng)一平臺(tái),將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲(chǔ)、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時(shí)、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個(gè)性化的學(xué)習(xí)、生活等服務(wù)。
為了實(shí)現(xiàn)這一目標(biāo),應(yīng)對(duì)大數(shù)據(jù)時(shí)代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時(shí)代的各種技術(shù),切實(shí)轉(zhuǎn)變到大數(shù)據(jù)時(shí)代的思維,與學(xué)校相關(guān)計(jì)算機(jī)專家學(xué)者一道,借鑒兄弟院校和國(guó)外的成功案例,以早日實(shí)現(xiàn)這一藍(lán)圖。
五、結(jié)束語(yǔ)
2013年被稱為中國(guó)的大數(shù)據(jù)元年,未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。本文介紹了大數(shù)據(jù)的含義和特點(diǎn)、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對(duì)高校信息化中的挑戰(zhàn)進(jìn)行了梳理,同時(shí)提出來(lái)高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來(lái)看還處在起步階段,在大數(shù)據(jù)時(shí)代,將高等教育信息化做好仍有很長(zhǎng)的路要走,但只要我們一步步的努力,大數(shù)據(jù)時(shí)代的高校信息化也必將更加強(qiáng)大。
參考文獻(xiàn):
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計(jì)算機(jī)行業(yè)-大數(shù)據(jù)(Big Data)專題報(bào)告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報(bào),2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)