陳勇
(西華大學(xué),四川 成都 610039)
大數(shù)據(jù)的發(fā)展趨勢(shì)
陳勇
(西華大學(xué),四川 成都 610039)
隨著網(wǎng)絡(luò)信息化時(shí)代的日益普遍,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)大大拓展了互聯(lián)網(wǎng)的疆界和應(yīng)用領(lǐng)域,我們正處在一個(gè)數(shù)據(jù)爆炸性增長(zhǎng)的“大數(shù)據(jù)”時(shí)代,大數(shù)據(jù)在社會(huì)經(jīng)濟(jì)、政治、文化,人們生活等方面產(chǎn)生深遠(yuǎn)的影響,大數(shù)據(jù)時(shí)代對(duì)人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn)與機(jī)遇。
大數(shù)據(jù);云計(jì)算;海量;發(fā)展;影響
大數(shù)據(jù)(Big Data)是指那些超過(guò)傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)處理能力的數(shù)據(jù)。它的數(shù)據(jù)規(guī)模和轉(zhuǎn)輸速度要求很高,或者其結(jié)構(gòu)不適合原本的數(shù)據(jù)庫(kù)系統(tǒng)。為了獲取大數(shù)據(jù)中的價(jià)值,我們必須選擇另一種方式來(lái)處理它。數(shù)據(jù)中隱藏著有價(jià)值的模式和信息,在以往需要相當(dāng)?shù)臅r(shí)間和成本才能提取這些信息。如沃爾瑪或谷歌這類領(lǐng)先企業(yè)都要付高昂的代價(jià)才能從大數(shù)據(jù)中挖掘信息。而當(dāng)今的各種資源,如硬件、云架構(gòu)和開(kāi)源軟件使得大數(shù)據(jù)的處理更為方便和廉價(jià)。即使是在車庫(kù)中創(chuàng)業(yè)的公司也可以用較低的價(jià)格租用云服務(wù)時(shí)間了。對(duì)于企業(yè)組織來(lái)講,大數(shù)據(jù)的價(jià)值體現(xiàn)在兩個(gè)方面:分析使用和二次開(kāi)發(fā)。對(duì)大數(shù)據(jù)進(jìn)行分析能揭示隱藏其中的信息。例如零售業(yè)中對(duì)門店銷售、地理和社會(huì)信息的分析能提升對(duì)客戶的理解。對(duì)大數(shù)據(jù)的二次開(kāi)發(fā)則是那些成功的網(wǎng)絡(luò)公司的長(zhǎng)項(xiàng)。例如Facebook通過(guò)結(jié)合大量用戶信息,定制出高度個(gè)性化的用戶體驗(yàn),并創(chuàng)造出一種新的廣告模式。這種通過(guò)大數(shù)據(jù)創(chuàng)造出新產(chǎn)品和服務(wù)的商業(yè)行為并非巧合,谷歌、雅虎、亞馬遜和Facebook它們都是大數(shù)據(jù)時(shí)代的創(chuàng)新者。
2.1 海量性
企業(yè)面臨著數(shù)據(jù)量的大規(guī)模增長(zhǎng)。例如,IDC最近的報(bào)告預(yù)測(cè)稱,到2020年,全球數(shù)據(jù)量將擴(kuò)大50倍。目前,大數(shù)據(jù)的規(guī)模尚是一個(gè)不斷變化的指標(biāo),單一數(shù)據(jù)集的規(guī)模范圍從幾十TB到數(shù)PB不等。簡(jiǎn)而言之,存儲(chǔ)1PB數(shù)據(jù)將需要兩萬(wàn)臺(tái)配備50GB硬盤的個(gè)人電腦。此外,各種意想不到的來(lái)源都能產(chǎn)生數(shù)據(jù)。
2.2 易變性
大數(shù)據(jù)具有多層結(jié)構(gòu),這意味著大數(shù)據(jù)會(huì)呈現(xiàn)出多變的形式和類型。相較傳統(tǒng)的業(yè)務(wù)數(shù)據(jù),大數(shù)據(jù)存在不規(guī)則和模糊不清的特性,造成很難甚至無(wú)法使用傳統(tǒng)的應(yīng)用軟件進(jìn)行分析。傳統(tǒng)業(yè)務(wù)數(shù)據(jù)隨時(shí)間演變已擁有標(biāo)準(zhǔn)的格式,能夠被標(biāo)準(zhǔn)的商務(wù)智能軟件識(shí)別。目前,企業(yè)面臨的挑戰(zhàn)是處理并從各種形式呈現(xiàn)的復(fù)雜數(shù)據(jù)中挖掘價(jià)值。
2.3 多樣性
一個(gè)普遍觀點(diǎn)認(rèn)為,人們使用互聯(lián)網(wǎng)搜索是形成數(shù)據(jù)多樣性的主要原因,這一看法部分正確。然而,數(shù)據(jù)多樣性的增加主要是由于新型多結(jié)構(gòu)數(shù)據(jù),以及包括網(wǎng)絡(luò)日志、社交媒體、互聯(lián)網(wǎng)搜索、手機(jī)通話記錄及傳感器網(wǎng)絡(luò)等數(shù)據(jù)類型造成。其中,部分傳感器安裝在火車、汽車和飛機(jī)上,每個(gè)傳感器都增加了數(shù)據(jù)的多樣性。
2.4 高速性
高速描述的是數(shù)據(jù)被創(chuàng)建和移動(dòng)的速度。在高速網(wǎng)絡(luò)時(shí)代,通過(guò)基于實(shí)現(xiàn)軟件性能優(yōu)化的高速電腦處理器和服務(wù)器,創(chuàng)建實(shí)時(shí)數(shù)據(jù)流已成為流行趨勢(shì)。企業(yè)不僅需要了解如何快速創(chuàng)建數(shù)據(jù),還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實(shí)時(shí)需求。根據(jù)IMS Research關(guān)于數(shù)據(jù)創(chuàng)建速度的調(diào)查,據(jù)預(yù)測(cè),到2020年全球?qū)碛?20億部互聯(lián)網(wǎng)連接設(shè)備。
大數(shù)據(jù),其影響除了經(jīng)濟(jì)方面的,它同時(shí)也能在政治、文化等方面產(chǎn)生深遠(yuǎn)的影響,大數(shù)據(jù)可以幫助人們開(kāi)啟循“數(shù)”管理的模式,也是我們當(dāng)下“大社會(huì)”的集中體現(xiàn),三分技術(shù),七分?jǐn)?shù)據(jù),得數(shù)據(jù)者得天下。
“大數(shù)據(jù)”的影響,增加了對(duì)信息管理專家的需求。事實(shí)上,大數(shù)據(jù)的影響并不僅僅限于信息通信產(chǎn)業(yè),而是正在“吞噬”和重構(gòu)很多傳統(tǒng)行業(yè),廣泛運(yùn)用數(shù)據(jù)分析手段管理和優(yōu)化運(yùn)營(yíng)的公司其實(shí)質(zhì)都是一個(gè)數(shù)據(jù)公司。麥當(dāng)勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數(shù)據(jù)分析基礎(chǔ)之上的精準(zhǔn)選址。而在零售業(yè)中,數(shù)據(jù)分析的技術(shù)與手段更是得到廣泛的應(yīng)用,傳統(tǒng)企業(yè)如沃爾瑪通過(guò)數(shù)據(jù)挖掘重塑并優(yōu)化供應(yīng)鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過(guò)對(duì)海量數(shù)據(jù)的掌握和分析,為用戶提供更加專業(yè)化和個(gè)性化的服務(wù)。
大數(shù)據(jù)在個(gè)人隱私的方面,大量數(shù)據(jù)經(jīng)常含有一些詳細(xì)的潛在的能夠展示有關(guān)我們的信息,逐漸引起了我們對(duì)個(gè)人隱私的擔(dān)憂。一些處理大數(shù)據(jù)公司需要認(rèn)真的對(duì)待這個(gè)問(wèn)題。
趨勢(shì)一:成為重要戰(zhàn)略資源。在未來(lái)一段時(shí)間內(nèi),大數(shù)據(jù)將成為企業(yè)、社會(huì)和國(guó)家層面重要的戰(zhàn)略資源。大數(shù)據(jù)將不斷成為各類機(jī)構(gòu),尤其是企業(yè)的重要資產(chǎn),成為提升機(jī)構(gòu)和公司競(jìng)爭(zhēng)力的有力武器。企業(yè)將更加鐘情于用戶數(shù)據(jù),充分利用客戶與其在線產(chǎn)品或服務(wù)交互產(chǎn)生的數(shù)據(jù),并從中獲取價(jià)值。此外,在市場(chǎng)影響方面,大數(shù)據(jù)也將扮演重要角色——影響著廣告、產(chǎn)品推銷和消費(fèi)者行為。
趨勢(shì)二:數(shù)據(jù)隱私標(biāo)準(zhǔn)將出臺(tái)。大數(shù)據(jù)將面臨隱私保護(hù)的重大挑戰(zhàn),現(xiàn)有的隱私保護(hù)法規(guī)和技術(shù)手段難以適應(yīng)大數(shù)據(jù)環(huán)境,個(gè)人隱私越來(lái)越難以保護(hù),有可能會(huì)出現(xiàn)有償隱私服務(wù),數(shù)據(jù)“面罩”將會(huì)流行。預(yù)計(jì)各國(guó)都將會(huì)有一系列關(guān)于數(shù)據(jù)隱私的標(biāo)準(zhǔn)和條例出臺(tái)。
趨勢(shì)三:網(wǎng)絡(luò)安全問(wèn)題凸顯。大數(shù)據(jù)的安全令人擔(dān)憂,大數(shù)據(jù)的保護(hù)越來(lái)越重要。大數(shù)據(jù)的不斷增加,對(duì)數(shù)據(jù)存儲(chǔ)的物理安全性要求會(huì)越來(lái)越高,從而對(duì)數(shù)據(jù)的多副本與容災(zāi)機(jī)制提出更高的要求。網(wǎng)絡(luò)和數(shù)字化生活使得犯罪分子更容易獲得關(guān)于人的信息,也有了更多不易被追蹤和防范的犯罪手段,可能會(huì)出現(xiàn)更高明的騙局。
趨勢(shì)四:大數(shù)據(jù)學(xué)科誕生。數(shù)據(jù)科學(xué)將作為一個(gè)與大數(shù)據(jù)相關(guān)的新興學(xué)科出現(xiàn)。同大數(shù)據(jù)的時(shí)代商業(yè)模式的創(chuàng)新分析。
[1] 李建義.數(shù)據(jù)庫(kù)原理及開(kāi)發(fā).北京:中國(guó)水利水電出版社,2005.
[2] 維克托·邁爾·舍恩伯格.大數(shù)據(jù)時(shí)代.浙江:浙江人民出版社,2012.
[3] 艾伯特-拉斯洛·巴拉巴西.爆發(fā).北京:中國(guó)人民大學(xué)出版社,2012.
[4] 大數(shù)據(jù)時(shí)代下的大數(shù)據(jù)到底有多大?中國(guó)大數(shù)據(jù),2014-03-6.
[5] 帶您了解大數(shù)據(jù).中國(guó)大數(shù)據(jù),2014-02-26.
陳勇(1994-),男,漢族,四川瀘州人,本科,西華大學(xué),軟件工程專業(yè)。
G203
A
1671-1602(2016)24-0258-01