1什么是大數(shù)據(jù)?
答:大數(shù)據(jù)(big data),是指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。它包括了4個(gè)特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值),簡稱大數(shù)據(jù)的4V特點(diǎn)。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。
2大數(shù)據(jù)時(shí)代是什么意思?
答:在未來,我們認(rèn)為會(huì)存在這樣一個(gè)時(shí)代:幾乎我們每一個(gè)舉動(dòng),都會(huì)被記錄,并變成數(shù)據(jù)被存儲(chǔ)起來,無數(shù)的數(shù)據(jù)就組合成了你本人的一個(gè)信息庫。通過這個(gè)信息庫,你的一言一行,你的思想都變得可預(yù)測。這就是大數(shù)據(jù)時(shí)代。
3大數(shù)據(jù)技術(shù)分為哪些階段?
答:從技術(shù)的角度由底層往上而言,大數(shù)據(jù)分為最基礎(chǔ)的數(shù)據(jù)庫處理階段、存儲(chǔ)階段、架構(gòu)設(shè)計(jì)階段、實(shí)時(shí)計(jì)算階段、數(shù)據(jù)采集階段、商業(yè)實(shí)戰(zhàn)階段。值得注意的是,不同階段對(duì)從業(yè)者有不同的技術(shù)要求,換言之大數(shù)據(jù)整個(gè)產(chǎn)業(yè)鏈需要不同技術(shù)的人才來支撐。
4什么是數(shù)據(jù)挖掘?
答:數(shù)據(jù)挖掘是大數(shù)據(jù)中重要的一個(gè)技術(shù),它是采用數(shù)學(xué)的、統(tǒng)計(jì)的、人工智能和神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的科學(xué)方法,如記憶推理、聚類分析、關(guān)聯(lián)分析、決策樹、神經(jīng)網(wǎng)絡(luò)、基因算法等技術(shù),從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對(duì)決策有潛在價(jià)值的關(guān)系、模式和趨勢,并用這些知識(shí)和規(guī)則建立用于決策支持的模型,提供預(yù)測性決策支持的方法、工具和過程。
5大數(shù)據(jù)和數(shù)據(jù)大集中有什么區(qū)別?
答:大數(shù)據(jù)實(shí)質(zhì)是數(shù)據(jù)量到了一定程度,怎么獲取、處理和分析的事情。其他問題比如數(shù)據(jù)中心怎么建設(shè)、是否采用數(shù)據(jù)大集中的形式可以說和大數(shù)據(jù)的實(shí)質(zhì)關(guān)系不大。數(shù)據(jù)大集中是一種建設(shè)模式,意思主要是不搞分級(jí)分地區(qū)的部署,而把數(shù)據(jù)中心統(tǒng)一在一處。比如銀行的中國南北兩大數(shù)據(jù)中心、稅務(wù)部門的大集中建設(shè),這樣數(shù)據(jù)庫在物理上是位于一處匯總的。
6數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)的關(guān)系是什么?
答:數(shù)據(jù)挖掘來源于統(tǒng)計(jì)分析而又不同于統(tǒng)計(jì)分析。數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計(jì)分析技術(shù),相反,數(shù)據(jù)挖掘是統(tǒng)計(jì)分析方法的擴(kuò)展和延伸。大多數(shù)的統(tǒng)計(jì)分析技術(shù)都基于完善的數(shù)學(xué)理論和高超的技巧,其預(yù)測的準(zhǔn)確程度還是令人滿意的,但對(duì)于使用者的知識(shí)要求比較高。而隨著計(jì)算機(jī)能力的不斷發(fā)展,數(shù)據(jù)挖掘可以利用相對(duì)簡單和固定程序完成同樣的功能。
7大數(shù)據(jù)的商業(yè)價(jià)值
答:大數(shù)據(jù)的很多“特質(zhì)”是要與商業(yè)結(jié)合才能體現(xiàn)的,主要有:細(xì)分顧客群體,使得營銷對(duì)象更精準(zhǔn);模擬實(shí)境,發(fā)掘新的需求和提高投入的回報(bào)率;幫助企業(yè)發(fā)掘并增強(qiáng)產(chǎn)業(yè)鏈中比較薄弱的部門;實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)空間出租;幫助從不同角度層次分析了解客戶;使數(shù)據(jù)搜索產(chǎn)業(yè)具備更全面的維度。
8大數(shù)據(jù)可以做什么?
答:首先對(duì)大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)點(diǎn)。其次,大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長的新引擎,這其中包括了對(duì)硬件設(shè)備領(lǐng)域的影響,對(duì)軟件與服務(wù)領(lǐng)域的影響。再次,大數(shù)據(jù)將使得各行各業(yè)的競爭力核心從“業(yè)務(wù)驅(qū)動(dòng)”模式轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū)動(dòng)”模式。最后,大數(shù)據(jù)還將使得很多科學(xué)研究的方法發(fā)生改變,比如社會(huì)普遍使用的抽樣調(diào)查方法會(huì)轉(zhuǎn)變?yōu)閷?shí)時(shí)監(jiān)測、跟蹤研究、數(shù)據(jù)挖掘分析等等。
9大數(shù)據(jù)目前的發(fā)展趨勢
答:大數(shù)據(jù)目前發(fā)展的趨勢主要可分為以下幾個(gè)方向:數(shù)據(jù)的資源化、與云計(jì)算的深度結(jié)合、科學(xué)理論的突破、數(shù)據(jù)科學(xué)和數(shù)據(jù)聯(lián)盟的成立、數(shù)據(jù)安全高度重視化數(shù)據(jù)管理逐漸成為核心競爭力、數(shù)據(jù)質(zhì)量成為商業(yè)智能成功的關(guān)鍵、數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)部角色分工逐漸細(xì)化。
10什么是數(shù)據(jù)倉庫?
答:數(shù)據(jù)倉庫,是為企業(yè)所有級(jí)別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個(gè)數(shù)據(jù)存儲(chǔ),出于分析性報(bào)告和決策支持目的而創(chuàng)建。數(shù)據(jù)倉庫是決策支持系統(tǒng)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時(shí)變性。(編輯/有慶)