• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      從數(shù)據(jù)到?jīng)Q策的大數(shù)據(jù)時代*

      2014-09-06 01:23:40陳文偉
      關(guān)鍵詞:數(shù)據(jù)挖掘決策信息

      陳文偉,陳 晟

      (1.海軍兵種指揮學院三系,廣東 廣州 510431;2.軟通動力信息技術(shù)(集團)有限公司,北京 100193)

      從數(shù)據(jù)到?jīng)Q策的大數(shù)據(jù)時代*

      陳文偉1,陳 晟2

      (1.海軍兵種指揮學院三系,廣東 廣州 510431;2.軟通動力信息技術(shù)(集團)有限公司,北京 100193)

      根據(jù)大數(shù)據(jù)時代的特點和帶來的變化,明確了大數(shù)據(jù)時代的核心是從數(shù)據(jù)到?jīng)Q策.對大數(shù)據(jù)時代興起的即時決策,從大企業(yè)到個人進行全面的分析說明.在數(shù)據(jù)輔助決策方面,討論了利用統(tǒng)計方法的輔助決策、從數(shù)據(jù)中歸納出數(shù)學模型、從數(shù)據(jù)中獲取知識等有效方法.大數(shù)據(jù)與云計算的結(jié)合,將會達到相互促進和共同發(fā)展.大數(shù)據(jù)不僅支持大企業(yè)和政府的決策,也支持個人的決策.

      大數(shù)據(jù)時代;即時決策;統(tǒng)計方法;數(shù)學模型;知識;云計算;決策

      1 大數(shù)據(jù)時代的簡介

      2012年,“大數(shù)據(jù)”(Big Data)[1]一詞是個熱門詞匯.《紐約時報》稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析,而非基于經(jīng)驗和直覺.聯(lián)合國在2012年發(fā)布了“大數(shù)據(jù)政務白皮書”,指出大數(shù)據(jù)對于聯(lián)合國和各國政府來說是一個歷史性的機遇,人們?nèi)缃窨梢允褂脴O為豐富的數(shù)據(jù)資源,來對社會經(jīng)濟進行前所未有的實時分析,幫助政府更好地響應社會和經(jīng)濟運行.

      大數(shù)據(jù)的主要來源[1-2]:社交網(wǎng)絡數(shù)據(jù)、遙測數(shù)據(jù)、傳感器數(shù)據(jù)、監(jiān)控通信數(shù)據(jù)、全球定位系統(tǒng)(GPS)的時間數(shù)據(jù)與位置數(shù)據(jù)、網(wǎng)絡上的文本數(shù)據(jù)(電子郵件、短信、微博等).這些數(shù)據(jù)來源是信息化過程(數(shù)據(jù)設(shè)備的廣泛使用和數(shù)據(jù)多渠道大量生成)產(chǎn)生的.

      王俊(英國《自然》雜志2012年評出的對世界科學影響最大的10大年度人物之一)說:“生命本身是數(shù)字化的,基因傳代的過程是數(shù)字化的過程,弄懂基因系列,通過基因排序知道哪個基因出了問題,對癥下藥.”王俊領(lǐng)導的全球最大基因測序機構(gòu),每天產(chǎn)出的數(shù)據(jù)排名世界第一,他說醫(yī)學健康產(chǎn)業(yè)未來就是大數(shù)據(jù)產(chǎn)業(yè).

      人類有個重要發(fā)現(xiàn),2010—2012年的數(shù)據(jù)總量超過以往400年.可以概括地認為:大數(shù)據(jù) = 海量數(shù)據(jù) + 復雜類型數(shù)據(jù).

      大數(shù)據(jù)具有4個基本特征:(1)數(shù)據(jù)量巨大.到目前為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量為200 PB.(2)數(shù)據(jù)類型多樣.現(xiàn)在的數(shù)據(jù)類型有文本形式、圖片、視頻、音頻、等多類型的數(shù)據(jù),個性化數(shù)據(jù)占絕對多數(shù).(3)處理速度快,時效性要求高.從各種類型的數(shù)據(jù)中快速獲得有價值的信息.(4)價值密度低.例如,1 h的視頻,在不間斷的視頻監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅只有一兩秒.

      大數(shù)據(jù)將帶來的變化[1]:(1)從掌握局部數(shù)據(jù)變?yōu)檎莆杖繑?shù)據(jù).(2)從純凈數(shù)據(jù)變?yōu)榛祀s數(shù)據(jù),可能會發(fā)現(xiàn)生活的許多層面是隨機而不是確定的.(3)從探求因果關(guān)系到掌握事物的相關(guān)性.以前總是試圖了解事件背后的深層原因,大數(shù)據(jù)轉(zhuǎn)變?yōu)榕瀣F(xiàn)象之間的聯(lián)系.大數(shù)據(jù)主要回答是什么,而不是為什么的問題,通常有這樣的回答就足夠了.

      研究大數(shù)據(jù)的意義是不斷提高“從數(shù)據(jù)到?jīng)Q策的能力”,實現(xiàn)由數(shù)據(jù)優(yōu)勢向決策優(yōu)勢的轉(zhuǎn)化.數(shù)據(jù)是現(xiàn)實世界的記錄,它反映了現(xiàn)實世界的現(xiàn)狀.數(shù)據(jù)中包含自然界的規(guī)律,也包含人類社會的人的行為.在數(shù)據(jù)中找出這些自然規(guī)律和人的特定行為,用于決策將會取得顯著的效果.

      2 利用即時數(shù)據(jù)的決策

      國際商用機器公司(IBM)估測,“數(shù)據(jù)”值錢的地方主要在于時效.對于片刻便能定輸贏的華爾街,這一時效至關(guān)重要.華爾街的斂財高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財富”,先人一步用其預判市場走勢,而且取得了不俗的收益.利用這些數(shù)據(jù)可以做很多事,比如華爾街根據(jù)民眾情緒拋售股票;對沖基金依據(jù)購物網(wǎng)站的顧客評論,分析企業(yè)產(chǎn)品銷售狀況;銀行根據(jù)求職網(wǎng)站的崗位數(shù)量,推斷就業(yè)率;搜集并分析上市企業(yè)聲明,從中尋找破產(chǎn)的蛛絲馬跡;分析全球范圍內(nèi)流感等病疫的傳播狀況等.

      即時數(shù)據(jù)的有效決策歸納為:跟著當前潮流走;不滿足于現(xiàn)狀逆著潮流走;跟著新趨勢走;從搜索信息中做決策;存在人為制造病毒或者造謠;網(wǎng)絡豐富了個人生活和決策.

      (1)跟著潮流走.跟著潮流走的典型實例:“德溫特資本市場”公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3~4億微博賬戶的留言,進而判斷民眾情緒,再以1~50進行打分,根據(jù)打分結(jié)果,霍廷決定如何處理手中數(shù)以百萬美元計的股票.

      霍廷的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售.這一招收效顯著,當年第一季度,霍廷的公司獲得了7%的收益率.

      (2)逆著潮流走.2013年6月9日,美國國家安全局承包商的愛德華·斯諾登,披露了美國國家安全局一項代號為“棱鏡”的計劃的細節(jié).斯諾登說:“國家安全局打造了一個系統(tǒng)可截獲幾乎所有信息.有了這種能力,該機構(gòu)可自動收集絕大多數(shù)人的通信內(nèi)容.你的電子郵件、密碼、電話記錄和信用卡信息就都在我手上了.”斯諾登對《衛(wèi)報》記者說:“我不想生活在一個我的一言一行都被記錄在案的世界里.我不愿支持這種事,也不愿生活在這樣的控制下.”

      2010年陸軍情報分析員布拉德利·曼寧,向維基揭秘網(wǎng)發(fā)送了幾十萬份機密文件.他說:“我希望人們看到真相,因為如果不知情,公眾就不可能做出明智的決定.”

      斯諾登和曼寧都知道披露美國國家安全局這樣勢力強大情報機關(guān)的秘密是非常危險的,他們是逆著潮流走的典型.

      (3)跟著新觀念走.跟著新觀念走的典型實例:IBM在上一個10年拋棄了PC,成功轉(zhuǎn)向軟件和服務,而這次將遠離服務與咨詢,更多地專注于因大數(shù)據(jù)分析軟件而帶來的全新業(yè)務增長點.IBM執(zhí)行總裁羅睿蘭認為:“數(shù)據(jù)將成為一切行業(yè)當中決定勝負的根本因素,最終數(shù)據(jù)將成為人類至關(guān)重要的自然資源.”

      在個人決定前途時的選擇,跟著新觀念走的實例:海事大學信息科學技術(shù)學院某副院長說,他在完成學業(yè)以后,看見《計算機世界報》(1997年)首次向國內(nèi)介紹“數(shù)據(jù)挖掘”新技術(shù)后,決定今后就選擇“數(shù)據(jù)挖掘”作為方向,從而形成了他的人生新軌跡.

      (4)互聯(lián)網(wǎng)絡上搜索信息.信息不對稱現(xiàn)象普遍存在于社會,特別在市場經(jīng)濟活動中,各類人員對有關(guān)信息的了解存在很大的差異.掌握信息多的人,有更多的機會從差距中找商機獲利.(信息不對稱理論是由喬·阿克爾洛夫等3位美國經(jīng)濟學家提出的,從而獲得2001年諾貝爾經(jīng)濟學獎.)

      解決信息不對稱現(xiàn)象,需要利用互聯(lián)網(wǎng)絡進行搜索,“知識在于搜索”是當今獲取知識的新趨勢,它是“知識在于學習”和“知識在于積累”的補充.這也造就了Google(谷歌)、百度等搜索公司的輝煌成就.例如,在識別流感疫情時,谷歌比疾病控制和預防中心更有效掌握疫情,因為谷歌利用監(jiān)測無數(shù)個搜索詞(比如“最好的咳嗽藥”)并加入詳細地址的追蹤,所以有效掌握疫情區(qū)域.

      搜索當前信息后做決策,已經(jīng)成為即時決策的新趨勢.

      (5)開源軟件激發(fā)了人的創(chuàng)新熱情.開源軟件是在開源網(wǎng)站上交流,相互之間激發(fā)出的創(chuàng)新熱情.有的人通過軟件開發(fā)鍛煉自己,有的人想打破壟斷,也有的人想展示自己的才能.各自充分發(fā)揮自己的智慧,在別人的研究基礎(chǔ)上,增加更有用或更有效果的功能,共同開發(fā)出免費的軟件.例如,Linux操作系統(tǒng)打破了微軟的Windows操作系統(tǒng)的壟斷,MySQL數(shù)據(jù)庫軟件使大家對數(shù)據(jù)庫的應用更方便.

      (6)制造病毒或者造謠.制造病毒數(shù)據(jù),破壞網(wǎng)絡系統(tǒng)或個人計算機.各國之間的隱形戰(zhàn)爭就是制造病毒破壞敵方的網(wǎng)絡系統(tǒng).

      制造虛假信息進行造謠,讓受騙者做愚蠢的決策,送錢或銀行帳號及密碼給騙子.例如在電話中,冒充公安機關(guān)人員,說你家人犯罪,要你交錢贖人;或者說你中獎,要你寄錢后發(fā)獎品給你等等.這些受騙者都是嚴重的信息缺乏者,也是典型的法盲.最近,武漢警方查獲號稱“中國最大的網(wǎng)絡推廣網(wǎng)站”的特大網(wǎng)絡造謠團伙,其中參與謠言傳播的“大V”的微博粉絲數(shù)量達2.2億.該公司在1年間經(jīng)營獲利多達100多萬元.

      (7)網(wǎng)絡豐富了個人生活和決策.個人上網(wǎng)可以在自己喜歡的網(wǎng)站上閱讀信息,下載音樂、電影,與友人通信、交談等.個人可以建網(wǎng)站、微博來發(fā)表自己的見解,也在制造數(shù)據(jù).個人想從事學術(shù)研究或者商業(yè)活動,都可以在網(wǎng)絡上找到自己所需要的信息,發(fā)表自己的成果和信息.個人已經(jīng)享受到了大數(shù)據(jù)時代好處,大數(shù)據(jù)時代也支持個人決策.

      大數(shù)據(jù)時代突出了即時決策.大數(shù)據(jù)時代既支持重大問題的決策,支持領(lǐng)導者的決策,也開創(chuàng)了個人決策的信息支持.

      3 利用統(tǒng)計方法的輔助決策

      分析數(shù)據(jù)離不開統(tǒng)計.在統(tǒng)計學中用總量、平均數(shù)、百分比、比率等數(shù)值,建立起對大數(shù)據(jù)的概括認識,用同類單位的比較或者用自己的歷史數(shù)據(jù)比較,來發(fā)現(xiàn)問題和找出差距,為輔助決策提供依據(jù).“統(tǒng)計與對比”已經(jīng)得到廣泛的應用.

      統(tǒng)計語言學成功地實現(xiàn)了計算機上的自然語言處理.自然語言屬于上下文有關(guān)文法,一個單詞有多個解釋,對于比較復雜的句子,用語法規(guī)則來理解遇到了困難(基于規(guī)則的自然語言處理).以前花了很大的代價一直在用語法規(guī)則進行自然語言處理,但是進展不大.

      利用統(tǒng)計語言模型有效地解決了自然語言處理:一個句子s(它由一串特定順序排列的詞w1,w2,…,wn組成)是否合理,就看它的可能性(概率P(s)).統(tǒng)計語言模型給出了計算概率P(s)的公式為

      P(s)=P(w1w2…wn)=P(w1)·P(w2︱w1)·P(w3︱w2)·…·P(wn︱wn-1).

      (1)

      (1)式中反映了單詞的上下文關(guān)系,如w2與w1,w3之間的條件概率,因此用這種方法有效地判斷了句子s的合理性.

      統(tǒng)計學還有很多方法用于數(shù)據(jù)分析迏到輔助決策效果[3].如回歸分析是研究一個變量與其他多個變量之間的關(guān)系,建立回歸方程;假設(shè)檢驗是根據(jù)樣本對關(guān)于總體所提出的假設(shè)做出是接受還是拒絕該假設(shè)的判斷;聚類分析是將樣品或變量進行聚類的方法;主成份分析是將多個變量化為少數(shù)的幾個綜合變量等等.

      統(tǒng)計數(shù)據(jù)以及指標的對比是決策的依據(jù).

      4 從數(shù)據(jù)中歸納出數(shù)學模型

      自然科學發(fā)展的最重要方法是從數(shù)據(jù)中歸納出規(guī)律,用數(shù)學模型(公式或方程)這種數(shù)量形式描述[3-4].例如,牛頓的運動三大定律、牛頓的萬有引力定律、開普勒的行星運動三大定律、麥克斯韋的電磁方程組、愛因斯坦質(zhì)能方程、納維-斯托克流體力學方程、薛定諤量子方程等等.下面具體用典型例子說明.

      (1)開普勒的行星運動三大定律的發(fā)現(xiàn)過程.

      天文學家開普勒是利用他老師第谷一生觀察的天文數(shù)據(jù),自己也用了一生來歸納總結(jié)出行星運動的三大定律.

      開普勒先從火星的觀測數(shù)據(jù)中想找出它的運動規(guī)律,試探將它用一條曲線表示出來.一開始開普勒按傳統(tǒng)觀念,認為行星做勻速圓周運動,因此他采用傳統(tǒng)的偏心圓軌道方程來試探計算.但是經(jīng)過反復推算發(fā)現(xiàn),不能算出與第谷觀測相符的結(jié)果.開普勒開始大膽設(shè)想,火星可能不是作圓周運動.經(jīng)過多年的艱苦計算,終于發(fā)現(xiàn)了火星沿橢圓軌道繞太陽運行,得到行星運動的第一定律(橢圓軌道定律).經(jīng)過了9 a的苦戰(zhàn),開普勒終于得出行星公轉(zhuǎn)周期的平方與它距太陽的距離的立方成正比的結(jié)論(p2/d3= 常數(shù)).這就是著名的開普勒行星運動第三定律.

      (2)歐拉常數(shù)和公式以及陳文偉常數(shù)和公式的發(fā)現(xiàn)[5-6].

      歐拉在研究調(diào)和級數(shù)與lnn之間,在n越大時,它們之間的差接近一個常數(shù).他在求證它們之間的差的極限后,得到如下公式和值,該數(shù)稱為歐拉常數(shù):

      陳文偉研究了調(diào)和級數(shù)公式,證明了尾項εn的級數(shù)和收斂為一個常數(shù),定義常數(shù)為μ,它的計算公式為

      (2)

      它的值為μ=0.130 330 700 753 906 311 477 07….陳文偉再利用阿貝爾求和公式,證明了自然對數(shù)的底e、圓周率π和新常數(shù)θ三者存在一個新公式

      (3)

      其中θ=1+γ+2μ=1.837 877 066 409 345 483 560 65….

      (2),(3)式均將2個著名常數(shù)e和 π緊密聯(lián)系起來,它們都是形式化的公式.

      自然界中,電和磁、質(zhì)量和能量、圓周率π和自然對數(shù)的底e,它們都是不同概念,將它們聯(lián)系起來既開闊了人們的視野,也開辟了科學的新天地.可以說,包含不同概念的簡潔公式反映了科學的本質(zhì),也體現(xiàn)了自然之美.斯坦福大學教授德福林說:“聯(lián)系、結(jié)合在一起的事物比相互分開的事物更為重要、更有價值,也更加絢麗多姿.”

      (3)2013年諾貝爾獎化學獎的“復雜化學系統(tǒng)的多尺度模型”.

      馬丁·卡普拉斯等3位科學家將量子力學和經(jīng)典力學計算相結(jié)合,用量子化學計算小區(qū)間(小分子計算量龐大)的化學反應,用經(jīng)典力學處理小區(qū)間外的環(huán)境(大分子計算簡單)的影響,彌補了經(jīng)典力學無法模擬反應過程及量子化學無法完成環(huán)境的海量計算的缺陷.

      諾貝爾經(jīng)濟學獎的獲得者中,不少是利用大量的數(shù)據(jù)建立經(jīng)濟學的數(shù)學模型,用于解釋當前世界經(jīng)濟現(xiàn)象的.

      (4)計算機上利用數(shù)據(jù)歸納出數(shù)學模型的方法是數(shù)據(jù)挖掘的公式發(fā)現(xiàn).

      典型的方法有Pat Langley研制的BACON系統(tǒng)、陳文偉研制的FDD系統(tǒng).FDD系統(tǒng)的啟發(fā)式中包含了初等函數(shù),這就使FDD系統(tǒng)發(fā)現(xiàn)的公式比BACON系統(tǒng)發(fā)現(xiàn)的更廣泛.

      5 從數(shù)據(jù)中獲取知識

      在計算機中,知識屬于定性的,一般表示為規(guī)則形式.從數(shù)據(jù)中獲取知識主要是利用數(shù)據(jù)挖掘技術(shù),典型的數(shù)據(jù)挖掘方法大的分類有[4]:屬性約簡方法、信息論挖掘方法、集合論挖掘方法、Web挖掘、流數(shù)據(jù)挖掘等.每個大類中又有很多具體的方法.下面概括說明.

      (1)屬性約簡.例如,汽車數(shù)據(jù)庫(CTR)有9個條件屬性(類型、汽缸、渦輪式、燃料、排氣量、壓縮率、功率、換檔、重量),1個決策屬性(里程).利用屬性約簡方法,可以得到等價的4個條件屬性(燃料、排氣量、壓縮率、重量),1個決策屬性(里程).數(shù)據(jù)庫約簡后成精練的數(shù)據(jù)集.

      (2)集合論挖掘方法.集合論原理是數(shù)據(jù)挖掘的重要理論基礎(chǔ),可用于分類問題、聚類問題和關(guān)聯(lián)規(guī)則挖掘.

      集合論原理用于分類問題時,主要是利用集合之間的覆蓋關(guān)系,如粗糙集方法是對條件屬性和決策(類別)屬性中的等價類(1個或多個屬性取值均相同的元組)之間的覆蓋關(guān)系;AQ11方法是對覆蓋正例排斥反例的種子(多個屬性取值的“與”關(guān)系),構(gòu)成規(guī)則知識.

      集合論原理用于聚類問題時,主要是按數(shù)據(jù)集中元組間的距離遠近或相似度大小,聚成多個類別集合.如K-均值聚類方法.

      集合論原理用于關(guān)聯(lián)規(guī)則挖掘時,計算數(shù)據(jù)項(如商品)集在整個集合中和部分集合中所占的比例,大于閾值(支持度和可信度)時構(gòu)成數(shù)據(jù)項之間關(guān)聯(lián)規(guī)則.

      (3)信息論挖掘方法.信息論方法一般用于分類問題.在已知有各實例的類別的數(shù)據(jù)中,找出確定類別的關(guān)鍵的條件屬性.求關(guān)鍵屬性是計算是各條件屬性的信息量,再從中選出信息量最大的屬性,構(gòu)造決策樹或決策規(guī)則樹.

      (4)Web挖掘.Web挖掘是從數(shù)以億計存儲大量多種多樣信息的Web頁面及其鏈接和用戶對頁面的訪問中挖掘出需要的有用知識.Web挖掘分為3類:Web內(nèi)容挖掘(網(wǎng)頁內(nèi)的信息和知識)、Web結(jié)構(gòu)挖掘(網(wǎng)頁之間的鏈接信息)和Web應用挖掘(瀏覽和使用頁面鏈接的信息).

      (5)流數(shù)據(jù)挖掘.衛(wèi)星給地球傳回大量的圖像流數(shù)據(jù);監(jiān)控攝像機能夠連續(xù)不斷(比如每秒)地產(chǎn)生圖像流;Web網(wǎng)站收到的流數(shù)據(jù)包括各種類型.例如,谷歌1 d收到幾億個搜索查詢;雅虎的各個不同網(wǎng)站上收到數(shù)10億個“點擊”.基于這些流數(shù)據(jù)可以學習到很多有趣的結(jié)果,比如“咽喉痛或咳嗽”之類的查詢頻次的上升能夠讓人們對病毒的傳播進行跟蹤.

      流數(shù)據(jù)挖掘中,一種通常的辦法是在工作存儲器上保存流數(shù)據(jù)的滑動窗口.

      6 大數(shù)據(jù)與云計算的結(jié)合

      云計算是繼個人計算機、互聯(lián)網(wǎng)之后第3次信息技術(shù)革命[7],它與大數(shù)據(jù)的結(jié)合,將會極大推動科學技術(shù)與社會的發(fā)展.

      (1)大數(shù)據(jù)與云計算是相輔相成的.

      云計算與大數(shù)據(jù)的關(guān)系相當于動與靜的關(guān)系.云計算強調(diào)的是計算,這是動的概念;而數(shù)據(jù)則是計算的對象,是靜的概念.大數(shù)據(jù)時代需要處理大數(shù)據(jù)的能力(數(shù)據(jù)獲取、清潔、轉(zhuǎn)換、統(tǒng)計等能力),這正是云計算的優(yōu)勢.大數(shù)據(jù)是寶藏,而云計算就是挖掘和利用寶藏的利器.

      (2)大數(shù)據(jù)根植于云計算.

      云計算關(guān)鍵技術(shù)中的海量數(shù)據(jù)存儲技術(shù)(用分布式方式存儲數(shù)據(jù)和冗余存儲方式保證系統(tǒng)可靠)、海量數(shù)據(jù)管理技術(shù)、分布式編程模型(MapReduce,用于并行處理大規(guī)模數(shù)據(jù)集的軟件框架),它們也都是大數(shù)據(jù)的關(guān)鍵技術(shù).云計算有它獨特的地方,即虛擬化技術(shù)和云計算平臺管理技術(shù).

      (3)大數(shù)據(jù)技術(shù)與云計算相結(jié)合.

      大數(shù)據(jù)與云計算的結(jié)合主要體現(xiàn)為:利用云計算的強大計算能力(SaaS軟件服務、IaaS基礎(chǔ)設(shè)施服務、PaaS平臺服務),可以更加迅速地處理大數(shù)據(jù)中的豐富信息,為有效的決策支持服務.

      對大數(shù)據(jù)的處理(海量數(shù)據(jù)存儲、海量數(shù)據(jù)管理和分布式并行計算),又為云計算提供了最有價值的實際應用.即大數(shù)據(jù)為云計算提供了很有價值的用武之地.

      7 結(jié)語

      大數(shù)據(jù)時代是信息時代的延伸和發(fā)展(數(shù)據(jù)和信息本質(zhì)是同一個東西,數(shù)據(jù)是信息的符號表示,信息是數(shù)據(jù)的含義).信息時代的特點是實現(xiàn)信息化、數(shù)字化,其目的就是充分利用計算機來提高各行業(yè)的管理和決策的水平.信息時代的基礎(chǔ)在于計算機.信息化過程中數(shù)字設(shè)備的進步(如傳感器、GPS和手機)以及數(shù)據(jù)的多元化(各種渠道)產(chǎn)生,極大地促進了大數(shù)據(jù)時代的來臨.大數(shù)據(jù)時代的基礎(chǔ)在于網(wǎng)絡.網(wǎng)絡數(shù)據(jù)已經(jīng)遍及各行各業(yè),也進入了家庭和個人.

      生活在大數(shù)據(jù)時代,就應該充分獲取大數(shù)據(jù)中所需要的數(shù)據(jù),利用統(tǒng)計方法,或者從數(shù)據(jù)中歸納出數(shù)學模型,或者從數(shù)據(jù)中獲取知識等手段,得到輔助決策信息.

      領(lǐng)導者需要的是粗粒度數(shù)據(jù).對于海量數(shù)據(jù)分析,只能告訴你“大概是什么”,其精髓就是“客觀”.利用計算機從海量的數(shù)據(jù)中發(fā)現(xiàn)模式,體現(xiàn)了數(shù)據(jù)中的共性和客觀性.

      個人需要的是細粒度數(shù)據(jù).在長期的知識積累的基礎(chǔ)上,并通過網(wǎng)絡上的新知識搜索,再進行橫向或者縱向的比較,輔助個人的決策.

      大數(shù)據(jù)使決策從“支持政府和企業(yè)”走向“支持個人”.大數(shù)據(jù)時代,只要能從大數(shù)據(jù)中通過不同的方法,獲得所需要的信息就能獲益.未來,數(shù)據(jù)將會像土地、石油和資本一樣,成為社會、經(jīng)濟和軍事的根本性資源.

      [1] [英]維克托·邁爾-舍恩伯格.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.

      [2] [美]弗蘭克斯.駕馭大數(shù)據(jù)[M].北京:人民郵電出版社,2013.

      [3] 陳文偉.決策支持系統(tǒng)及其開發(fā)[M].第4版.北京:清華大學出版社,2014.

      [4] 陳文偉.決策支持系統(tǒng)教程[M].第2版.北京:清華大學出版社,2010.

      [5] 陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].第2版.北京:清華大學出版社,2011.

      [6] 陳文偉.論新常數(shù)μ、θ和新公式 π=1/2eθ[J].高等數(shù)學研究,2009,4(4):2-5.

      [7] CHEN Wenwei.Two New Constantsμ,θand a New Formula π=1/2eθ[J].Octogon Mathematical Magazine,2012,20(2):472-480.

      (責任編輯 向陽潔)

      EraofBigData:FromDatatoDecision

      CHEN Wenwei1,CHEN Sheng2

      (1.Naval Arms Command Academy,Guangzhou 510430,China;2.SoftStone Information Technology (Group) Co.,Ltd.,Beijing 100193,China)

      According to the characteristics of the era of Big Data and the changes it brings,it is clear that core of Big Data era is from data to decision making.The rise of real ̄time decision ̄making in the era of Big Data,from large enterprises to individual,is comprehensively analyzed and described in the paper.In the aspect of data ̄aided decision making,this paper discusses the effective methods of using statistic methods to support decision ̄making,deriving mathematical formula from data and acquiring knowledge from data.The combination of big data and cloud computing will achieve the mutual promotion and common development.Finally,this paper puts forward that big data not only support large enterprises and government making decision,but also support the personal decisions.

      Big Data era;instant decision;statistic method;mathematic model;knowledge;cloud computing;decision

      1007-2985(2014)03-0031-06

      2013-11-12

      國家自然科學基金資助項目(61273306)

      陳文偉(1940-),男,江西人,海軍兵種指揮學院三系教授,博士生導師,主要從事決策支持系統(tǒng)、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等研究.

      TP301

      A

      10.3969/j.issn.1007-2985.2014.03.008

      猜你喜歡
      數(shù)據(jù)挖掘決策信息
      為可持續(xù)決策提供依據(jù)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      決策為什么失誤了
      訂閱信息
      中華手工(2017年2期)2017-06-06 23:00:31
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      展會信息
      中外會展(2014年4期)2014-11-27 07:46:46
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      關(guān)于抗美援朝出兵決策的幾點認識
      軍事歷史(1997年5期)1997-08-21 02:36:06
      湘贛邊秋收起義的決策經(jīng)過
      軍事歷史(1991年5期)1991-08-16 02:17:34
      两当县| 北碚区| 德阳市| 黄冈市| 囊谦县| 綦江县| 醴陵市| 澄城县| 东至县| 巴林左旗| 赣榆县| 芦山县| 保康县| 綦江县| 东阿县| 宜宾市| 哈巴河县| 赤峰市| 六安市| 怀远县| 太和县| 弋阳县| 山阳县| 三明市| 黔西县| 前郭尔| 岳普湖县| 沿河| 奉化市| 水富县| 威信县| 霍城县| 漳浦县| 永福县| 东乌珠穆沁旗| 同心县| 兴业县| 波密县| 安泽县| 凤山县| 霍林郭勒市|