• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)時(shí)代對建模仿真的挑戰(zhàn)與思考

      2013-01-12 12:05:30胡曉峰
      關(guān)鍵詞:范式建模方法

      胡曉峰

      (國防大學(xué) 信息作戰(zhàn)與指揮訓(xùn)練教研部,北京100091)

      1 引言

      近兩年來,“大數(shù)據(jù)”這個(gè)詞已經(jīng)被廣泛提及,甚至有被用濫了的嫌疑。但大數(shù)據(jù)究竟會(huì)對科學(xué)研究帶來哪些影響,還需要更深入的研究。對受到直接影響的建模仿真領(lǐng)域來說,同樣面臨這個(gè)問題。大數(shù)據(jù)給建模仿真帶來哪些困惑、挑戰(zhàn)和機(jī)遇?這就是本文討論的主要問題。

      2 大數(shù)據(jù)及其特性

      2.1 大數(shù)據(jù)的概念及影響

      什么是大數(shù)據(jù)?這個(gè)概念雖然聽起來很熟悉,但至今仍沒有一致認(rèn)可的準(zhǔn)確定義。一般用4個(gè)V來進(jìn)行說明:第一個(gè)V(Volume),即規(guī)模性,指的是體量大,一般在TB、PB乃至EB以上;第二個(gè)V(Variety),即多樣性,也就是信息的種類多,并以各種信息載體形式存在;第三個(gè)V(Velocity),即高速性,要求處理速度要在合理時(shí)間之內(nèi);第四個(gè)V(Value),即價(jià)值性,或者叫真實(shí)性(Veracity),是說大數(shù)據(jù)一般是高價(jià)值低密度,有時(shí)也指那些真實(shí)性很強(qiáng)的數(shù)據(jù),如監(jiān)控錄像等。

      維基百科從處理方法上對大數(shù)據(jù)進(jìn)行定義,即:大數(shù)據(jù)指利用常規(guī)軟件工具去捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間限度的數(shù)據(jù)集。當(dāng)然,還有專家這樣定義:大數(shù)據(jù)是在賽博空間“人、機(jī)、物”三元交互融合后產(chǎn)生出來的結(jié)果。

      我們早就知道“海量數(shù)據(jù)”等類似的詞,但為什么現(xiàn)在又提出“大數(shù)據(jù)”概念并引起如此廣泛的重視?我認(rèn)為主要是以下幾個(gè)原因:第一,信息技術(shù)的發(fā)展創(chuàng)造了數(shù)據(jù)產(chǎn)生和處理的條件。像云計(jì)算及網(wǎng)絡(luò)、存儲(chǔ)設(shè)施、數(shù)據(jù)庫等技術(shù)的發(fā)展,以及現(xiàn)在剛冒出苗頭來的像物聯(lián)網(wǎng)、RFID的使用以及視頻監(jiān)控等技術(shù)的普及應(yīng)用等,都是如此。第二,互聯(lián)網(wǎng)運(yùn)用的廣泛普及?;ヂ?lián)網(wǎng)帶來了大量數(shù)據(jù),例如社交網(wǎng)絡(luò)、博客、微信、基于位置服務(wù)、搜索服務(wù)等,已經(jīng)遍地開花。有統(tǒng)計(jì)顯示,“近兩年產(chǎn)生的數(shù)據(jù)等于2010年前人類產(chǎn)生數(shù)據(jù)的總和”,也就是每兩年數(shù)據(jù)翻一番,可見數(shù)據(jù)爆炸性的發(fā)展。第三,各類大數(shù)據(jù)應(yīng)用產(chǎn)生了很好的效果并對其提出了更高的要求。對數(shù)據(jù)的深度挖掘獲得了出人意料的效果,已遠(yuǎn)超早期數(shù)據(jù)挖掘“啤酒與尿布”等經(jīng)典案例的水平,出現(xiàn)了諸如“紙牌屋”“點(diǎn)球成金”這樣的新傳奇,并且得到各界的廣泛關(guān)注。

      各國政府對大數(shù)據(jù)十分關(guān)注。美國奧巴馬政府2012年3月發(fā)布了“大數(shù)據(jù)研究與發(fā)展倡議”,已將其作為美國未來發(fā)展的重要戰(zhàn)略,并作為國家戰(zhàn)略啟動(dòng)了“大數(shù)據(jù)發(fā)展計(jì)劃”。如果跳出技術(shù)來看國家戰(zhàn)略問題,我認(rèn)為奧巴馬政府之所以如此,就是要試圖通過“大數(shù)據(jù)發(fā)展計(jì)劃”,重現(xiàn)信息高速公路計(jì)劃給美國人帶來的互聯(lián)網(wǎng)霸權(quán)。從斯諾登事件中我們可以發(fā)現(xiàn),美國的互聯(lián)網(wǎng)霸權(quán)已經(jīng)置其他國家于非常危險(xiǎn)的境地,美國關(guān)于數(shù)據(jù)處理的能力也遠(yuǎn)遠(yuǎn)超出我們的想象,而我們可能還渾然不知。現(xiàn)在,美國人已經(jīng)把目光瞄準(zhǔn)到大數(shù)據(jù)等未來新的領(lǐng)域,就是要為創(chuàng)造未來的大數(shù)據(jù)霸權(quán)奠定基礎(chǔ)。

      經(jīng)濟(jì)界對大數(shù)據(jù)也很關(guān)心。達(dá)沃斯經(jīng)濟(jì)論壇發(fā)表了關(guān)于大數(shù)據(jù)的研究報(bào)告,成為論壇上各國首腦和企業(yè)家關(guān)注的主題,很引人注目。論壇的主題就叫“大數(shù)據(jù)、大影響:國際開發(fā)的新可能”。我國各有關(guān)部門和企業(yè)也十分重視,召開了很多會(huì)議,許多企業(yè)家也發(fā)表了一些重要的言論。

      學(xué)術(shù)界是大數(shù)據(jù)概念的提出者,更是十分關(guān)注。2008年,《自然》雜志推出大數(shù)據(jù)???,研究“PB時(shí)代的科學(xué)”,探討科研形態(tài)變化,認(rèn)為“以數(shù)據(jù)為準(zhǔn)繩的理念指導(dǎo),以及強(qiáng)大的計(jì)算能力支撐,正在驅(qū)動(dòng)一次科學(xué)研究方法論的革命”?!犊茖W(xué)》雜志2011年也推出專刊“Dealing with Data”,圍繞“數(shù)據(jù)洪流”展開討論,將大數(shù)據(jù)深度分析看成是未來的研究重點(diǎn)和突破點(diǎn)。同時(shí),各類學(xué)術(shù)機(jī)構(gòu)也紛紛組織各種研究和探討,發(fā)表了大量研究報(bào)告,召開了各種會(huì)議,并成立了許多大數(shù)據(jù)學(xué)術(shù)組織等。

      2.2 大數(shù)據(jù)的重要特征

      大數(shù)據(jù)到底是什么?值得我們這么興師動(dòng)眾嗎?主要疑問集中在以下三個(gè)方面:一是大數(shù)據(jù)與以前一些數(shù)據(jù)概念有哪些不同?它與我們早期提出的海量數(shù)據(jù)(Massive Data)、超大規(guī)模數(shù)據(jù)(Very Large Data)有何不同?是不是一個(gè)意思?如果是一個(gè)意思,之前的一些數(shù)據(jù)概念就是大數(shù)據(jù);但如果不是,又應(yīng)該是什么意思?二是大數(shù)據(jù)方法與過去的數(shù)據(jù)方法有什么差異?比如說,我們早就提出了數(shù)據(jù)挖掘的概念,以及數(shù)據(jù)分析的這套方法,但現(xiàn)在又來說大數(shù)據(jù)的數(shù)據(jù)挖掘和數(shù)據(jù)分析,它們有什么不同?三是大數(shù)據(jù)應(yīng)用與過去基于數(shù)據(jù)分析的應(yīng)用又有什么不同呢?最典型的如商業(yè)智能BI(Business Intelligence),就是用數(shù)據(jù)分析得到一些對未來的洞見?,F(xiàn)在大數(shù)據(jù)出來了,這又有什么不同?這些名詞我們都不陌生,但是何以能又掀起了一個(gè)如此值得大家關(guān)注的熱門話題?我個(gè)人認(rèn)為最根本的是,大數(shù)據(jù)帶來了全新的研究思維和方式,主要表現(xiàn)在四個(gè)革命性變化的特征上。

      (1)從局部到全體:將網(wǎng)絡(luò)化的大數(shù)據(jù)作為分析對象。不同于以往的方法,直接面向全體的數(shù)據(jù),這里“全體”主要指的是某項(xiàng)研究的所有數(shù)據(jù),或者說是網(wǎng)絡(luò)化的數(shù)據(jù)。主要表現(xiàn)在兩個(gè)方面:第一個(gè)方面,網(wǎng)絡(luò)化的數(shù)據(jù)分析,“數(shù)據(jù)大”是條件,這不是過去那種只對少量樣本數(shù)據(jù)進(jìn)行分析的數(shù)據(jù)分析,而是直接面向整體數(shù)據(jù),或者叫做所有數(shù)據(jù),甚至說是全部數(shù)據(jù)的數(shù)據(jù)分析。沒有一定規(guī)模的量,沒有這個(gè)“大”字?jǐn)?shù)據(jù)分析是不成立的。而網(wǎng)絡(luò)化則是核心,網(wǎng)絡(luò)化最重要的一點(diǎn)是,它終結(jié)了還原論的分解式分析方法,從整體關(guān)系進(jìn)行考慮。也有專家認(rèn)為,如果沒有網(wǎng)絡(luò),大數(shù)據(jù)也不能成立。第二個(gè)方面,對數(shù)據(jù)的處理完全不同于傳統(tǒng)數(shù)據(jù)庫方法。在大數(shù)據(jù)方法中,一是要將“局部的和明確的數(shù)據(jù)”轉(zhuǎn)化為“所有幾乎全部且不明確”的數(shù)據(jù)。有專家打了一個(gè)很好的比喻:我們過去的數(shù)據(jù)庫處理是在池塘里抓魚,池塘里養(yǎng)了多少鯉魚、鰱魚、草魚都是心中有數(shù)的,投放多少就會(huì)收獲多少,這就是“池塘里抓魚”,是我們原來的處理方式;而現(xiàn)在大數(shù)據(jù)方法是要在“大海里撈魚”,有“魚”與否并不知道,也就是有什么問題也不知道,需要我們想各種方法把“魚”撈出來。我覺得這個(gè)比喻非常恰當(dāng)。二是要變“脫機(jī)”處理為“聯(lián)網(wǎng)”處理。數(shù)據(jù)處理的同時(shí)數(shù)據(jù)還可能發(fā)生變化,因?yàn)樗c網(wǎng)絡(luò)的關(guān)系極為密切!通過網(wǎng)絡(luò),可以將人類的個(gè)體知識(shí)匯總為人類的整體知識(shí)。打個(gè)比喻,也許我們早就知道了治療癌癥的方法,但為什么至今仍無法治愈癌癥呢,就是因?yàn)檫@些知識(shí)分散在許多人的腦子里。而網(wǎng)絡(luò)則提供了將這些知識(shí)聯(lián)系到一起的條件。正是因?yàn)槿绱?,大?shù)據(jù)的處理規(guī)模、類型、模式、工具、對象都會(huì)有所不同。

      (2)從單純到繁雜:接受數(shù)據(jù)的繁雜和不精確。我們常用的數(shù)據(jù)庫一般要求數(shù)據(jù)是非常干凈的,不干凈還要加以清洗。而大數(shù)據(jù)則要以非結(jié)構(gòu)化、種類繁多的數(shù)據(jù)為主,因此就要拋棄對有條理和純凈數(shù)據(jù)的偏愛,容忍凌亂數(shù)據(jù)的存在。在操作上,不以“匹配性查找、增刪改管理”為數(shù)據(jù)庫應(yīng)用目標(biāo),而是更深層次的應(yīng)用?!昂A俊薄俺笠?guī)模”指的都是數(shù)據(jù)量,而沒有涉及到數(shù)據(jù)的本質(zhì)問題。另外,大數(shù)據(jù)方法的不確定性和涌現(xiàn)性特點(diǎn)比較突出。在不確定性方面,包括數(shù)據(jù)來源不確定、處理模型不確定、模型參數(shù)學(xué)習(xí)也不確定等。在涌現(xiàn)性方面,包括演化模式的涌現(xiàn)、群體行為的涌現(xiàn)、網(wǎng)絡(luò)智慧的涌現(xiàn)等。這些都可以找到大數(shù)據(jù)的不確定性和涌現(xiàn)性的影子。

      (3)從因果到關(guān)聯(lián):更強(qiáng)調(diào)相關(guān)性而非因果性。大數(shù)據(jù)最重要的思想是放棄對事情原委的追究,取而代之的是對相關(guān)性的接納,因此它更適合于回答“是什么”,而不是回答“為什么”。這就為“知其然而不知其所以然”找到了依據(jù):直接獲取答案,不去問為什么。也就是說,它可以告訴你這樣不會(huì)錯(cuò),但是為什么,不知道。之所以如此,是因?yàn)樵S多事物的因果關(guān)系是難以明確的,有的可能是找不到,而也有的可能是根本就不存在這樣的因果關(guān)系。這就完全顛覆了我們過去關(guān)于牛頓、愛因斯坦科學(xué)體系下因果關(guān)系明確的還原論思想,當(dāng)然這個(gè)問題大家還可以進(jìn)一步探討。因此,大數(shù)據(jù)方法認(rèn)為,根據(jù)海量數(shù)據(jù)的相互關(guān)系,已經(jīng)足以產(chǎn)生新的發(fā)現(xiàn)。也就是因?yàn)槿绱耍绹蜌W盟都展開了一些相關(guān)的研究,初步統(tǒng)計(jì)大概有20多個(gè)研究計(jì)劃,比如說“大腦掃描計(jì)劃”“星球皮膚計(jì)劃”“太空追蹤計(jì)劃”等,都或多或少采用了這個(gè)思想。

      (4)從簡單到深入:更強(qiáng)調(diào)深度和間接分析。將簡單分析方法發(fā)展為大數(shù)據(jù)的深度分析方法。我們過去的智能分析實(shí)際上還是強(qiáng)調(diào)以因果關(guān)系為主的簡單分析,主要針對已有數(shù)據(jù)的分析,如商業(yè)智能BI的因果分析。但是大數(shù)據(jù)具有了自己明顯的特色,更關(guān)注深度、間接、外推分析等。有許多數(shù)據(jù)分析結(jié)果的質(zhì)量依賴于數(shù)據(jù)量的多少,比如說蘋果公司手機(jī)的SIRI語音識(shí)別,就是根據(jù)大量聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分析的,而不是過去那種少量樣本的訓(xùn)練。還有的分析屬于外延分析,也就是分析的結(jié)果并不是分析的初衷,而是通過這個(gè)結(jié)果得到另外的結(jié)論,比如說基于搜索詞的流感趨勢分析,就是典型的范例,分析的是搜索詞,但結(jié)果卻是流行病的預(yù)警。還有就是按需分析,有意地產(chǎn)生所需數(shù)據(jù),再進(jìn)行分析,比如說“數(shù)據(jù)客”。

      這些革命性的特征變化,在很多有關(guān)大數(shù)據(jù)的會(huì)議上都在反復(fù)探討,大家都有自己的看法。本文重點(diǎn)研究它對建模仿真帶來的影響,以及它會(huì)帶來哪些挑戰(zhàn)和機(jī)遇。

      3 大數(shù)據(jù)帶來的挑戰(zhàn)和機(jī)遇

      3.1 以大數(shù)據(jù)為基礎(chǔ)的第四范式是否存在

      科學(xué)研究的范式(Paradigm)是托馬斯·庫恩在1959年《科學(xué)革命的結(jié)構(gòu)》一書中首先提出的概念。所謂范式,是指那些在一段時(shí)間內(nèi)為科學(xué)家集團(tuán)或者稱為“科學(xué)家研究共同體”,所共同接受的科學(xué)信念,是用于指導(dǎo)現(xiàn)實(shí)科學(xué)研究的一組假說、理論、準(zhǔn)則和方法的總和。也就是我們大家都公認(rèn)的一些科學(xué)研究方法。一旦范式無法指導(dǎo)新的研究就會(huì)發(fā)生危機(jī),產(chǎn)生出新的科學(xué)成就,這就叫科學(xué)革命,而科學(xué)革命的結(jié)果就是一種新范式的誕生,這個(gè)過程就叫“范式轉(zhuǎn)換”。因此,從一個(gè)范式到另一個(gè)范式不是漸進(jìn)的,只會(huì)是跳躍式的。這就是托馬斯·庫恩提出的范式的概念。

      現(xiàn)在已經(jīng)存在的科學(xué)范式,總的來說主要有以下幾種,這是大家已經(jīng)公認(rèn)的:第一范式稱為“科學(xué)實(shí)驗(yàn)”,主要是通過實(shí)驗(yàn)的方法觀測、記錄、歸納和驗(yàn)證來得到科學(xué)發(fā)現(xiàn)。比如說伽利略的斜塔落球?qū)嶒?yàn),以及天文觀測實(shí)驗(yàn)等,都屬于這類。第二范式是理論推導(dǎo),也就是通過邏輯推導(dǎo)、數(shù)學(xué)證明得到發(fā)現(xiàn)。愛因斯坦的相對論是典型代表。第三范式是科學(xué)計(jì)算,其中最重要的是建模仿真,所以也有人將其簡單地稱為建模仿真范式。中國系統(tǒng)仿真學(xué)會(huì)專門組織過學(xué)術(shù)沙龍討論建模仿真是不是第三范式這個(gè)問題。通過科學(xué)計(jì)算、建模仿真的方法來得到科學(xué)發(fā)現(xiàn),雖然有不同看法,但大多數(shù)人還是認(rèn)可科學(xué)計(jì)算及建模仿真是第三范式的。

      那么,第四范式是什么呢?是不是大數(shù)據(jù)范式呢?第四范式是微軟公司的吉姆·格雷提出來的。他說,數(shù)據(jù)探索性的研究方式,也就是基于數(shù)據(jù)密集型的科學(xué)發(fā)現(xiàn),是未來一個(gè)非常重要的趨勢。這些科學(xué)研究從以數(shù)學(xué)模型計(jì)算為中心的方式,將要轉(zhuǎn)為以對海量數(shù)據(jù)處理為中心的方式。在數(shù)據(jù)達(dá)到一定規(guī)模之后,科學(xué)研究的模式就會(huì)發(fā)生根本的轉(zhuǎn)變,“量變”轉(zhuǎn)換為“質(zhì)變”,這就是一種新的范式的誕生。因此,大數(shù)據(jù)可以獨(dú)立于基于數(shù)學(xué)模型的科研形式,單獨(dú)成為一種新的科研范式。針對他提出的這個(gè)觀點(diǎn),現(xiàn)在已經(jīng)有了很多的爭論。

      第一種觀點(diǎn)認(rèn)為第四范式成立。只要數(shù)據(jù)量足夠大,只靠數(shù)據(jù)可以完成科學(xué)發(fā)現(xiàn),因此不再需要數(shù)學(xué)模型。傳統(tǒng)觀點(diǎn)認(rèn)為,數(shù)據(jù)只是模型仿真運(yùn)行實(shí)驗(yàn)的基礎(chǔ),打比喻說,模型是“引擎”,而數(shù)據(jù)是“汽油”。而現(xiàn)在數(shù)據(jù)可以成為發(fā)現(xiàn)的主體,通過儀器采集、網(wǎng)絡(luò)收集、仿真系統(tǒng)生成等方法獲取數(shù)據(jù)之后,數(shù)據(jù)就可以脫離模型成為科學(xué)發(fā)現(xiàn)的主體了。這就是所謂的“數(shù)據(jù)優(yōu)先”模式。

      《連線》主編克里斯·安德森曾有一個(gè)驚人的斷言:“數(shù)據(jù)的洪流使傳統(tǒng)科學(xué)方法變得過時(shí)”,“相互關(guān)系已經(jīng)足夠,沒有了具有一致性的模型、統(tǒng)一的理論和任何機(jī)械式的說明,科學(xué)也可以進(jìn)步”。我體會(huì)他的意思,也就是說,建模方法對于科學(xué)而言,并不是必須的。其實(shí),模型的形式是很多樣的,一個(gè)沙盤可以是模型,一個(gè)公式也是一個(gè)模型,各種各樣的科學(xué)方法都是建立在各種不同種類模型基礎(chǔ)上的。但是他認(rèn)為未來模型可以不要了,大數(shù)據(jù)方法就是一種新的科研范式,特別是搜索方法可以發(fā)展成為一種科學(xué)研究的方式。正如我們每次開展研究前都喜歡“Google一下”,或者“百度一下”,查查看看有什么東西可以參考??梢娺@種方法已經(jīng)成為了科學(xué)研究一種常見的手段。

      因此有人認(rèn)為,在這種情況下,科學(xué)研究將會(huì)產(chǎn)生三個(gè)重大的變化:第一,將一般科研活動(dòng)中“精心設(shè)計(jì)并提出問題”的研究環(huán)節(jié),變?yōu)殛P(guān)鍵詞的選擇,因而就不再需要假設(shè),也不需要理論的指導(dǎo);第二,擺脫實(shí)驗(yàn)的束縛,在海量觀測數(shù)據(jù)或現(xiàn)實(shí)鏡像世界中去尋找關(guān)聯(lián)。即使有個(gè)別模型,也不影響其整體理論的存在,也就是所謂的相關(guān)性理論;第三,不再對研究結(jié)果進(jìn)行解釋,因而出現(xiàn)了能夠預(yù)測但不解釋的科學(xué),這在以前我們會(huì)覺得匪夷所思,但現(xiàn)在卻非常正常。有人說有五種科研方法:亞里士多德提出的邏輯方法,培根提出的實(shí)驗(yàn)方法,牛頓提出的數(shù)學(xué)方法,以及費(fèi)米提出的模擬方法等,現(xiàn)在又多了一個(gè)谷歌提出的關(guān)聯(lián)方法。

      第二種觀點(diǎn)認(rèn)為第四范式不成立。認(rèn)為單獨(dú)將大數(shù)據(jù)的分析獨(dú)立出來,并不能形成獨(dú)立的科學(xué)研究模式,更不能單獨(dú)進(jìn)行科學(xué)發(fā)現(xiàn)。大數(shù)據(jù)需要獲得大量的數(shù)據(jù),這些數(shù)據(jù)要么從現(xiàn)實(shí)中采集,要么利用仿真獲得,它們都是科研過程中一個(gè)不可缺少的組成部分,不能割裂,大數(shù)據(jù)方法只是使分析方法更豐富了一些而已。任何分析都需要模型,沒有數(shù)學(xué)模型是不可能進(jìn)行分析的。即使谷歌搜索,也用到了各種搜索算法和匹配排序模型,使用數(shù)據(jù)都需要初篩,初篩就要用到模型和假設(shè)。正是由于模型和計(jì)算機(jī)的輔助,才能理解和馴服大量的數(shù)據(jù),因此,脫離開模型的數(shù)據(jù)范式,也就是第四范式是不能成立的。

      這種觀點(diǎn)認(rèn)為,要說第四范式是一種新的科研范式,是不是顯得這種范式太粗糙了?新的發(fā)現(xiàn)依靠的居然是毫無技術(shù)含量的重復(fù)性計(jì)算,而不是科學(xué)家的敏銳思想。對科學(xué)結(jié)果只預(yù)測不解釋又有什么意義呢?數(shù)據(jù)量的增加可以提高研究的質(zhì)量,但不會(huì)引起科學(xué)研究方法的本質(zhì)變化?!安唤忉尅敝荒苷f明認(rèn)識(shí)活動(dòng)還沒有完成?!按髷?shù)據(jù)”是否預(yù)示著科技“去人類化”?這會(huì)改變科學(xué)家在科研活動(dòng)中的角色,也將改變科研活動(dòng)的基本規(guī)律。我們知道,科學(xué)的神圣任務(wù)是“揭示隱藏在混沌世界中的有序結(jié)構(gòu)”,難道可以只靠網(wǎng)絡(luò)和計(jì)算機(jī)的蠻力就可以完成嗎?科學(xué)家的思考就不再重要了嗎?這就是第二種觀點(diǎn)的主要思想。

      在這里我們還要回答一個(gè)問題,就是大數(shù)據(jù)的出現(xiàn),是否動(dòng)了仿真的“奶酪”?因?yàn)槲覀冎?,以大?shù)據(jù)為基礎(chǔ)的第四范式是從第三范式(仿真建模/科學(xué)計(jì)算)中獨(dú)立出去的,因而需要回答兩個(gè)方面的問題。一方面需要回答,第四范式是否成立?它發(fā)生的實(shí)質(zhì)性變化是確實(shí)需要“范式轉(zhuǎn)換”,還是僅僅是對第三范式的一種擴(kuò)充,或者只是其一種特殊形式?在討論第三范式的時(shí)候曾經(jīng)說到,如果從一個(gè)坐標(biāo)軸來看,以現(xiàn)實(shí)觀測為主要形式的科學(xué)實(shí)驗(yàn)范式占據(jù)著一端,完全抽象的理論研究占據(jù)著坐標(biāo)軸的另一端,而建模仿真則以“虛擬現(xiàn)實(shí)”的方式,正好居于這個(gè)軸的中間,非常合適和匹配,具有某種科學(xué)上的“完美性”。但現(xiàn)在大數(shù)據(jù)來了,那它應(yīng)該擺在什么位置呢?是不是應(yīng)該成為一個(gè)菱形?另一方面,如果第四范式成立,它又應(yīng)該包括哪些內(nèi)容,它對第三范式產(chǎn)生什么影響,第三范式又會(huì)發(fā)生什么變化?因?yàn)樗c其直接發(fā)生沖突了。有人說,從推理角度看,理論推導(dǎo)可以看成是演繹推理,科學(xué)實(shí)驗(yàn)可以看成是歸納推理,而建模仿真可以看成是類比推理,大數(shù)據(jù)呢?有人說應(yīng)該是合情推理,是否真的如此?

      3.2 大數(shù)據(jù)給建模仿真帶來的挑戰(zhàn)

      大數(shù)據(jù)理論的出現(xiàn),對傳統(tǒng)建模仿真學(xué)科帶來了挑戰(zhàn),很多問題需要我們認(rèn)真地研究和討論,因?yàn)檫@些挑戰(zhàn)有可能會(huì)動(dòng)搖或變革原有仿真理論的基礎(chǔ)。谷歌研究部主任彼得·諾維格有一句名言:“所有的模型都是錯(cuò)誤的,進(jìn)一步說,沒有模型也可以成功。”怎么去理解這句話?《復(fù)雜》雜志也認(rèn)為:“量子力學(xué)和混沌摧垮了精確預(yù)測的希望,哥德爾和圖靈的結(jié)果摧垮了數(shù)學(xué)和計(jì)算無所不在的希望?!贝髷?shù)據(jù)會(huì)不會(huì)也是這樣,摧毀我們原來一些根深蒂固的觀點(diǎn)呢?它會(huì)帶來哪些挑戰(zhàn)呢?

      3.2.1 對仿真基本理論的挑戰(zhàn)

      眾所周知,仿真是基于相似性理論的,但它可否基于相關(guān)理論?我們知道,系統(tǒng)仿真是建立在相似性理論基礎(chǔ)之上的,通過對實(shí)際系統(tǒng)的建模,使兩者之間具有相似性,因而推論,如果輸入相似,則認(rèn)為輸出也應(yīng)該是相似的,從而從仿真系統(tǒng)中得到實(shí)際系統(tǒng)的結(jié)果,達(dá)成仿真的目的。用相似性中的類比方法來獲取結(jié)果,是仿真科學(xué)最基礎(chǔ)的觀點(diǎn)。

      仿真的目的就是發(fā)現(xiàn)問題和預(yù)測未來,時(shí)間軸前推就可以是預(yù)測。但在某些情況下,大數(shù)據(jù)方法可能做得更好,比如可以在預(yù)測方面做得更好。例如,已有研究證實(shí),通過分析谷歌中相關(guān)搜索詞語的統(tǒng)計(jì)結(jié)果,如“流感癥狀”等,可比國家疾控中心早一周預(yù)測流感的暴發(fā)。它依據(jù)的是相關(guān)性,通過外延效應(yīng)進(jìn)行間接預(yù)測,而且這種結(jié)果與官方結(jié)果相關(guān)性竟然高達(dá)97%,當(dāng)然這是美國人得出的結(jié)果。但如果我們真的去建立“流感預(yù)測”仿真模型,可能費(fèi)了半天的勁,還建不出來數(shù)學(xué)模型,或者建出來的模型也很粗糙,根本不能用,因?yàn)楹茈y找到兩者之間直接的因果關(guān)系。所以問題是,基于相關(guān)理論是不是可以部分取代基于相似理論的建模仿真?

      3.2.2 對建模方法的挑戰(zhàn)

      有沒有不要數(shù)學(xué)模型的仿真?某些復(fù)雜的事物未必有可行的數(shù)學(xué)模型,比如說它的復(fù)雜度非常高,計(jì)算量非常大,在可行的時(shí)間內(nèi)做不到等。但我們可以建立起認(rèn)識(shí)問題的“數(shù)據(jù)模型”,比如說谷歌關(guān)聯(lián)研究等。也就是說,大數(shù)據(jù)可以為我們提供利用“數(shù)據(jù)模型”的新途徑。

      有人舉過一個(gè)例子:知道不知道你們的第一好友是誰?在沒有數(shù)學(xué)模型的情況下,通過對網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì),我們可以知道結(jié)果。這就是,35歲以前第一好友都是自己的老婆或者是自己的老公,但是在45歲以后,老公的第一好友還是老婆,但是老婆的第一好友已經(jīng)不是老公了,而是她們的兒女。如果沒有這個(gè)數(shù)據(jù),大多數(shù)人還以為老婆的第一好友仍是自己呢,其實(shí)已經(jīng)不是了。這種方式主要是針對那些“可以描述但不能用模型數(shù)學(xué)方程解釋”的現(xiàn)象。因而“繞開理論(不再建模),直接獲取答案”就成為了一種新方法。但是能否獲得純理論性的發(fā)現(xiàn),還有待進(jìn)一步的發(fā)展。那么,這就是又一個(gè)問題:基于數(shù)據(jù)模型的仿真是不是存在?

      我們知道,只要是模型,就都是有所簡化的,都只是針對問題某一側(cè)面的描述,沒有一個(gè)模型能夠把事物百分之百都模擬出來。正如建模理論的先驅(qū)、物理學(xué)家費(fèi)利浦·安德森在諾貝爾獲獎(jiǎng)儀式上說:“建模的藝術(shù)就是去除與問題無關(guān)的部分,建模者和使用者都面臨一定的風(fēng)險(xiǎn)。建模者可能遺漏至關(guān)重要的因素,使用者則有可能無視模型只是概略性的,意在揭示某種可能,而太過生硬的理解和使用實(shí)驗(yàn)及計(jì)算的具體結(jié)果樣本?!本褪钦f,模型的使用者和模型的建造者在理解上可能是不一樣的。對于一些復(fù)雜的事物,由于很多規(guī)律無法了解,即使建立起某種模型,也很難真正起到作用。比如說火災(zāi)模型、經(jīng)濟(jì)模型、人群模型等,都屬于這一類。可能某一次會(huì)蒙中結(jié)果,但是更多的時(shí)候還是做不到的,出來的結(jié)果跟實(shí)際不一樣,甚至完全相反。比如經(jīng)濟(jì)模型,很多人總是問經(jīng)濟(jì)學(xué)家,為什么你們總是預(yù)測不出經(jīng)濟(jì)危機(jī)?經(jīng)濟(jì)學(xué)家總是無言以對,或者說模型還有問題。但能不能建立起這種復(fù)雜的模型,其實(shí)還是成問題的。是不是有些規(guī)律根本就無法用數(shù)學(xué)模型描述?或者至少現(xiàn)在我們的知識(shí)水平還無法描述這些模型?這就引出了一個(gè)新的問題,是否會(huì)出現(xiàn)一些新類型的模型?

      大數(shù)據(jù)的出現(xiàn)產(chǎn)生了一些新類型的模型。舉兩個(gè)例子:第一個(gè)例子是鏡像模型,也就是對現(xiàn)實(shí)的縮微模型。大數(shù)據(jù)可以利用真實(shí)世界的鏡像作為模型研究,這個(gè)鏡像指的是可以反映現(xiàn)實(shí)社會(huì)某個(gè)側(cè)面的東西,比如說網(wǎng)絡(luò)。采用現(xiàn)實(shí)世界中的某個(gè)代表性鏡像模型,例如微博空間,就可以充當(dāng)比較完美的現(xiàn)實(shí)縮微模型,來研究巨量的社會(huì)人群行為。也就是說,用小社會(huì)代替大社會(huì),去了解社會(huì)的情感變化、輿論演化、信息傳播等東西。更直白一點(diǎn),過去的仿真是“以假代真”,現(xiàn)在則是以“小真”代“大真”。這是否也能夠算作一個(gè)模型?過去對一些復(fù)雜事物,我們講試點(diǎn)、蹲點(diǎn)、調(diào)研,其實(shí)也就是這樣的方式,現(xiàn)在我們可以利用網(wǎng)絡(luò)來研究,是否就是以“小真”代“大真”的模型研究?

      利用鏡像模型,可以完成“真實(shí)版”的仿真。比如有報(bào)道說,對推特、臉譜上的人群情緒分析,可以提前25分鐘預(yù)測股市漲跌。這件事情的現(xiàn)在,可能是另外一個(gè)事件的未來,我稱之為“糾纏相關(guān)”。舉個(gè)例子:過去曾出現(xiàn)過一個(gè)假新聞,說奧巴馬遇刺了,也就是新聞烏龍,很快引起股市暴跌。之后很快又更新了新聞,說這個(gè)消息搞錯(cuò)了,之后股市又升回去了。這其實(shí)也可以看成是一個(gè)真實(shí)的仿真過程,雖然兩個(gè)事件之間從模型角度看沒有直接關(guān)系,但卻產(chǎn)生了很深的影響。假如有人利用這種方式在一個(gè)空間里面發(fā)出這個(gè)消息,它就可能會(huì)變成利用仿真結(jié)果來控制系統(tǒng)的情況,如控制股市的漲跌從而漁利,這是一個(gè)很值得關(guān)注的事情。但這種鏡像模型我們可以稱之為仿真嗎?

      第二個(gè)例子是“嵌入式”平行仿真。這種“嵌入式”模型可以兼顧“過程”與“結(jié)果”,可以一邊仿真一邊分析預(yù)測,因此也可以稱為“半現(xiàn)實(shí)”仿真。很多人對“嵌入式”仿真很重視,一直在做研究,很多設(shè)備直接“嵌入”系統(tǒng)中,通過仿真快速得出未來的預(yù)測結(jié)果。在大數(shù)據(jù)情況下,我們可以將這個(gè)方法引入到網(wǎng)絡(luò)之中,利用網(wǎng)絡(luò)產(chǎn)生的大數(shù)據(jù),根據(jù)“過去和未來”的全面情況深入分析,超前預(yù)測和及時(shí)處置。過去是現(xiàn)實(shí)的真實(shí)數(shù)據(jù),而未來是仿真出來的結(jié)果。這種方式是嵌入平行仿真的范疇,就是又有真實(shí)的,又有虛擬的,將兩者兼顧起來。同樣問題是,這種基于大數(shù)據(jù)處理的“半現(xiàn)實(shí)”平行嵌入模型是仿真嗎?

      3.2.3 對仿真方法的挑戰(zhàn)

      是否可以用搜索和仿真代替仿真實(shí)驗(yàn)?“仿真是基于模型的實(shí)驗(yàn)”,而實(shí)驗(yàn)的目的是為了發(fā)現(xiàn)事物的規(guī)律,從而達(dá)到認(rèn)識(shí)世界的目的。既然大數(shù)據(jù)不需要模型也可以得到結(jié)果,那么仿真是否可以利用搜索或統(tǒng)計(jì)來完成?

      由于一些事物太過復(fù)雜,很多數(shù)據(jù)我們已經(jīng)有了,但卻沒有辦法找到所要的東西。大數(shù)據(jù)則為解決這個(gè)問題提供了新的方法。例如,我們從收集到大量宇宙觀測數(shù)據(jù)中尋找“大爆炸”或其他天文規(guī)律的證據(jù),這比建立多少個(gè)宇宙模型都更直截了當(dāng),直奔主題。你不需要建模,直接搜索就可以,且很多科學(xué)一線研究都這么做。很顯然,這種方式屬于實(shí)驗(yàn)科學(xué)觀測數(shù)據(jù)的分析。還有一些數(shù)據(jù)來自于科學(xué)計(jì)算,計(jì)算工作早已做完了,收集了大量的數(shù)據(jù),剩下的只是對數(shù)據(jù)的搜索和選擇。

      再看下面的例子。斯諾登曝光的“棱鏡計(jì)劃”中,可以看到用搜索和統(tǒng)計(jì)分析就可以解決很多模型無法解決的問題。它是從大量元數(shù)據(jù)中尋找可能的聯(lián)系人,預(yù)測“恐怖分子”的位置。再舉一個(gè)例子,美國一個(gè)大學(xué)的學(xué)生課外作業(yè),就是研究本·拉登到底藏在哪里了。他們做了一個(gè)模型,然后在網(wǎng)上搜集數(shù)據(jù),預(yù)測本·拉登躲藏的位置。最后抓到本·拉登的地方跟學(xué)生預(yù)測的距離,只相差100多英里,他們用的方法叫做生物地理信息學(xué)。這個(gè)模型并不是真正的模型,而是建立在數(shù)據(jù)分析基礎(chǔ)上的模型,是通過對現(xiàn)實(shí)數(shù)據(jù)搜索來完成的。這種實(shí)驗(yàn)結(jié)果越來越趨近于真實(shí)。所以,這種以搜索統(tǒng)計(jì)分析為基礎(chǔ)的方式,是否也是一種仿真實(shí)驗(yàn)?zāi)?

      3.2.4 對仿真平臺(tái)的挑戰(zhàn)

      現(xiàn)有的仿真平臺(tái)能否滿足大數(shù)據(jù)的要求?利用大數(shù)據(jù)為建模仿真服務(wù),首先需要解決平臺(tái)問題。但我們具有搜集所有大數(shù)據(jù)的能力嗎?像美國人搞的“星球皮膚計(jì)劃”,需要在全世界設(shè)立大量的傳感器。斯諾登曝光的“棱鏡計(jì)劃”,美國國家安全局花費(fèi)巨資建立了一系列基礎(chǔ)性的設(shè)施,光是存儲(chǔ)設(shè)備就不得了。它不僅要有條件拿到數(shù)據(jù),而且還要不與法律沖突。美國人有這個(gè)條件,很多公司都是他們的,但也有一定的隱私、安全等方面的限制。但我們就做不到,這些公司不會(huì)聽我們的。這些都需要一些基礎(chǔ)設(shè)施和條件的,比如我們具備處理和存儲(chǔ)PB、EB以上乃至更大數(shù)據(jù)的能力嗎?能夠運(yùn)行鏡像模型(例如全因特網(wǎng)絡(luò)的鏡像)嗎?如果能運(yùn)行,需要多少計(jì)算機(jī)、能源夠不夠都是問題。谷歌公司的服務(wù)器都需要為它專門建個(gè)電站來供電。我們有能夠深度分析和挖掘的軟件及方法嗎?這些都是平臺(tái)的新問題。

      3.3 大數(shù)據(jù)給建模仿真帶來的機(jī)遇

      大數(shù)據(jù)應(yīng)該說是一個(gè)時(shí)代,也就是以數(shù)據(jù)優(yōu)先、數(shù)據(jù)為王的“大數(shù)據(jù)時(shí)代”。這個(gè)時(shí)代將會(huì)給許多事情帶來很大的變化和機(jī)遇,對建模仿真也不例外。有人說大數(shù)據(jù)時(shí)代正是信息社會(huì)從“量變”走向“質(zhì)變”的表征,或者說,信息化社會(huì)在大數(shù)據(jù)時(shí)代才算真正到來。從另一方面說,建模仿真也許在這個(gè)門檻上會(huì)發(fā)生根本性的變化,可能會(huì)重構(gòu)仿真科學(xué)的體系,增強(qiáng)仿真科學(xué)的活力。那么大數(shù)據(jù)時(shí)代會(huì)給建模仿真帶來哪些機(jī)遇呢?

      3.3.1 為仿真結(jié)果分析提供更好的手段

      傳統(tǒng)的仿真結(jié)果分析大多數(shù)比較直接和簡單,只是簡單的結(jié)果數(shù)據(jù)分析和簡單的解釋。而大數(shù)據(jù)可以提供更深入的分析和預(yù)先處理手段。比如說,在科學(xué)實(shí)驗(yàn)領(lǐng)域,對粒子碰撞產(chǎn)生的物理數(shù)據(jù)生成與分析現(xiàn)在取得重要進(jìn)展,尋找到希格斯玻色粒子,在只有“1萬億分之一”的概率下取得結(jié)果,其中關(guān)鍵的技術(shù)就是大數(shù)據(jù)分析。

      還有一些以前用到的仿真科學(xué)方法,和大數(shù)據(jù)方法的思路是一致的,如數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)耕耘方法等,它們既需要隨時(shí)產(chǎn)生新的數(shù)據(jù),也需要對仿真數(shù)據(jù)進(jìn)行篩選,這兩者是一個(gè)不斷迭代的過程。比如說,數(shù)據(jù)耕耘方法就是把仿真和數(shù)據(jù)分析兩者套在一個(gè)環(huán)里的一個(gè)大循環(huán)過程。大數(shù)據(jù)的出現(xiàn),可以為解決這種大規(guī)模的仿真數(shù)據(jù)處理提供新的思路。

      3.3.2 為復(fù)雜系統(tǒng)建模仿真提供新出路

      復(fù)雜系統(tǒng)建模仿真問題是一個(gè)非常困難的問題。大數(shù)據(jù)方法的出現(xiàn),是不是為解決復(fù)雜系統(tǒng)仿真問題開辟了新的出路?

      復(fù)雜系統(tǒng)仿真主要難在以下幾個(gè)方面:一是復(fù)雜系統(tǒng)的非線性性質(zhì)與不確定結(jié)果帶來的挑戰(zhàn)。既然復(fù)雜性導(dǎo)致因果關(guān)系不能確定,采用相似性原理又如何建模?二是系統(tǒng)動(dòng)態(tài)結(jié)構(gòu)對系統(tǒng)適應(yīng)性建模的挑戰(zhàn)。因?yàn)閺?fù)雜系統(tǒng)的結(jié)構(gòu)總在不斷變化中,模型又如何適應(yīng)這種變化?既然模型的結(jié)構(gòu)都在變,那么在復(fù)雜系統(tǒng)中以不變應(yīng)萬變的模型就根本建不起來。三是涌現(xiàn)性仿真難以做到。目前我們常常采用基于Agent的方法來做這個(gè)事情,但這是不是合適的方法?正是因?yàn)檫@些難題沒有解決,也就使得諸如社會(huì)仿真、經(jīng)濟(jì)仿真、戰(zhàn)爭仿真等復(fù)雜系統(tǒng)仿真非常困難。

      但是大數(shù)據(jù)的出現(xiàn)為復(fù)雜系統(tǒng)的整體分析提供了條件。大數(shù)據(jù)的出現(xiàn)拋棄了對因果關(guān)系的追求,這就避開了一個(gè)最難以解決的問題,從而把重心放到了尋找相關(guān)關(guān)系上。放棄還原論的分解建模研究,代之以對“整體數(shù)據(jù)”的分析,承認(rèn)對復(fù)雜事物無法建模,直接從“現(xiàn)實(shí)”中去尋找問題答案,這可能是一條新的出路。大數(shù)據(jù)可以將分解出來的各種碎片又重新組成一個(gè)網(wǎng)絡(luò),使得我們再次回到了整體而不是僅僅只關(guān)心局部。

      但是誰來收集或產(chǎn)生這些“大數(shù)據(jù)”呢?一般來說有兩個(gè)方法:一個(gè)方法是直接利用真實(shí)的鏡像數(shù)據(jù);第二個(gè)方法則是由大型仿真系統(tǒng)來產(chǎn)生這些數(shù)據(jù)。這里有兩個(gè)案例:第一個(gè)是“活地球模擬器”項(xiàng)目,由瑞士大學(xué)的一名教授提出,并得到了二十幾個(gè)諾貝爾獎(jiǎng)獲得者的支持。該項(xiàng)目主要思想是試圖對歐洲社會(huì)進(jìn)行全面仿真和數(shù)據(jù)收集、分析,以解決復(fù)雜現(xiàn)實(shí)問題,包括經(jīng)濟(jì)問題、交通問題、人口問題等。

      第二個(gè)例子,是我們自己的例子,是利用真人參與的仿真演習(xí)來獲取聯(lián)合作戰(zhàn)過程的全面仿真數(shù)據(jù)。開始并不對數(shù)據(jù)做過多的篩選,而是將這些多維數(shù)據(jù)全面收集起來,然后再根據(jù)需要用于后續(xù)的深入研究,也取得了很好的結(jié)果。以此為基礎(chǔ),可以分析作戰(zhàn)體系結(jié)構(gòu)、層次和能力等問題,今后還可以做更多的研究分析。我們收集仿真數(shù)據(jù)不像以前那樣僅針對某個(gè)問題,而是進(jìn)行全維的獲取,獲取完了之后,再去尋找答案。這就是不預(yù)設(shè)問題的“某一側(cè)面”,這是大數(shù)據(jù)方法最基本的條件。這種方式和過去的仿真分析不同之處在于,不是有目的的局部收集,而是全維產(chǎn)生并多角度分析數(shù)據(jù),這樣更能反映出它的整體,而不是局部性。局部性可能會(huì)切掉一些你認(rèn)為無關(guān)緊要但卻可能是至關(guān)重要的東西。

      3.3.3 有助于實(shí)現(xiàn)智能仿真

      智能仿真也是復(fù)雜系統(tǒng)仿真的一種,且更具挑戰(zhàn)性,非常困難,但現(xiàn)在已經(jīng)可以看到大數(shù)據(jù)方法帶來的曙光。有人說,智能分為三個(gè)方面:自然智能、計(jì)算智能和數(shù)據(jù)智能。也就是說,數(shù)據(jù)智能已經(jīng)開始脫離計(jì)算智能而獨(dú)立存在了。目前有兩種成功的智能仿真系統(tǒng),都是IBM公司完成的,代表了兩種不同的方法。

      第一種,以IBM的“深藍(lán)”和“更深的藍(lán)”為代表。它是對人類邏輯和數(shù)學(xué)推理能力的仿真,主要靠精準(zhǔn)的數(shù)學(xué)算法,將每一步棋的可能性通過數(shù)學(xué)模型進(jìn)行深度分析和計(jì)算,并根據(jù)棋譜數(shù)據(jù)不斷學(xué)習(xí),最后找出最佳著法。最終“深藍(lán)”戰(zhàn)勝了人類棋王卡斯帕羅夫,標(biāo)志著機(jī)器在計(jì)算智能上戰(zhàn)勝了人類。

      第二種,也是IBM搞的一個(gè)叫“沃森”的問答系統(tǒng),它是對人類認(rèn)知過程的仿真?!拔稚睆拇罅繉?shí)際問題數(shù)據(jù)中學(xué)習(xí),形成知識(shí)體系,并通過對問題進(jìn)行深入的相關(guān)性分析,找到最有可能的答案。因?yàn)榇罅繑?shù)據(jù)使得找到知識(shí)關(guān)聯(lián)更為可行,而不需要建立起某種固定的因果關(guān)系模型。很顯然,“沃森”的模擬更接近人類常規(guī)的智能。這雖然不像數(shù)學(xué)那么精密,那么因果明確,但是利用相關(guān)性就可以解決那些似是而非、多重隱含的問題,從中找到正確答案?!拔稚痹谝粋€(gè)類似于中國“幸運(yùn)52”的問答節(jié)目中也戰(zhàn)勝了人類的冠軍,獲得了最高的獎(jiǎng)金。這是否可以認(rèn)為,機(jī)器在數(shù)據(jù)智能上也戰(zhàn)勝了人類呢?

      4 結(jié)束語

      大數(shù)據(jù)的出現(xiàn),確實(shí)對建模仿真帶來了很多的沖擊,但帶來了更多的思考。主要表現(xiàn)在以下三個(gè)方面:一是大數(shù)據(jù)提供了一個(gè)解釋不明現(xiàn)象的新穎視角。它是擴(kuò)充了仿真科學(xué)方法,還是獨(dú)創(chuàng)了新的科研范式?二是大數(shù)據(jù)提供了一種繞開理論直接走向應(yīng)用的新途徑。它是否真地挑戰(zhàn)了“觀察、假設(shè)、實(shí)驗(yàn)、應(yīng)用”的科研流程?是否真地找到了可以避開建模而直接獲得答案的方法?三是大數(shù)據(jù)帶來了許多值得研究的科學(xué)新問題。比如,對預(yù)測問題的思考:模型是必須的嗎?仿真可以替代嗎?“模型優(yōu)先”與“數(shù)據(jù)優(yōu)先”兩者異同或矛盾在何處?

      我們應(yīng)該很好地去研究這些問題,努力去廓清事物的真相,尋找理論和技術(shù)上的創(chuàng)新和突破。這里,特別說一下從“量變”到“質(zhì)變”的問題。很多事物是在量變中發(fā)展的,但到了一定程度,必然會(huì)發(fā)生重大的變化,這就是“質(zhì)變”。納米技術(shù)如此,賽博體系作戰(zhàn)如此,大數(shù)據(jù)技術(shù)也是如此。當(dāng)數(shù)據(jù)量達(dá)到一定程度時(shí),必然會(huì)引起重大的技術(shù)變革,這可能就是大數(shù)據(jù)為何引起如此程度重視的原因吧!

      1 李國杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):8-12.

      2 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.

      3 李伯虎,胡曉峰.復(fù)雜系統(tǒng)建模仿真中的困惑與思考[M].北京:中國科學(xué)技術(shù)出版社,2012.

      4 李伯虎,肖田元.仿真——認(rèn)識(shí)和改造世界的第三種方法嗎[M].北京:中國科學(xué)技術(shù)出版社,2007.

      5 TONY HEY.第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)[M].潘教峰,張曉林,譯.北京:科學(xué)出版社,2012.

      猜你喜歡
      范式建模方法
      以寫促讀:構(gòu)建群文閱讀教學(xué)范式
      甘肅教育(2021年10期)2021-11-02 06:14:08
      范式空白:《莫失莫忘》的否定之維
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運(yùn)動(dòng)”為例
      孫惠芬鄉(xiāng)土寫作批評的六個(gè)范式
      基于PSS/E的風(fēng)電場建模與動(dòng)態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      管窺西方“詩辯”發(fā)展史的四次范式轉(zhuǎn)換
      可能是方法不對
      用對方法才能瘦
      Coco薇(2016年2期)2016-03-22 02:42:52
      四大方法 教你不再“坐以待病”!
      Coco薇(2015年1期)2015-08-13 02:47:34
      凤冈县| 商水县| 连平县| 温州市| 罗甸县| 永和县| 佛教| 安福县| 拜城县| 潮州市| 区。| 扎赉特旗| 垦利县| 南川市| 祁连县| 迁西县| 辽阳县| 金坛市| 天台县| 枞阳县| 大丰市| 崇明县| 灌南县| 阳高县| 黄骅市| 香港| 皮山县| 赤城县| 东台市| 阿克苏市| 黄骅市| 如皋市| 黔西| 苍梧县| 化州市| 松溪县| 平凉市| 集安市| 涟水县| 枣强县| 汾西县|