• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)

      2023-07-20 17:36:26豐佰恒杜寶貴
      現(xiàn)代情報 2023年7期
      關鍵詞:數(shù)據(jù)治理生態(tài)系統(tǒng)模型

      豐佰恒 杜寶貴

      關鍵詞:科研大數(shù)據(jù);科研大數(shù)據(jù)迷霧;模型;生態(tài)系統(tǒng);數(shù)據(jù)治理

      DOI:10.3969/j.issn.1008-0821.2023.07.001

      [中圖分類號]G203 [文獻標識碼]A [文章編號]1008-0821(2023)07-0003-11

      科研大數(shù)據(jù)是隸屬于大數(shù)據(jù),產(chǎn)生于科研,輔助于科研,具有規(guī)模性、高速性、價值性、多樣性、高維性、錯綜性等特征,反映自然與社會現(xiàn)象的一種數(shù)據(jù)類型。在數(shù)據(jù)價比黃金的時代,科研大數(shù)據(jù)作為國家基礎性戰(zhàn)略資源引起多國(地區(qū))關注。美國以《大數(shù)據(jù)研究發(fā)展倡議》等率先拉開科研數(shù)據(jù)治理的序幕,并在《大數(shù)據(jù)研究與發(fā)展計劃》中提及醫(yī)療、航天等眾多領域的科研數(shù)據(jù)管理,英國在《把握數(shù)據(jù)帶來的機遇:英國數(shù)據(jù)能力戰(zhàn)略》中警醒數(shù)據(jù)機遇,日本在《大數(shù)據(jù)時代的人才培養(yǎng)》中倡議培養(yǎng)專業(yè)化人才,中國亦在《科學數(shù)據(jù)管理辦法》中制定科研大數(shù)據(jù)管理規(guī)范。各國(地區(qū))均聚焦于科研大數(shù)據(jù)的發(fā)展,使得數(shù)據(jù)量激增的同時,也帶來了科研大數(shù)據(jù)造假、科研大數(shù)據(jù)維度錯亂、科研大數(shù)據(jù)冗余等一系列“迷霧”問題,影響數(shù)據(jù)質(zhì)量,危害數(shù)據(jù)安全?,F(xiàn)有研究多集中在科研大數(shù)據(jù)共享、科研大數(shù)據(jù)時效、科研大數(shù)據(jù)質(zhì)量管控模型、科研大數(shù)據(jù)維度災難、科研大數(shù)據(jù)安全等方面,對科研大數(shù)據(jù)迷霧的專項探析還存在些許不足。此外,在各國(地區(qū))的科學數(shù)據(jù)交流愈加頻繁、數(shù)據(jù)維度急劇攀升的今天,科研人員的迷霧甄別能力愈發(fā)關鍵。在構(gòu)建科研大數(shù)據(jù)迷霧模型基礎上,進一步了解科研大數(shù)據(jù)迷霧的類型、路徑及機理有助于科研人員走出“迷霧叢林”,維護科研大數(shù)據(jù)生態(tài)系統(tǒng)的和諧穩(wěn)定。因此,本文以識別迷霧數(shù)據(jù)、規(guī)避科研風險為主要研究目的,以科研大數(shù)據(jù)生態(tài)系統(tǒng)中不斷演化的迷霧型科研大數(shù)據(jù)為主要研究對象,以科研大數(shù)據(jù)庫建設、科研決策、科研大數(shù)據(jù)政策制定為主要應用場景,創(chuàng)造性地建構(gòu)了科研大數(shù)據(jù)迷霧模型,以期在豐富科研大數(shù)據(jù)相關理論的同時,對解決科研大數(shù)據(jù)冗余、科研大數(shù)據(jù)造假、劣質(zhì)科研大數(shù)據(jù)傳播管控、科技政策制定等現(xiàn)實問題提供有益啟示。

      1科研大數(shù)據(jù)迷霧概念的提出

      “迷霧”的概念緣起于氣象學,后廣泛運用于其他領域。在經(jīng)濟學領域,迷霧指干擾經(jīng)濟發(fā)展方向、阻礙經(jīng)濟發(fā)展的不穩(wěn)定性因素;在政治學領域,迷霧指與本質(zhì)相悖、掩蓋目的、迷惑敵方?jīng)Q策的一種政治行為;在新聞學領域,迷霧指脫離事實真相甚至與事實相反的扭曲報道等;在情報學領域,信息迷霧是信息戰(zhàn)的重要手段,指不真實、政治相關、隱藏目的、精心設計、以進攻為目標的虛假情報。數(shù)據(jù)迷霧是指用于誘騙、隱真的虛假、有毒、垃圾數(shù)據(jù)。與“信息迷霧”相比較,“科研大數(shù)據(jù)迷霧”是“信息迷霧”的重要核心內(nèi)容;信息迷霧是數(shù)據(jù)迷霧的“外殼”,為“科研大數(shù)據(jù)迷霧”的產(chǎn)生提供了環(huán)境。信息迷霧越多,其產(chǎn)生科研大數(shù)據(jù)迷霧的可能性越大,反之,科研大數(shù)據(jù)迷霧越多,并經(jīng)加工后產(chǎn)生信息迷霧的程度越大,故二者是相輔相成、相互促進的關系?!靶畔⒚造F”與“科研大數(shù)據(jù)迷霧”兩者之間又存在區(qū)別:首先是本質(zhì)屬性不同,科研大數(shù)據(jù)作為一種特殊的數(shù)據(jù)類型,本質(zhì)上仍是具有即時高價值性的數(shù)據(jù),而信息是對數(shù)據(jù)的反映,是對數(shù)據(jù)所記錄事實的傳遞;其次是人為干預程度不同,單一數(shù)據(jù)誕生初期并不具有迷惑性,當人員將數(shù)據(jù)應用于某一目的時,多重屬性的疊加,使其具有特殊含義,迷惑性逐漸顯現(xiàn),而信息迷霧的迷惑性從信息產(chǎn)生初期便有大量的人為干預;最后是應用領域不同,信息迷霧最早出現(xiàn)于軍事領域,而科研大數(shù)據(jù)迷霧往往伴隨科研活動產(chǎn)生。由于數(shù)據(jù)包含著科研大數(shù)據(jù)這一種特殊類型,因此,數(shù)據(jù)迷霧與科研大數(shù)據(jù)迷霧緊密相關,是科研大數(shù)據(jù)迷霧的外延和上位集;換言之,科研大數(shù)據(jù)迷霧包含于數(shù)據(jù)迷霧,是數(shù)據(jù)迷霧的子集。與數(shù)據(jù)迷霧相比,科研大數(shù)據(jù)迷霧服務于技術壁壘,專指在不同科研大數(shù)據(jù)機構(gòu)數(shù)據(jù)交流過程中,導致科研大數(shù)據(jù)質(zhì)量與安全性降低,以及干擾科研人員決策的各類數(shù)據(jù),其更集中體現(xiàn)科研域尺度,是“迷霧”在科研域的“直接而具體”的表現(xiàn)形式。

      從空間角度看,“迷霧”入侵至科研大數(shù)據(jù)鏈后,以鏈帶狀在科研大數(shù)據(jù)生態(tài)系統(tǒng)中傳播,可新生、流通于科研大數(shù)據(jù)生態(tài)鏈的任意節(jié)點,由此可見其具有全鏈性;從時間角度看,其出現(xiàn)可大致劃分為濃淡兩期,隨時間而波動,在一定趨勢線上重復可預測,但迷霧數(shù)據(jù)的催生因素復雜,有時亦會出現(xiàn)突變情況,因此可認為其具有不嚴格波動性;從形態(tài)角度看,當出現(xiàn)相互引用錯誤、失效等數(shù)據(jù)時,迷惑性數(shù)據(jù)彌散形成迷霧,在科研大數(shù)據(jù)生態(tài)系統(tǒng)中久久不能消散,處于縹緲懸浮、動態(tài)演化的狀態(tài),因此其具有霧化性特征;從人員分布角度看,學者間相互的數(shù)據(jù)引用使其擴散,但學科間存在一定的壁壘,對數(shù)據(jù)的引用也存在強弱關系的差異,因此迷霧數(shù)據(jù)的出現(xiàn)往往聚焦于特定的學科,各學科或主題間存在派系的關聯(lián),可見其具有派系性特征;科研活動有著高精確度的要求,迷霧數(shù)據(jù)迷惑科研工作人員行為、加大實驗誤差、使指標失真、影響科研進程,甚至導致災難性后果,因此其具有災難性。

      綜合以上分析,本文認為科研大數(shù)據(jù)迷霧( Sci-entific Research Big Data Fog,SRBDF)是指衍生于數(shù)據(jù)迷霧,以科研域虛假、有毒、垃圾、冗余數(shù)據(jù)為基本組成,以全鏈性、不嚴格波動性、派系性、霧化性、災難性為基本特征,在利益驅(qū)動下流轉(zhuǎn)于科研大數(shù)據(jù)生命周期,降低科研大數(shù)據(jù)質(zhì)量、干擾科研決策、引發(fā)數(shù)據(jù)災難進而擾亂科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類數(shù)據(jù)的集合。2科研大數(shù)據(jù)迷霧模型的建構(gòu)

      科研大數(shù)據(jù)作為基礎性科技資源,引起諸多學者關注,并從數(shù)據(jù)共享與數(shù)據(jù)治理等不同角度構(gòu)建了科研大數(shù)據(jù)相關模型。例如聚焦于科研大數(shù)據(jù)再生、科研大數(shù)據(jù)共生、科研大數(shù)據(jù)變異的科研大數(shù)據(jù)生態(tài)模型,以生態(tài)學的視角介紹了科研大數(shù)據(jù)復雜的生命周期;基于尖點突變理論、病毒傳播理論有科研大數(shù)據(jù)治理模型,側(cè)重于對科研大數(shù)據(jù)的宏觀治理;從數(shù)據(jù)倫理、科研誠信等不同視角出發(fā)的科研大數(shù)據(jù)共享模型,則致力于促進科研大數(shù)據(jù)的共享,以及關注科研大數(shù)據(jù)服務模式、服務系統(tǒng)的科研大數(shù)據(jù)服務模型等。綜上可以看出,以往的模型較多關注科研大數(shù)據(jù)生態(tài)系統(tǒng)的宏觀治理,鮮有迷霧型科研大數(shù)據(jù)的專項研究,針對“迷霧”問題的深度探索仍略顯不足。

      科研大數(shù)據(jù)迷霧在科研大數(shù)據(jù)生態(tài)系統(tǒng)中逐漸演化生成,從“科研大數(shù)據(jù)生態(tài)系統(tǒng)”對“科研大數(shù)據(jù)迷霧”的作用角度看:在科研大數(shù)據(jù)生態(tài)失調(diào)下(即發(fā)生異常時)產(chǎn)生科研大數(shù)據(jù)迷霧,科研大數(shù)據(jù)生態(tài)系統(tǒng)是科研大數(shù)據(jù)迷霧的客觀環(huán)境,迷霧的生消都必須在系統(tǒng)內(nèi)發(fā)生??蒲写髷?shù)據(jù)量激增使數(shù)據(jù)庫得以豐富的同時,也為“科研大數(shù)據(jù)迷霧”的產(chǎn)生提供了“土壤”。從“科研大數(shù)據(jù)迷霧”對“科研大數(shù)據(jù)生態(tài)系統(tǒng)”的影響角度看:“科研大數(shù)據(jù)迷霧”作為一種獨特的風險,是科研大數(shù)據(jù)生態(tài)系統(tǒng)的高危域。迷霧濃度影響系統(tǒng)穩(wěn)定性,當迷霧濃度越大時生態(tài)系統(tǒng)越不穩(wěn)定??蒲写髷?shù)據(jù)迷霧與科研大數(shù)據(jù)生態(tài)系統(tǒng)息息相關。

      科研大數(shù)據(jù)迷霧作為干擾科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類數(shù)據(jù)的集合,本質(zhì)依然是數(shù)據(jù),仍具有數(shù)據(jù)的周期性生命特征,數(shù)據(jù)生命周期模型將數(shù)據(jù)管理劃分為生產(chǎn)、傳播、消費、分解等階段,同樣,科研大數(shù)據(jù)迷霧亦會經(jīng)歷初生、激增、消散等過程。由此可見,數(shù)據(jù)生命周期理論對科研大數(shù)據(jù)迷霧的階段劃分具有較強的適用性。

      因此,本文基于科研大數(shù)據(jù)生態(tài)系統(tǒng)理論與數(shù)據(jù)生命周期理論,將科研大數(shù)據(jù)迷霧模型劃分為初生期、激增期、衰退期,并將模型內(nèi)相關人員劃分為生產(chǎn)者、消費者、監(jiān)管者、傳遞者,以建構(gòu)科研大數(shù)據(jù)迷霧三階段模型,如圖1所示。

      1)階段一:SRBDF初生期

      此階段是科研大數(shù)據(jù)迷霧的計劃階段,迷霧生產(chǎn)者在利益驅(qū)動下生產(chǎn)迷霧數(shù)據(jù),初生期科研大數(shù)據(jù)迷霧樣本較少,“迷霧”還沒有大范圍傳播,此時的科研大數(shù)據(jù)迷霧聚集現(xiàn)象較為明顯,即在初生期科研大數(shù)據(jù)迷霧往往集中在單一學科領域,因此階段一的迷霧較弱。

      2)階段二:SRBDF激增期

      在激增期迷霧數(shù)據(jù)量急劇增加,已擴散至相關領域,影響范圍逐漸增大,因此這一時期的科研大數(shù)據(jù)迷霧多呈彌散型狀態(tài)。此時迷霧強度將會出現(xiàn)峰值且短期內(nèi)迷霧型數(shù)據(jù)會有爆發(fā)式增長的可能,對科研人員與政府來說最難控制,危害性也最大。對于迷霧生產(chǎn)者而言此階段獲益頗豐。

      3)階段三:SRBDF衰退期

      在第三階段,科研大數(shù)據(jù)監(jiān)管者嚴格監(jiān)管,科研大數(shù)據(jù)迷霧強度逐漸降低。對科研大數(shù)據(jù)消費者來說,此階段科研大數(shù)據(jù)迷霧災害性逐漸減弱。對于迷霧生產(chǎn)者而言,科研大數(shù)據(jù)迷霧的得益將會反饋,為下一步的科研大數(shù)據(jù)迷霧計劃提供參考。

      科研大數(shù)據(jù)迷霧的存在給科研大數(shù)據(jù)生態(tài)系統(tǒng)帶來極大的安全隱患,其不僅僅會影響科研結(jié)果,還會影響政府決策,導致科技政策的制定出現(xiàn)偏差,甚至影響公眾對科研結(jié)果以及科技政策的認同感。與已有模型不同的是,科研大數(shù)據(jù)迷霧模型(Scientific Research Big Data Fog Model, SRBDF-M)以迷霧型科研大數(shù)據(jù)為主要研究對象,以幫助相關人員認識迷霧、了解迷霧、走出迷霧、科學決策進而維護科研大數(shù)據(jù)生態(tài)穩(wěn)定為目的,以初生期、激增期、衰退期為主要劃分階段,專注于迷霧型數(shù)據(jù)的溯源與演化分析,側(cè)重于深入剖析科研大數(shù)據(jù)迷霧的生成、類型、作用路徑等,是科研大數(shù)據(jù)治理模型中對虛假、有毒、垃圾、冗余數(shù)據(jù)專項研究的子模型。

      3科研大數(shù)據(jù)迷霧模型的解構(gòu)

      3.1科研大數(shù)據(jù)迷霧的組成類型分析

      基于前文對SRBDF-M建構(gòu)的基礎,在時間、空間、強度、利益、繁育等維度,對科研大數(shù)據(jù)迷霧的組成類型進一步闡述分析。

      3.1.1時間維

      結(jié)合科研大數(shù)據(jù)迷霧的波動性特征,在時間維度上,可分為“初生型”“激增型”“衰退型”3種類型,如圖2所示:

      1)初生型(Primary Type)是指在初生期SRB-DF覆蓋范圍較小、影響力度較弱,此時其具有可辨、可減、可祛除的特點,科研大數(shù)據(jù)工作者可根據(jù)多年工作經(jīng)驗及積累的技術辨別SRBDF,并采用相應措施祛除迷霧,減少其危害,例如《數(shù)據(jù)管理能力成熟度評估模型》定義的8個能力域中就包含了“數(shù)據(jù)質(zhì)量”,并明確指出通過數(shù)據(jù)質(zhì)量檢查來促進數(shù)據(jù)質(zhì)量提升[38]。

      2)激增型(Surge Type)是指在SRBDF初生期并未得到有效的控制,以致后續(xù)仍有大量相關的科研活動直接引用此部分數(shù)據(jù),或是對此類數(shù)據(jù)次級引用,造成大范圍高強度的影響,此時其有范圍廣、強度高、難控制的特點,相關科研工作者除了需要投入大量的時間與精力來辨別迷霧,還需要掌握專業(yè)的技術,例如《土壤水分自動站逐小時資料質(zhì)量控制方案》為甄別疑誤數(shù)據(jù)增加內(nèi)部一致性檢驗。

      3)衰退型(Recession Type)是指SRBDF在數(shù)據(jù)質(zhì)量控制下其影響范圍與影響力度逐漸減小,呈現(xiàn)衰敗的特點,但仍具有死灰復燃的可能性,此類數(shù)據(jù)流轉(zhuǎn)至科研大數(shù)據(jù)流中易成為新一輪迷霧的催生動力。從SRBDF的“初生”到“激增”再至“衰退”體現(xiàn)了其周期性與波動性特征。

      3.1.2空間維

      結(jié)合SRBDF的派系性與全鏈性特征,在空間維上,可分為焦聚型迷霧和彌散型迷霧,如圖3所示:

      1)焦聚型( Focus Type)是指SRBDF往往聚集于某一的領域,科研人員在自己所屬學科領域進行數(shù)據(jù)引用,生成迷霧的現(xiàn)象,本屬學科間的數(shù)據(jù)引用情況遠高于跨學科引用,如圖3(a)所示。焦聚型迷霧具有集中性(數(shù)據(jù)集中、領域集中、人員集中)的特征。例如,隨生物學領域的“丁香實驗”、醫(yī)學領域的“梅斯醫(yī)學”、經(jīng)濟管理領域的“經(jīng)管之家”等交流平臺的興起,產(chǎn)生的迷霧更為聚集,這是其派系性的典型體現(xiàn)。隨時間演化焦聚型迷霧在科研大數(shù)據(jù)生態(tài)系統(tǒng)中擴散開來,逐漸轉(zhuǎn)變?yōu)榱硪环N類型。

      2)彌散型(Diffuse Type)是指SRBDF逐漸擴散影響相鄰學科,造成跨學科影響的現(xiàn)象。如圖3(b)所示,彌散性迷霧以現(xiàn)代信息技術與相關政策漏洞為滋生土壤,在多機構(gòu)、多平臺、多學科內(nèi)傳播,具有范圍廣、速度快、災害性強的特點。在當今《科協(xié)系統(tǒng)深化改革實施方案》等鼓勵跨學科合作相關文件頒布的背景下,跨學科合作迸發(fā)出前所未有的新活力,但與此同時,彌散型迷霧也廣泛分散在了科研大數(shù)據(jù)生態(tài)鏈。其縹緲難以捕獲,體現(xiàn)了SRBDF的全鏈性特性。

      3.1.3強度維

      結(jié)合SRBDF波動性特征,在強度維度其可分為強迷霧與弱迷霧,如圖4所示:

      1)弱迷霧(Infirm Fog)指“迷霧”影響范圍相對較小,迷霧濃度較低,對數(shù)據(jù)接收者的危害程度較淺的一種數(shù)據(jù)形態(tài)。對于釋放者來說,盡管其濃度及影響范圍較小,但對于錯誤數(shù)據(jù)接收者而言,弱迷霧型數(shù)據(jù)與可用科研數(shù)據(jù)更相近,因此在面對弱迷霧時更容易受其迷惑。但是因其影響范圍有限、危害程度較小,相對而言也較容易處理。

      2)強迷霧(Strong Fog)指在科研大數(shù)據(jù)生態(tài)系統(tǒng)中影響范圍大、作用時間持久、危害程度較深的一種數(shù)據(jù)形態(tài),此形態(tài)多出于濃霧期。對于釋放者來說,強“迷霧”的釋放能夠更加有效地干擾競爭對手,削減其實力。對于接收者來說,強迷霧難以防控,迷霧中處處存在風險,接收者長時間面對大量魚龍混雜的科研數(shù)據(jù),易造成學科發(fā)展停滯。

      3.1.4利益維

      結(jié)合SRBDF災難性特征,在利益維度可分為趨利型和趨害型,如圖5所示:

      1)趨利型(Profit Type)是指在科研個體(微觀)、科研機構(gòu)或企業(yè)(中觀)、國家或地區(qū)(宏觀)等競爭的驅(qū)動下,以迷惑競爭對手提高自身競爭力為目的,以故意加大實驗誤差生產(chǎn)錯誤數(shù)據(jù)為手段,對于釋放者來說,造成的最終結(jié)果是有利的一種數(shù)據(jù)形態(tài)。如圖5(a)所示,迷霧釋放者通過釋放科研大數(shù)據(jù)迷霧干擾競爭對手,提高自身競爭力。趨利型迷霧對于釋放者來說具有可見、可防、可控的特點。

      2)趨害型(Hasten to Harm Type)是指同是在競爭驅(qū)動下產(chǎn)生的,與趨利型相對的,對數(shù)據(jù)接受者來說可造成傷害的一種數(shù)據(jù)形態(tài)。如圖5(b)所示,趨害型相對于趨利型來說,只是接受主體不同,對于自身來說是趨害型的對于競爭對手來說有可能是趨利型的,但將會影響接收方自身決策分析,造成決策失誤。趨害型迷霧對數(shù)據(jù)接收者來說具有難捕捉、難評估、難控制的特點,繼而可造成災難性后果。

      3.1.5繁育維

      結(jié)合SRBDF派系性特征,在繁育維度科研大數(shù)據(jù)“迷霧”現(xiàn)象可分為雜育型和寡育型,如圖6所示:

      1)寡育型( Oligonucleotides Type)是指只在特定的領域內(nèi)出現(xiàn)的,易切斷阻隔的SRBDF類型。如圖6(a)所示,此類型具有學科單一(往往出現(xiàn)在高精尖領域亦或是冷門學科)、主體單一(在特定的科研人員范圍間傳播)、類型單一(數(shù)據(jù)類型單一,很少存在結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)混雜的情況)、數(shù)據(jù)一脈相承(科研大數(shù)據(jù)迷霧易溯源)、易控制的特點。

      2)雜育型(Mixed Type)是指多學科、多領域、多人員、多地域的各類科研數(shù)據(jù)相互引用而出現(xiàn)的SRBDF。如圖6(b)所示,跨學科、跨地域、跨時空的科研人員在方法論、知識論、價值判斷等方面存在一定的差異,導致學科交流不通暢,從而產(chǎn)生SRBDF,此類迷霧更具有縹緲、懸浮的霧化性特征,且涵蓋知識范圍較廣,因此往往較難控制,易引發(fā)數(shù)據(jù)災難。

      綜合以上分析知SRBDF組成類型多樣,在時間維可劃分為初生型、激增型、衰退型,在空間維可劃分為焦聚型、彌散型,在強度維可劃分為強迷霧、弱迷霧,在利益維可劃分為趨利型、趨害型,在繁育維可劃分為雜育型、寡育型。

      3.2科研大數(shù)據(jù)迷霧的演化路徑分析

      SRBDF在科研大數(shù)據(jù)生態(tài)系統(tǒng)中逐漸演化生成,如圖7所示,基于數(shù)據(jù)生命周期理論,以A機構(gòu)醫(yī)療科研數(shù)據(jù)造假事件為例,以時間維度為主路徑綜合考慮利益維度、空間維度、強度維度、繁育維度對SRBDF的演化路徑進行分析。

      3.2.1路徑節(jié)點一

      1)從空間維看初生期SRBDF,其多以焦聚型呈現(xiàn)。例如在A機構(gòu)注冊初期,科研數(shù)據(jù)樣本較少,“迷霧”還沒有大范圍傳播,此時的SRBDF焦聚現(xiàn)象較為明顯,即在初生期SRBDF往往是集中在醫(yī)療健康學科領域。盡管彌散現(xiàn)象在這一時期也會出現(xiàn),但僅限于大規(guī)模的急性突發(fā)事件,但是這類情況爆發(fā)速度較快,初生期轉(zhuǎn)瞬即逝,將會很快步入下一時期——激增期。

      2)從強度維看初生期SRBDF,因為其大部分處于萌芽時期,所以此時的迷霧較弱,如果短期內(nèi)爆發(fā)高強度的迷霧,此時的迷霧數(shù)量定會發(fā)生激增,因此將此類型劃分至激增期,即研究認為科研大數(shù)據(jù)迷霧初生期強度較弱。

      3)從利益維看初生期SRBDF,此階段是迷霧的計劃階段,A機構(gòu)注冊便以盈利為主要目的,利益維充滿了人的主觀能動色彩,在迷霧誕生初期早已被人為籠罩上了利益的面紗,即便是A機構(gòu)最終受到了自己釋放的迷霧的影響,但在迷霧釋放初期對釋放者來說是趨于有利的,并且在整個過程都是趨利向演化的。同理對科研人員及政府來說,在迷霧初生期便伴隨著擾亂其決策的目的,在整個演化過程都是趨害的。

      4)從繁育維看初生期SRBDF,A機構(gòu)的虛假科研數(shù)據(jù)還并未進行大量的傳播繁育,故很難直接判斷出此時的迷霧究竟是雜育型還是寡育型,對于前期多類型、多機構(gòu)、多學科交叉產(chǎn)生的SRBDF可以將其直接劃分為雜育型,但現(xiàn)實情況中不乏在中期乃至后期才出現(xiàn)跨學科的科研數(shù)據(jù),此時便需要將其重新分類。

      3.2.2路徑節(jié)點二

      1)從空間維看激增期SRBDF,在激增期極易出現(xiàn)迷霧大規(guī)模擴散的情況,此時A機構(gòu)已與“北京煥一醫(yī)學檢驗實驗室”“北京普通醫(yī)學檢驗實驗室”成為房山區(qū)三大機構(gòu),科研數(shù)據(jù)量急劇增加,影響范圍逐漸增大,此時期的科研大數(shù)據(jù)迷霧多呈彌散型狀態(tài),已擴散至醫(yī)療健康相關領域,即在短期迷霧數(shù)據(jù)會有突然爆發(fā)式增長的可能。

      2)從強度維看激增期SRBDF,隨著該機構(gòu)核酸檢測數(shù)量增加,與之產(chǎn)生的科研大數(shù)據(jù)數(shù)量勢必進一步增加,因此在激增期迷霧強度將會達到第一個峰值,此時的科研大數(shù)據(jù)迷霧最難控制,對科研人員與政府決策的危害性也最大。

      3)從利益維看激增期SRBDF,此階段是干擾對手的主要時期,在激增期SRBDF的意圖已經(jīng)基本暴露,對何種機構(gòu)有利或是有害極易判斷,此時的A機構(gòu)獲益頗豐,對于政府與科研機構(gòu)而言,其決策判斷已受影響。

      4)從繁育維看激增期SRBDF,隨A機構(gòu)規(guī)模擴大,實驗員等崗位大規(guī)模招聘,此時的科研大數(shù)據(jù)已影響至監(jiān)管部門、藥物生產(chǎn)商等,隨之產(chǎn)生的迷霧以雜育型為主。迷霧的爆發(fā)式增長,大部分迷霧形態(tài)逐漸明確,此階段的中后期迷霧是雜育型還是寡欲型已經(jīng)基本確定。

      3.2.3路徑節(jié)點三

      1)從空間維看衰退期SRBDF,隨北京市公安局通報,衛(wèi)健部門已吊銷A機構(gòu)《醫(yī)療機構(gòu)執(zhí)業(yè)許可證》,彌散在整個科研大數(shù)據(jù)生態(tài)系統(tǒng)的迷霧逐漸回籠,彌散在邊緣學科或是弱相關學科的迷霧逐漸淡化直至消失,再次呈現(xiàn)焦聚的狀態(tài)(可聚集特定的學科、機構(gòu)、地區(qū)),因此從空間維度看衰退期的迷霧,此時期的迷霧以焦聚型為主。

      2)從強度維看衰退期SRBDF,因市場監(jiān)管部門已立案查處,在此時期非核心迷霧逐漸消散,此時的迷霧空間覆蓋范圍逐漸縮小,在數(shù)據(jù)治理的作用下迷霧的災害性逐漸減弱,因此迷霧在衰退期強度逐漸降低。

      3)從利益維看衰退期SRBDF,衰退期屬最終時期,是否提高了自身的核心競爭力、干擾了對手的決策,或者是否受迷霧影響造成決策失誤,從而影響了自己的競爭地位,其利益目的早已明確??蒲写髷?shù)據(jù)人員可準確判斷此時的“迷霧”是趨利型的還是趨害型,但在競爭雙方的僵持作用效果下,衰退期的迷霧盡管在逐漸變?nèi)?,但還未完全消失,因此在科研大數(shù)據(jù)迷霧衰退期仍是趨利型與趨害型兩種“迷霧”混雜。

      4)從繁育維看衰退期SRBDF,此時期迷霧繁育能力降低,很少出現(xiàn)大范圍繁殖的情況,但前期因跨學科、跨機構(gòu)、跨地域引用而產(chǎn)生了多種雜育型迷霧,并伴隨多代寡育型迷霧,科研大數(shù)據(jù)生態(tài)系統(tǒng)中雜育型與寡育型迷霧并存,在短期內(nèi)難以完全消除。

      3.3科研大數(shù)據(jù)迷霧機理分析

      3.3.1生成機理

      由SRBDF-M知,“迷霧”的生成需經(jīng)歷初生期、激增期、衰退期3個階段,迷霧的生成機理是一個整體化的機體,其過程是一個動態(tài)復雜的過程,在迷霧生命周期內(nèi),生產(chǎn)者、傳播者、消費者、監(jiān)管者等主體均有參與。對迷霧的生成機理進行闡述,有助于科研人員掌握其演化規(guī)律,走出“迷霧叢林”。因此,本文主要從利益機理(催生)、擴散機理(傳播)、管控機理(阻隔)3個維度結(jié)合迷霧生命周期,對其內(nèi)在邏輯進行剖析,如圖8所示。

      1)利益機理:科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)部存在優(yōu)質(zhì)與劣質(zhì)兩種類型數(shù)據(jù),優(yōu)質(zhì)科研大數(shù)據(jù)可信度高、生產(chǎn)成本高、可利用價值高;劣質(zhì)科研大數(shù)據(jù)(迷霧數(shù)據(jù))可信度低、生產(chǎn)成本低、可利用價值低。初生期迷霧生產(chǎn)者(以營利性企業(yè)或數(shù)據(jù)生產(chǎn)商為代表)受利益驅(qū)使計劃制造大量的迷霧數(shù)據(jù),此時數(shù)據(jù)類型單一,呈現(xiàn)為焦聚型的弱迷霧,在迷霧型數(shù)據(jù)流出且獲益后會進一步刺激迷霧的生產(chǎn)。監(jiān)管者為保護消費者利益在迷霧出現(xiàn)后會介入進行監(jiān)管。

      2)擴散機理:激增期迷霧傳播者(數(shù)據(jù)共享平臺、數(shù)據(jù)中介組織、數(shù)據(jù)產(chǎn)商等)對迷霧進行擴散,消費者(高校、企業(yè)、科研機構(gòu)等)對迷霧數(shù)據(jù)進行引用,此時的傳播者一部分來自于先前趨利的生產(chǎn)者,另一部分則是受擴散機理影響自發(fā)地擴散迷霧的消費者,迷霧擴散機理指的是受大量的迷霧數(shù)據(jù)的反復刺激,消費者對迷霧數(shù)據(jù)的鑒別產(chǎn)生自我懷疑,開始引用高迷惑性迷霧數(shù)據(jù),使得迷霧數(shù)據(jù)量激增,此階段的科研大數(shù)據(jù)迷霧為數(shù)據(jù)類型復雜的彌散型強迷霧,隨數(shù)據(jù)量的激增,生產(chǎn)者收益增加,進一步刺激劣質(zhì)數(shù)據(jù)產(chǎn)出。

      3)管控機理:大量的迷霧數(shù)據(jù)流入科研大數(shù)據(jù)生態(tài)系統(tǒng)中引起監(jiān)管者(政府監(jiān)管部門等)注意,開始干預生產(chǎn)者行為,對迷霧數(shù)據(jù)進行管控,隨科研經(jīng)歷的增加,科研工作者數(shù)據(jù)鑒別能力逐步提升,開始對迷霧數(shù)據(jù)進行剔除與舉報,生產(chǎn)者利益受阻,迷霧數(shù)據(jù)量逐漸減少,此時的迷霧呈現(xiàn)數(shù)據(jù)類型趨于單一的焦聚型弱迷霧特點。

      3.3.2機理間的內(nèi)在聯(lián)系

      科研大數(shù)據(jù)迷霧催生因素多樣、生成過程復雜,但利益機理、擴散機理、管控機理并不是孤立存在的,內(nèi)部具有一定的邏輯聯(lián)系,如圖9所示。

      擴散機理與利益機理的關聯(lián)關系。消費者的策略選擇通常有消費與不消費兩種。生產(chǎn)者對高品質(zhì)科研大數(shù)據(jù)通常有保留和流出兩種策略,對科研大數(shù)據(jù)迷霧通常有保留和流出兩種策略。因此在科研大數(shù)據(jù)生態(tài)系統(tǒng)中存在的4種數(shù)據(jù)流轉(zhuǎn)策略:第一種是高價優(yōu)質(zhì)科研大數(shù)據(jù);第二種是低價優(yōu)質(zhì)科研大數(shù)據(jù);第三種是高價迷霧數(shù)據(jù);第四種是低價迷霧數(shù)據(jù)。在利益機理下,科研大數(shù)據(jù)生產(chǎn)者會向消費者索要高回報。當消費者選擇消費時,可能高價買到優(yōu)質(zhì)數(shù)據(jù)或迷霧數(shù)據(jù),也可能低價買到優(yōu)質(zhì)數(shù)據(jù)或迷霧數(shù)據(jù),此時存在迷霧擴散的可能;消費者的收益為數(shù)據(jù)價值與獲取數(shù)據(jù)成本的差值;當選擇不消費時,消費者的得益為0,此時不存在迷霧擴散的可能。

      管控機理與利益機理的關聯(lián)關系。監(jiān)管者對于生產(chǎn)者的各種行為存在監(jiān)管與不監(jiān)管兩種策略。當監(jiān)管者在利益機理作用下,為降低監(jiān)管成本,即松懈檢測時,存在優(yōu)劣科研大數(shù)據(jù)混合。消費者在明確要付出較大成本獲取數(shù)據(jù)時的得益應該不小于不獲取數(shù)據(jù)的得益。由管控機理知,當監(jiān)管者選擇監(jiān)管松懈時,生產(chǎn)者流出迷霧數(shù)據(jù),但當流出迷霧數(shù)據(jù)加大時,監(jiān)管者會再次選擇監(jiān)管嚴厲。當生產(chǎn)者提供優(yōu)質(zhì)數(shù)據(jù)時,監(jiān)管者又會選擇監(jiān)管松懈以減低監(jiān)管的成本支出。

      擴散機理與管控機理的關聯(lián)關系。監(jiān)管者對數(shù)據(jù)質(zhì)量嚴格監(jiān)管時,生產(chǎn)者減少迷霧型數(shù)據(jù)的生產(chǎn),消費者獲取迷霧數(shù)據(jù)的可能性降低,迷霧擴散的概率隨之降低。監(jiān)管者對數(shù)據(jù)質(zhì)量監(jiān)管松懈時,生產(chǎn)者加大迷霧型數(shù)據(jù)的生產(chǎn),更多的迷霧數(shù)據(jù)流轉(zhuǎn)到消費者的手中,加大了迷霧的擴散。

      利益機理、擴散機理與管控機理的關聯(lián)關系。如果監(jiān)管者嚴格監(jiān)管科研大數(shù)據(jù)生態(tài)系統(tǒng)中數(shù)據(jù)流通行為,生產(chǎn)者會向消費者索要較低的報酬,消費者得益大于0時會選擇接受科研大數(shù)據(jù)迷霧;否則生產(chǎn)者索要高報酬,生產(chǎn)者高低報酬比例使消費者接受的得益大于不接受得益。在管控機理作用下,生產(chǎn)者若仍選擇流出迷霧數(shù)據(jù),此時監(jiān)管者將會實施系統(tǒng)內(nèi)部混合策略。當監(jiān)管者對于生產(chǎn)者所產(chǎn)數(shù)據(jù)檢測不到位時,消費者無法根據(jù)生產(chǎn)者對所放出的報酬要求來判斷科研大數(shù)據(jù)的優(yōu)劣,此時迷霧擴散的概率加大。利益機理、擴散機理與管控機理分別發(fā)揮著催生、傳播、阻隔的作用,維持著科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)部的動態(tài)平衡。

      3.4科研大數(shù)據(jù)迷霧模型的應用分析

      1)應用過程。第一步,確定對象。確定科研大數(shù)據(jù)所屬的領域及模型的運用者。不同領域甚至同一領域的科研決策者、一線人員以及科技政策制定者的關注側(cè)重點各有不同。第二步,從科研大數(shù)據(jù)庫中獲取相關數(shù)據(jù)。此步驟應注意科研大數(shù)據(jù)迷霧發(fā)現(xiàn)機制的實現(xiàn)問題(是對已知數(shù)據(jù)的判斷還是對未知數(shù)據(jù)的挖掘)。第三步,開展綜合分析。對科研大數(shù)據(jù)迷霧的類型、路徑、機理進行分析。從不同維度對科研大數(shù)據(jù)迷霧進行類型劃分,并探索其作用路徑及所處階段,為后續(xù)數(shù)據(jù)治理提供啟示。同時還應注意數(shù)據(jù)的格式問題以及人員間、人員與模型間的協(xié)同性問題。第四步,形成結(jié)論,即對科研大數(shù)據(jù)的評價結(jié)果。第五步,將結(jié)論反饋決策者,提交數(shù)據(jù)質(zhì)量報告,為科研大數(shù)據(jù)治理提供合理化建議。

      2)應用場景。SRBDF-M具有較強的實用性,在科研大數(shù)據(jù)庫建設、科研決策、科研大數(shù)據(jù)政策制定等場景中均可使用,具體分析如下:①應用場景一:科研大數(shù)據(jù)庫建設。隨著科技發(fā)展,科研人員對科研大數(shù)據(jù)的需求日益增加,科研大數(shù)據(jù)庫逐漸興起。將SRBDF-M引入到科研大數(shù)據(jù)庫建設,可起到優(yōu)化數(shù)據(jù)存儲(通過SRBDF-M進行數(shù)據(jù)篩選分類,剔除劣質(zhì)數(shù)據(jù)、無效數(shù)據(jù)、冗余數(shù)據(jù))、加強數(shù)據(jù)保護(通過SRBDF-M進行迷霧型數(shù)據(jù)生產(chǎn)者溯源,減少劣質(zhì)數(shù)據(jù)的產(chǎn)出,如已有的科技資源標識符與數(shù)字對象唯一標識符)、促進數(shù)據(jù)共享(數(shù)據(jù)共享成為科研大數(shù)據(jù)治理的重要任務之一,SRBDF-M可控制劣質(zhì)數(shù)據(jù)的流入,提高科研效率,加快科研大數(shù)據(jù)流轉(zhuǎn),同時保障數(shù)據(jù)權(quán)益使更多的科研成果參與共享)的作用;②應用場景二:科研決策。SRBDF-M有助于實時、全面、準確、專一的科研大數(shù)據(jù)清洗平臺的建設,科研人員通過SRBDF-M獲取高精度數(shù)據(jù)使科研決策更加科學。大數(shù)據(jù)時代背景下大量冗余數(shù)據(jù)使得科研決策環(huán)境發(fā)生變化,SRBDF-M可有效評價數(shù)據(jù)優(yōu)劣、剔除冗余數(shù)據(jù),更好滿足管理者決策需求,為領導層的決策制定提供高價值、高精度的支撐數(shù)據(jù);③應用場景三:科研大數(shù)據(jù)政策制定。從2008年的《中華人民共和國科技進步法》到2015年的《促進大數(shù)據(jù)發(fā)展的行動綱要》,再至2018年的《科學數(shù)據(jù)管理辦法》,科研大數(shù)據(jù)的共享與利用不斷推進,然而由前文機理分析知科研大數(shù)據(jù)政策的制定過程是一個博弈行為,SRBDF-M可幫助政府分析系統(tǒng)內(nèi)部其他主體的選擇行為,了解科研大數(shù)據(jù)發(fā)展態(tài)勢,提高科研大數(shù)據(jù)政策科學性。

      4結(jié)語

      1)科研大數(shù)據(jù)迷霧模型較好地描述了科研域迷霧數(shù)據(jù)出現(xiàn)、聚集、消散的演化過程。本研究提出了“科研大數(shù)據(jù)迷霧”的概念,并在科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)的過程中,從時間、空間、強度、利益、繁育等維度對科研大數(shù)據(jù)迷霧的類型、路徑與生成機理進行了詳盡剖析。研究得出科研大數(shù)據(jù)迷霧是指衍生于數(shù)據(jù)迷霧、貫穿于科研大數(shù)據(jù)生命周期,以科研域虛假、有毒、垃圾數(shù)據(jù)為重要組成部分,以全鏈性、不嚴格波動性、派系性、霧化性、災難性為基本特征,以初生型、激增型、衰退型、焦聚型、彌散型、強迷霧、弱迷霧、趨利型、趨害型、雜育型、寡育型為基本類型,降低科研大數(shù)據(jù)質(zhì)量、干擾科研人員決策、引發(fā)數(shù)據(jù)災難進而擾亂科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類數(shù)據(jù)的總稱。

      2)科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)對于科研大數(shù)據(jù)治理具有重要的理論價值與實踐價值,主要體現(xiàn)在以下幾個方面:

      ①對科研大數(shù)據(jù)治理目標的新安排。科研大數(shù)據(jù)迷霧概念的提出要求構(gòu)建科研大數(shù)據(jù)治理優(yōu)勢互補新布局,發(fā)現(xiàn)新優(yōu)勢、發(fā)掘新動能、制定新規(guī)制、應對“迷霧”新問題,穩(wěn)科技研究預期、利創(chuàng)新發(fā)展長遠,堅持科研大數(shù)據(jù)良性轉(zhuǎn)化,健全科研大數(shù)據(jù)治理體制,優(yōu)化科研大數(shù)據(jù)資源配置,提升科研大數(shù)據(jù)創(chuàng)新效能,擴大國際科研大數(shù)據(jù)共享,以完成開放、共享、創(chuàng)新、多樣、穩(wěn)定、持續(xù)的科研大數(shù)據(jù)生態(tài)系統(tǒng)建設新目標。

      ②對科研大數(shù)據(jù)內(nèi)涵的新豐富??蒲写髷?shù)據(jù)迷霧生成模型是對科研域虛假、有毒、垃圾數(shù)據(jù)運行機理的深度闡釋。研究提出的“科研大數(shù)據(jù)迷霧”的概念具有整體性、原創(chuàng)性、前瞻性、引導性,以全局性的眼光看待整個科學研究過程中出現(xiàn)的迷霧數(shù)據(jù),并第一次系統(tǒng)地對科研域虛假的、有毒的垃圾數(shù)據(jù)進行歸納與總結(jié),豐富了科研大數(shù)據(jù)理論,可為后續(xù)相關研究提供理論依據(jù)。

      ③對科研大數(shù)據(jù)治理價值旨歸的新構(gòu)造。宏觀層面:在科研大數(shù)據(jù)蓬勃發(fā)展的時代背景下,厘清“迷霧”生成機理,是大數(shù)據(jù)發(fā)展中至關重要的一環(huán),有利于打破數(shù)據(jù)壁壘、加強科研數(shù)據(jù)共享、鞏固科研大數(shù)據(jù)生態(tài)系統(tǒng)的和諧穩(wěn)定,是對國家大數(shù)據(jù)戰(zhàn)略的積極響應。中觀層面:在科學發(fā)展過程中,“迷霧”的存在將會成為科研進步的絆腳石,揭露其存在是科學發(fā)展的“清朗”行動。微觀層面:有助于幫助科研機構(gòu)、科研人員、企業(yè)更好地了解科研大數(shù)據(jù)迷霧,有效規(guī)避風險,提高決策效率,從而增強自身核心競爭力。

      ④對科研大數(shù)據(jù)治理風險的新研判。以生態(tài)系統(tǒng)的眼光探究“迷霧”,具有系統(tǒng)性、整體性、協(xié)同性、時效性的特點。在當今安全赤字與治理赤字的大背景下,科研合作筑墻設壘、數(shù)據(jù)共享脫鉤斷鏈,是對治理體系、治理能力、治理水平的新挑戰(zhàn)??蒲写髷?shù)據(jù)共享過程中應兼顧外部風險與內(nèi)部風險、傳統(tǒng)風險與非傳統(tǒng)風險、自身風險與共同風險。多階段、多主體、多維度分析迷霧類型及演化,為整體有序地開展科研大數(shù)據(jù)治理提供了新思路。

      ⑤對科研大數(shù)據(jù)治理舉措的新闡述??蒲写髷?shù)據(jù)迷霧概念的提出不僅要求健全科研大數(shù)據(jù)治理體系、增強科研大數(shù)據(jù)治理能力、提高科研大數(shù)據(jù)治理水平,還要求革新科研大數(shù)據(jù)治理舉措,夯實科研大數(shù)據(jù)生態(tài)穩(wěn)定基礎。主要包括治理框架的革新:構(gòu)建科研大數(shù)據(jù)安全應急框架,實現(xiàn)全科研域數(shù)據(jù)、人才、環(huán)境聯(lián)動,立體高效地應對科研大數(shù)據(jù)迷霧。治理體系的革新:對科研大數(shù)據(jù)生態(tài)進行一體化保護、系統(tǒng)化治理,構(gòu)建面向“迷霧”特性的全局化、整體化的應對性的科研大數(shù)據(jù)治理體系。治理過程的革新:以科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)外雙循環(huán)為輔助,遵循“迷霧”生命周期規(guī)律,多階段、多主體協(xié)同治理,注重迷霧治理過程的規(guī)范化、程序化,增強科研大數(shù)據(jù)生態(tài)鏈韌性。

      3)盡管本文構(gòu)建了科研大數(shù)據(jù)迷霧模型,提出了科研大數(shù)據(jù)迷霧的概念,并對其特性、類型、路徑、機理進行了詳盡的剖析,但如何應對科研大數(shù)據(jù)迷霧問題、維持科研大數(shù)據(jù)生態(tài)的和諧穩(wěn)定,后續(xù)仍需深入討論。

      猜你喜歡
      數(shù)據(jù)治理生態(tài)系統(tǒng)模型
      一半模型
      重要模型『一線三等角』
      重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
      基于本體的企業(yè)運營數(shù)據(jù)治理
      云端數(shù)據(jù)治理初探
      諾里斯筆下的伊甸園
      生態(tài)系統(tǒng)視角下:農(nóng)村留守幼兒情緒問題的形成
      科教導刊(2016年27期)2016-11-15 22:36:28
      3D打印中的模型分割與打包
      基于價值共創(chuàng)共享的信息服務生態(tài)系統(tǒng)協(xié)同機制研究
      科技視界(2016年18期)2016-11-03 22:02:50
      大數(shù)據(jù)治理模型與治理成熟度評估研究
      马龙县| 社会| 开鲁县| 防城港市| 喀什市| 武隆县| 绥滨县| 新巴尔虎右旗| 达尔| 余江县| 玉龙| 浮梁县| 晴隆县| 盱眙县| 林周县| 四平市| 西林县| 郁南县| 江津市| 连南| 任丘市| 福建省| 新丰县| 金湖县| 方山县| 如东县| 蒙阴县| 新巴尔虎左旗| 工布江达县| 乌苏市| 哈巴河县| 体育| 肇东市| 松江区| 汤原县| 铁岭市| 元氏县| 前郭尔| 广南县| 沅陵县| 伊春市|