——首屆“大數(shù)據(jù)管理與應(yīng)用”暑期學(xué)校紀(jì)要"/>
  • 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)的融合應(yīng)用與拓展
      ——首屆“大數(shù)據(jù)管理與應(yīng)用”暑期學(xué)校紀(jì)要

      2023-07-31 09:00:30鄧勝利錢倩文夏蘇迪汪璠
      圖書情報(bào)知識(shí) 2023年2期

      鄧勝利 錢倩文 夏蘇迪 汪璠

      ( 武漢大學(xué)信息管理學(xué)院,武漢,430072)

      1 引言

      大數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源和數(shù)字經(jīng)濟(jì)時(shí)代的新引擎。隨著技術(shù)與應(yīng)用的成熟,大數(shù)據(jù)與人工智能的結(jié)合已成為新的趨勢(shì),大數(shù)據(jù)管理與應(yīng)用領(lǐng)域?qū)⒊蔀榇髷?shù)據(jù)與智能化的橋梁。當(dāng)前,大數(shù)據(jù)技術(shù)已廣泛應(yīng)用于情報(bào)服務(wù)[1]、個(gè)性化推薦[2]、 醫(yī)療保健[3]、金融[4]等領(lǐng)域,驅(qū)動(dòng)社會(huì)經(jīng)濟(jì)創(chuàng)新發(fā)展。與此同時(shí),大數(shù)據(jù)技術(shù)的廣泛應(yīng)用帶來(lái)了大數(shù)據(jù)殺熟、個(gè)人信息泄露以及數(shù)據(jù)安全等問(wèn)題[5],因此亟需通過(guò)數(shù)據(jù)治理對(duì)數(shù)據(jù)管理的權(quán)力進(jìn)行控制,在增加數(shù)據(jù)價(jià)值的同時(shí)將與數(shù)據(jù)相關(guān)的成本和風(fēng)險(xiǎn)降至最小化[6]。

      在此背景下,2022年7月8日-13日,由武漢大學(xué)信息管理學(xué)院主辦,武漢大學(xué)大數(shù)據(jù)研究院、武漢大學(xué)信息資源研究中心協(xié)辦的武漢大學(xué)首屆“大數(shù)據(jù)管理與應(yīng)用”研究生暑期學(xué)校以線上線下相結(jié)合的形式舉辦。本次暑期學(xué)校面向大數(shù)據(jù)領(lǐng)域研究者搭建學(xué)界與業(yè)界理論研討與實(shí)踐探究的高水平交流平臺(tái),邀請(qǐng)了來(lái)自國(guó)內(nèi)外20多名知名學(xué)者和行業(yè)專家,采用專題報(bào)告、學(xué)術(shù)論壇、案例分析和方法訓(xùn)練等方式,聚焦大數(shù)據(jù)管理與應(yīng)用的核心領(lǐng)域,系統(tǒng)深入地呈現(xiàn)大數(shù)據(jù)領(lǐng)域研究的發(fā)展現(xiàn)狀與拓新,推進(jìn)相關(guān)領(lǐng)域的學(xué)術(shù)研究、行業(yè)交流與縱深合作。本次暑期學(xué)校吸引了來(lái)自國(guó)內(nèi)20多所高校的61名研究生參加學(xué)習(xí),以期培養(yǎng)學(xué)員在大數(shù)據(jù)研究與應(yīng)用方面的技術(shù)認(rèn)知、先進(jìn)思想和創(chuàng)新觀念,促進(jìn)其在大數(shù)據(jù)領(lǐng)域研究方向的發(fā)展、研究主題的深化和研究方法的突破。

      本文以“大數(shù)據(jù)管理與應(yīng)用”暑期學(xué)校交流內(nèi)容為主線,結(jié)合當(dāng)前大數(shù)據(jù)領(lǐng)域的研究現(xiàn)狀,將此次暑期學(xué)校的內(nèi)容總結(jié)為大數(shù)據(jù)技術(shù)與計(jì)算社會(huì)科學(xué)發(fā)展、大數(shù)據(jù)領(lǐng)域應(yīng)用、大數(shù)據(jù)安全、大數(shù)據(jù)治理、大數(shù)據(jù)學(xué)科建設(shè)五個(gè)方向,按照“技術(shù)發(fā)展——應(yīng)用實(shí)踐——問(wèn)題剖析——治理防范——學(xué)科建設(shè)”邏輯脈絡(luò),循序漸進(jìn)地展現(xiàn)大數(shù)據(jù)核心領(lǐng)域的最新進(jìn)展與成果圖譜,下文將做詳細(xì)闡述。

      2 大數(shù)據(jù)技術(shù)與計(jì)算社會(huì)科學(xué)發(fā)展

      計(jì)算社會(huì)科學(xué)是指利用先進(jìn)的計(jì)算和信息技術(shù)等對(duì)復(fù)雜的人類行為及社會(huì)運(yùn)行進(jìn)行深入精細(xì)的跨學(xué)科研究[7]。隨著大數(shù)據(jù)技術(shù)的快速發(fā)展和數(shù)字社會(huì)的迅速崛起,計(jì)算社會(huì)科學(xué)迎來(lái)全新的發(fā)展前景。結(jié)合這一主題,暑期學(xué)校的專家圍繞輿情大數(shù)據(jù)、應(yīng)急大數(shù)據(jù)、夜光遙感大數(shù)據(jù)和科技大數(shù)據(jù)分析挖掘等做了主題報(bào)告。

      2.1 龔為綱:大數(shù)據(jù)、云計(jì)算與計(jì)算社會(huì)科學(xué)實(shí)踐

      “數(shù)據(jù)決定命運(yùn),算法決定未來(lái)”,大數(shù)據(jù)資源的獲取、存儲(chǔ)與處理至關(guān)重要。大數(shù)據(jù)的數(shù)據(jù)來(lái)源包括共有數(shù)據(jù)(谷歌圖書等)、自有數(shù)據(jù)(輿情大數(shù)據(jù)、社交媒體大數(shù)據(jù)等);大數(shù)據(jù)的存儲(chǔ)平臺(tái)包括谷歌云等,可實(shí)現(xiàn)數(shù)據(jù)集成、數(shù)據(jù)共享等功能;大數(shù)據(jù)的處理平臺(tái)包括BigQuery、阿里云等,可實(shí)現(xiàn)數(shù)據(jù)插入、查詢、增加、刪除等功能。龔為綱副教授研究團(tuán)隊(duì)在涉華輿論[8-9]、民粹主義[10]等輿情大數(shù)據(jù)分析挖掘方面取得了較為豐碩的研究成果。他著重介紹了其研究團(tuán)隊(duì)在西方涉華輿情方面的研究,認(rèn)為美國(guó)涉華輿情將中國(guó)建構(gòu)成專制主義的、人權(quán)問(wèn)題突出的、對(duì)西方充滿挑釁和威脅的形象,全球網(wǎng)絡(luò)空間中的新聞信息傳播同時(shí)表現(xiàn)出“核心——邊緣”結(jié)構(gòu)和“文化圈群”結(jié)構(gòu)[8],世界上的主要區(qū)域文化圈群包括儒家文化圈群、拉美圈群、歐洲圈群等,不同文化圈群與媒介霸權(quán)具有不同的交互關(guān)系。上述發(fā)現(xiàn)有助于提升未來(lái)我國(guó)對(duì)外傳播的有效性和針對(duì)性。

      2.2 呂欣:大數(shù)據(jù)挖掘與應(yīng)急管理

      通過(guò)大數(shù)據(jù)分析挖掘人類行為規(guī)律并對(duì)其進(jìn)行預(yù)測(cè),具有可推廣性強(qiáng)、成本低等優(yōu)勢(shì)。應(yīng)急大數(shù)據(jù)的分析挖掘已成為計(jì)算社會(huì)科學(xué)的重要研究方式,可以有效降低應(yīng)急決策的不確定性,實(shí)現(xiàn)決策的科學(xué)化、民主化[11],在應(yīng)急決策管理方面發(fā)揮著重要作用[12]。

      大數(shù)據(jù)驅(qū)動(dòng)的應(yīng)急決策框架包括獲取應(yīng)急大數(shù)據(jù)(手機(jī)定位、災(zāi)害遙感、互聯(lián)網(wǎng)遙感、互聯(lián)網(wǎng)大數(shù)據(jù)等)、大數(shù)據(jù)群體行為分析(疏散、撤離、應(yīng)急反應(yīng)、行為模式挖掘、行為預(yù)測(cè)等)、應(yīng)急決策(應(yīng)急響應(yīng)、應(yīng)急救援、公共衛(wèi)生干預(yù)等)、政策評(píng)估(管控效果、經(jīng)濟(jì)影響等)四個(gè)部分,且形成了良性閉環(huán)。近年來(lái)大規(guī)模移動(dòng)通信、社交網(wǎng)絡(luò)與衛(wèi)星圖像等大數(shù)據(jù)不斷被創(chuàng)新地應(yīng)用到自然災(zāi)害應(yīng)急管理、流行病傳播建模等應(yīng)急決策研究中。例如,在自然災(zāi)害應(yīng)急管理方面,通過(guò)海地地震大數(shù)據(jù)分析挖掘難民的流動(dòng)軌跡、聚集位置、行為預(yù)測(cè)等信息,為應(yīng)急救援、物資調(diào)配等提供決策支撐;在流行病建模方面,通過(guò)大數(shù)據(jù)技術(shù)對(duì)非典、埃博拉、新冠肺炎疫情等流行病的傳播規(guī)律進(jìn)行建模分析,實(shí)現(xiàn)傳播預(yù)測(cè)、風(fēng)險(xiǎn)評(píng)估等效果。

      2.3 李熙:夜光遙感與社會(huì)經(jīng)濟(jì)研究

      夜光遙感通過(guò)獲取地表城市燈光、漁船發(fā)光、油氣井燃燒發(fā)光等夜間燈光亮度輻射值,能夠客觀地反映夜間人類社會(huì)經(jīng)濟(jì)活動(dòng)強(qiáng)度[13]。宏觀層面來(lái)看,全球夜光遙感大數(shù)據(jù)可以反映出人口分布、財(cái)富分布、城市發(fā)展變遷等社會(huì)經(jīng)濟(jì)差異情況;微觀層面看,某城市夜光遙感大數(shù)據(jù)可以反映城市道路、光污染、犯罪率等社會(huì)運(yùn)行狀況。夜光遙感大數(shù)據(jù)已廣泛應(yīng)用于社會(huì)經(jīng)濟(jì)參數(shù)估算[14-15]、城市化和區(qū)域發(fā)展評(píng)估[16-17]、光污染分析[18]、漁業(yè)監(jiān)測(cè)[19]、宗教和文化分析、火點(diǎn)監(jiān)測(cè)[20]等人類社會(huì)活動(dòng)的識(shí)別與揭示。

      李熙教授研究團(tuán)隊(duì)在夜光遙感大數(shù)據(jù)的分析挖掘方面成果突出。例如,在社會(huì)經(jīng)濟(jì)參數(shù)估算方面,分析了2020年2月—4月COVID-19疫情初期美國(guó)20個(gè)大城市夜光亮度變化的空間格局、衰減特征和用地類型差異,展示了夜光遙感在監(jiān)測(cè)公共衛(wèi)生防控措施帶來(lái)的城市社會(huì)經(jīng)濟(jì)活動(dòng)變化的作用[14];在城市化和區(qū)域發(fā)展評(píng)估方面,采用簡(jiǎn)單閾值法與城市夜間燈光指數(shù)法揭示了粵港澳大灣區(qū)的城市空間形態(tài)[16],基于可見光紅外成像輻射儀(VisibleInfrared Imaging Radiometer Suite,VIIRS)月度夜光遙感影像數(shù)據(jù)揭示了巴基斯坦的區(qū)域發(fā)展規(guī)律[17]。

      2.4 夏昊翔:數(shù)據(jù)驅(qū)動(dòng)的科技創(chuàng)新系統(tǒng)結(jié)構(gòu)與演化研究

      科學(xué)范式的發(fā)展分為四個(gè)階段,分別是以科學(xué)實(shí)驗(yàn)為模型的經(jīng)驗(yàn)科學(xué)、以經(jīng)典數(shù)學(xué)理論為模型的理論科學(xué)、以計(jì)算機(jī)仿真和模擬為模型的計(jì)算科學(xué)和以大數(shù)據(jù)挖掘?yàn)槟P偷臄?shù)據(jù)密集型科學(xué)[21]。科技大數(shù)據(jù)有助于深入理解科技創(chuàng)新系統(tǒng)和大規(guī)模集體智能系統(tǒng),從而為科技政策、科技評(píng)價(jià)、科技人員的科技決策提供指導(dǎo)實(shí)踐。使用科技大數(shù)據(jù)探究科學(xué)行為背后的機(jī)制方面[22],涌現(xiàn)了大量科學(xué)學(xué)研究成果。夏昊翔教授團(tuán)隊(duì)的研究主要聚焦三個(gè)方面:①在科技領(lǐng)域知識(shí)地圖構(gòu)建方面,融合文獻(xiàn)的文本內(nèi)容特征與引用關(guān)系特征,并結(jié)合深度圖神經(jīng)網(wǎng)絡(luò)模型與文檔表示學(xué)習(xí)提出了新的學(xué)科領(lǐng)域知識(shí)結(jié)構(gòu)探測(cè)框架,提高了領(lǐng)域知識(shí)結(jié)構(gòu)探測(cè)效率及可識(shí)別度[23];②在科技人員知識(shí)探索模式與機(jī)理方面,發(fā)現(xiàn)科研人員在領(lǐng)域間的探索模式呈現(xiàn)出大量的短距離轉(zhuǎn)移與少量的長(zhǎng)距離轉(zhuǎn)移的特點(diǎn),并探究了科研人員主題轉(zhuǎn)移的促進(jìn)因素和抑制因素;③在科研協(xié)作網(wǎng)絡(luò)結(jié)構(gòu)形態(tài)方面,發(fā)現(xiàn)“富人”俱樂(lè)部與跨協(xié)作社區(qū)“多元”俱樂(lè)部成員的H指數(shù)、篇均引用量等表現(xiàn)更佳,但從論文突破性指標(biāo)上看,跨領(lǐng)域協(xié)作“多元”俱樂(lè)部成員表現(xiàn)更高。

      3 大數(shù)據(jù)的領(lǐng)域應(yīng)用

      大數(shù)據(jù)技術(shù)已經(jīng)滲透到人們?nèi)粘9ぷ?、生活、學(xué)習(xí)的各個(gè)方面,在金融風(fēng)控、司法輔助、生物醫(yī)學(xué)、期刊建設(shè)、企業(yè)管理等領(lǐng)域和行業(yè)得到了廣泛的應(yīng)用,在促進(jìn)科學(xué)研究發(fā)展和助力智慧行業(yè)建設(shè)等方面發(fā)揮了重要作用。

      3.1 洪亮:金融知識(shí)圖譜及其領(lǐng)域應(yīng)用

      作為大數(shù)據(jù)與人工智能技術(shù)的重要組成部分,知識(shí)圖譜是一種揭示實(shí)體之間關(guān)系的語(yǔ)義網(wǎng)絡(luò),具有語(yǔ)義處理能力與開放互聯(lián)能力,為問(wèn)題解決提供了技術(shù)支撐[24]。近年來(lái)我國(guó)金融風(fēng)險(xiǎn)事件日益涌現(xiàn),如何通過(guò)金融股權(quán)網(wǎng)絡(luò)構(gòu)建與結(jié)構(gòu)特征分析、金融機(jī)構(gòu)股東持股比例計(jì)算、股權(quán)網(wǎng)絡(luò)與控制權(quán)網(wǎng)絡(luò)識(shí)別、金融控制平臺(tái)與資本系識(shí)別[25],實(shí)現(xiàn)股權(quán)“穿透式”監(jiān)管,協(xié)助金融主管部門進(jìn)行系統(tǒng)性金融風(fēng)險(xiǎn)的識(shí)別、防范與化解成為亟待解決的問(wèn)題。洪亮教授研究團(tuán)隊(duì)以概念層、實(shí)例層“知識(shí)關(guān)聯(lián)”特征為核心[26],融合全量的金融機(jī)構(gòu)和工商注冊(cè)企業(yè)股權(quán)數(shù)據(jù),構(gòu)建了億級(jí)結(jié)點(diǎn)的股權(quán)知識(shí)大圖[27],具有Top-K控制權(quán)路徑查詢、穿透式股權(quán)網(wǎng)絡(luò)查詢、資本系分析、交叉持股分析等功能,可實(shí)現(xiàn)金融大數(shù)據(jù)管理、金融風(fēng)險(xiǎn)識(shí)別與預(yù)警等目標(biāo)。

      3.2 王竹:兼顧可解釋性和可計(jì)算性的司法人工智能輔助

      2021年,國(guó)家專門設(shè)立了十四五“社會(huì)治理與智慧社會(huì)科技支撐”等專項(xiàng),已將智慧司法放到重要戰(zhàn)略位置。當(dāng)前司法人工智能技術(shù)發(fā)展面臨“法律思維”瓶頸、“可解釋性”瓶頸和“可計(jì)算性”瓶頸。大規(guī)模億級(jí)裁判文書的公開為民商事司法裁判知識(shí)發(fā)現(xiàn)提供了基礎(chǔ),使得司法裁判可計(jì)算化成為可能,促進(jìn)了民商事司法裁判知識(shí)可計(jì)算化的“準(zhǔn)三段論(大前提-小前提-結(jié)論)”實(shí)現(xiàn)。大數(shù)據(jù)和人工智能技術(shù)為法官提供基礎(chǔ)的司法輔助工作,適應(yīng)了提高訴訟效率的需求。王竹教授研究團(tuán)隊(duì)在司法輔助領(lǐng)域取得了較為豐碩的研究成果,例如構(gòu)建了司法案件案情知識(shí)圖譜,為類案精準(zhǔn)推送提供語(yǔ)義支撐[28];基于遷移學(xué)習(xí)方法,提出了一個(gè)基于法律事實(shí)的適用法條推薦模型,為證據(jù)推送、量刑預(yù)測(cè)提供支撐[29]。

      3.3 盧龍:生物醫(yī)學(xué)大數(shù)據(jù)簡(jiǎn)介及其人工智能應(yīng)用

      生物醫(yī)學(xué)大數(shù)據(jù)包括組學(xué)模態(tài)(基因組、蛋白質(zhì)組等微觀數(shù)據(jù))、影像組態(tài)(MRI圖片、CT圖片等非結(jié)構(gòu)化圖像數(shù)據(jù))、文本組態(tài)(門診記錄、檢驗(yàn)報(bào)告、醫(yī)生經(jīng)驗(yàn)知識(shí)等數(shù)據(jù))等模態(tài)數(shù)據(jù)[30]。生物醫(yī)學(xué)大數(shù)據(jù)具有體量大且快速增長(zhǎng)、類型和結(jié)構(gòu)復(fù)雜、整合分析要求高、信息價(jià)值大而密度小、對(duì)真實(shí)性要求高、專業(yè)性強(qiáng)、生命周期長(zhǎng)等特點(diǎn)[31]。生物醫(yī)學(xué)大數(shù)據(jù)的應(yīng)用面臨疾病長(zhǎng)尾多發(fā)、樣本異質(zhì)不均、數(shù)據(jù)非標(biāo)孤立、模態(tài)多模密集、標(biāo)注稀疏有噪、任務(wù)復(fù)雜多樣、安全脆弱不穩(wěn)等挑戰(zhàn)。隨著生物醫(yī)學(xué)大數(shù)據(jù)的快速積累、數(shù)據(jù)存儲(chǔ)和管理軟硬件基礎(chǔ)設(shè)施的發(fā)展、生物信息和計(jì)算機(jī)技術(shù)的成熟,大數(shù)據(jù)技術(shù)在疾病預(yù)防、疾病診斷、疾病治療、健康管理等生物醫(yī)療領(lǐng)域的應(yīng)用日趨廣泛[32],推動(dòng)了語(yǔ)音錄入病歷、醫(yī)學(xué)影像自動(dòng)判讀、臨床輔助診斷[33]、健康管理疾病預(yù)警、醫(yī)療機(jī)器人、藥物篩選和開發(fā)等場(chǎng)景的優(yōu)化發(fā)展。例如,Esteva等[33]基于卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)臨床影像大數(shù)據(jù)進(jìn)行學(xué)習(xí)來(lái)訓(xùn)練臨床診斷模型,從而輔助臨床醫(yī)生實(shí)現(xiàn)對(duì)患者的高準(zhǔn)確率診斷。

      3.4 曾建勛:我國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)轉(zhuǎn)型路徑之思考

      大數(shù)據(jù)時(shí)代,合規(guī)合法地構(gòu)建期刊數(shù)據(jù)資源,尊重作者版權(quán),促進(jìn)學(xué)術(shù)論文的合理使用,是我國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)實(shí)現(xiàn)轉(zhuǎn)型發(fā)展的重點(diǎn)。國(guó)際上文獻(xiàn)數(shù)據(jù)庫(kù)構(gòu)建主體包括出版商、學(xué)協(xié)會(huì)、集成商等,構(gòu)建方式包括自行建設(shè)數(shù)據(jù)庫(kù)和搭建期刊元數(shù)據(jù)信息集成檢索平臺(tái),構(gòu)建類型包括全文數(shù)據(jù)庫(kù)、引文數(shù)據(jù)庫(kù)、文摘數(shù)據(jù)庫(kù)、科研分析工具、專利數(shù)據(jù)庫(kù)、資源發(fā)現(xiàn)系統(tǒng)等,集數(shù)據(jù)、版權(quán)、工具于一體,具有資源類型多元化、服務(wù)功能豐富、融入科研過(guò)程等優(yōu)勢(shì)[34]。

      目前,我國(guó)學(xué)術(shù)數(shù)據(jù)庫(kù)面臨的發(fā)展困境包括版權(quán)模式、獨(dú)家授權(quán)模式、定價(jià)機(jī)制、版費(fèi)標(biāo)準(zhǔn)、產(chǎn)品模式、學(xué)術(shù)機(jī)制、開放進(jìn)程、議價(jià)能力、社會(huì)屬性等九大發(fā)展困境[35]。我國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)應(yīng)從強(qiáng)化知識(shí)內(nèi)容行業(yè)治理、樹立期刊社的全文經(jīng)營(yíng)主體地位、收費(fèi)標(biāo)準(zhǔn)透明化、強(qiáng)化知識(shí)服務(wù)特色、構(gòu)建多元化評(píng)價(jià)體系和開放機(jī)制、加快開放進(jìn)程[34]等方面轉(zhuǎn)型。

      3.5 杜曉夢(mèng)、孔柏林:數(shù)據(jù)驅(qū)動(dòng)下的企業(yè)智能管理行業(yè)應(yīng)用

      數(shù)據(jù)智能是數(shù)字經(jīng)濟(jì)的驅(qū)動(dòng)引擎,使得企業(yè)決策更靈活高效,深入社會(huì)行業(yè)實(shí)踐的方方面面[36]。

      百分點(diǎn)集團(tuán)首席數(shù)據(jù)科學(xué)家杜曉夢(mèng)做了題為《數(shù)據(jù)智能與行業(yè)應(yīng)用》的報(bào)告,認(rèn)為大數(shù)據(jù)、人工智能等新一代信息技術(shù)在公共安全、能源監(jiān)測(cè)、金融安全、零售預(yù)測(cè)等行業(yè)均具有重要的應(yīng)用價(jià)值,促進(jìn)了各行各業(yè)的智能決策與實(shí)踐發(fā)展。此外,大數(shù)據(jù)分析可將單點(diǎn)的、局部的、低水平的數(shù)據(jù)加工成具有應(yīng)用深度與廣度的數(shù)據(jù),驅(qū)動(dòng)了企業(yè)的精準(zhǔn)營(yíng)銷、智能推薦、智慧決策、智慧服務(wù)。

      華為大數(shù)據(jù)科學(xué)家孔柏林做了題為《華為大數(shù)據(jù)分析與應(yīng)用實(shí)踐》的報(bào)告,認(rèn)為大數(shù)據(jù)在企業(yè)業(yè)務(wù)運(yùn)營(yíng)、用戶洞察、廣告投放、搜索、個(gè)性化推薦、產(chǎn)品體驗(yàn)改進(jìn)等場(chǎng)景得到了廣泛應(yīng)用,推進(jìn)了數(shù)據(jù)賦能型企業(yè)的數(shù)據(jù)資源化、數(shù)據(jù)資產(chǎn)化和數(shù)據(jù)資本化,激活數(shù)據(jù)價(jià)值釋放,促進(jìn)了企業(yè)數(shù)字化轉(zhuǎn)型和智能化管理決策。

      4 大數(shù)據(jù)安全

      大數(shù)據(jù)在為各領(lǐng)域、各行業(yè)提供可用信息、管理決策依據(jù)的同時(shí),也給信息安全帶來(lái)了新的挑戰(zhàn),隱私侵權(quán)、數(shù)據(jù)泄露、平臺(tái)壟斷、虛假信息等問(wèn)題層出不窮,日益成為威脅個(gè)人權(quán)利、行業(yè)發(fā)展和國(guó)家安全的重要問(wèn)題[37],因此對(duì)大數(shù)據(jù)時(shí)代下的安全保密現(xiàn)狀及其防范實(shí)踐進(jìn)行探究已成為學(xué)界和業(yè)界共同關(guān)注的話題。

      4.1 鄧勝利:大數(shù)據(jù)安全與保密

      大數(shù)據(jù)時(shí)代模糊了密與非密的界限、改變了“?!迸c“放”的范圍、泄“密”渠道愈加多樣化,為安全保密工作帶來(lái)了挑戰(zhàn)[38]。

      大數(shù)據(jù)環(huán)境下信息化應(yīng)用的普及和數(shù)據(jù)關(guān)聯(lián)挖掘技術(shù)的成熟大大增加了數(shù)據(jù)安全風(fēng)險(xiǎn),個(gè)人隱私、商業(yè)秘密、國(guó)家秘密安全受到巨大挑戰(zhàn),失泄密事件涌現(xiàn),保密工作面臨著嚴(yán)峻形勢(shì)。例如,美國(guó)啟動(dòng)了棱鏡計(jì)劃、上游計(jì)劃等項(xiàng)目,通過(guò)直接讀取微軟、谷歌、蘋果等網(wǎng)絡(luò)巨頭的數(shù)據(jù)庫(kù)和監(jiān)控骨干網(wǎng)絡(luò)流量,獲取互聯(lián)網(wǎng)用戶的電子郵件、聊天日志、搜索記錄、網(wǎng)絡(luò)社交等數(shù)據(jù),經(jīng)過(guò)深入的大數(shù)據(jù)關(guān)聯(lián)分析,洞察到隱藏在大數(shù)據(jù)表象背后的重要情報(bào),對(duì)我國(guó)公共數(shù)據(jù)安全乃至國(guó)家信息安全造成巨大危害[39],因此,應(yīng)構(gòu)建集人防、物防、技防于一體的安全保密綜合防護(hù)體系,從保密人才隊(duì)伍建設(shè)、宣傳教育培訓(xùn)、保密監(jiān)督檢查等角度采取防范措施,以降低失泄密風(fēng)險(xiǎn)和減少不必要的損失。

      4.2 姚克樹:基于大數(shù)據(jù)應(yīng)用的企業(yè)安全管理實(shí)踐

      大數(shù)據(jù)技術(shù)具備對(duì)分散信息進(jìn)行收集、定向挖掘、邏輯推導(dǎo)和綜合分析等特點(diǎn),易導(dǎo)致敏感信息的提取及重要數(shù)據(jù)泄露,可能對(duì)安全保密工作造成重大影響和威脅[40],因此進(jìn)行安全保密防范實(shí)踐、搭建數(shù)據(jù)安全管理體系已成為企業(yè)持續(xù)發(fā)展的必要之舉。

      《信息安全技術(shù)——大數(shù)據(jù)安全管理指南》規(guī)定了職責(zé)明確原則、意圖合規(guī)原則、質(zhì)量保障原則、數(shù)據(jù)最小化原則、責(zé)任不隨數(shù)據(jù)轉(zhuǎn)移原則、最小授權(quán)原則、數(shù)據(jù)保護(hù)原則、可審計(jì)原則等原則,明確了數(shù)據(jù)分類分級(jí)、大數(shù)據(jù)活動(dòng)安全規(guī)范、大數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估等要求,為企業(yè)做好大數(shù)據(jù)安全管理提供了依據(jù)和準(zhǔn)繩。在此背景下,企業(yè)需構(gòu)建集多級(jí)數(shù)字化管控、信息化管理、數(shù)字化基礎(chǔ)支撐環(huán)境等于一體的信息安全管理體系,做好業(yè)務(wù)功能、客商管理、合同管理、生產(chǎn)管理等全領(lǐng)域、全環(huán)節(jié)的大數(shù)據(jù)安全管理工作,實(shí)現(xiàn)安全大數(shù)據(jù)的及時(shí)獲取、實(shí)時(shí)分析、風(fēng)險(xiǎn)評(píng)估、風(fēng)險(xiǎn)預(yù)警和應(yīng)急解決等目標(biāo)。

      5 大數(shù)據(jù)治理

      大數(shù)據(jù)治理是用數(shù)據(jù)說(shuō)話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新的管理機(jī)制。大數(shù)據(jù)治理在所有權(quán)層面做出權(quán)責(zé)安排,主要體現(xiàn)為決策機(jī)制、激勵(lì)與約束機(jī)制、監(jiān)督機(jī)制[41],這些有助于規(guī)范數(shù)據(jù)應(yīng)用、防范數(shù)據(jù)風(fēng)險(xiǎn)、解決數(shù)據(jù)安全問(wèn)題。相關(guān)學(xué)者聚焦大數(shù)據(jù)治理標(biāo)準(zhǔn)化路徑框架構(gòu)建、政府大數(shù)據(jù)協(xié)同治理、“智能+”背景下的數(shù)據(jù)治理等進(jìn)行了大數(shù)據(jù)治理方向的探討。

      5.1 安小米:大數(shù)據(jù)治理前沿理論與實(shí)踐

      通過(guò)綜合集成不同大數(shù)據(jù)治理定義中的核心概念,發(fā)現(xiàn)對(duì)大數(shù)據(jù)治理的認(rèn)識(shí)存在三個(gè)層次[42]:①宏觀層,即多維度考慮大數(shù)據(jù)治理活動(dòng)要素及其要素關(guān)系,進(jìn)而構(gòu)建概念體系和體系框架;②中觀層,包括業(yè)務(wù)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)、信息治理計(jì)劃、數(shù)據(jù)全面質(zhì)量管理的部署;③微觀層,包括管理策略和過(guò)程、測(cè)評(píng)數(shù)據(jù)質(zhì)量和數(shù)據(jù)的可用性、技術(shù)工具應(yīng)用的大數(shù)據(jù)治理行為。

      構(gòu)建數(shù)據(jù)治理標(biāo)準(zhǔn)化路徑框架,對(duì)整體提升國(guó)家治理體系和治理能力現(xiàn)代化建設(shè)水平具有重要戰(zhàn)略意義和學(xué)術(shù)價(jià)值。安教授研究團(tuán)隊(duì)對(duì)三大國(guó)際權(quán)威標(biāo)準(zhǔn)組織ISO、IEC、ITU-T發(fā)布的標(biāo)準(zhǔn)文件中關(guān)于數(shù)據(jù)治理的核心概念進(jìn)行分析,從多維度(數(shù)字政府、數(shù)字經(jīng)濟(jì)、數(shù)字社會(huì))和多層級(jí)(宏觀、中觀和微觀)歸納了美國(guó)和歐盟數(shù)據(jù)治理標(biāo)準(zhǔn)化協(xié)同路徑的實(shí)施方案[43],構(gòu)建出面向數(shù)字政府、數(shù)字經(jīng)濟(jì)和數(shù)字社會(huì)的數(shù)據(jù)治理標(biāo)準(zhǔn)化協(xié)同路徑分析模型。這有助于推動(dòng)我國(guó)構(gòu)建數(shù)字治理標(biāo)準(zhǔn)化協(xié)同戰(zhàn)略,促進(jìn)多元主體共同參與數(shù)據(jù)治理標(biāo)準(zhǔn)建設(shè)。

      5.2 張會(huì)平:政府?dāng)?shù)據(jù)流動(dòng)的方式:共享、開放與授權(quán)運(yùn)營(yíng)

      國(guó)家和地方層面正在加快部署推進(jìn)政府?dāng)?shù)據(jù)流動(dòng),讓政府?dāng)?shù)據(jù)有序進(jìn)入市場(chǎng)是政府?dāng)?shù)據(jù)賦能數(shù)字經(jīng)濟(jì)升級(jí)的起點(diǎn)[44]。我國(guó)政府?dāng)?shù)據(jù)流動(dòng)的方式主要有三種:①政府?dāng)?shù)據(jù)共享,包括因履行職責(zé)需要使用其他政府部門數(shù)據(jù)和為其他政府部門提供本部門數(shù)據(jù)的行為;②政府?dāng)?shù)據(jù)開放,指政府在可允許開放的數(shù)據(jù)范圍內(nèi)(不涉及國(guó)家秘密、商業(yè)秘密和個(gè)人隱私),面向社會(huì)提供原始性、可機(jī)器讀取、可供社會(huì)化再利用的數(shù)據(jù)集的公共服務(wù);③政府?dāng)?shù)據(jù)授權(quán)運(yùn)營(yíng),即政府授權(quán)一定主體通過(guò)市場(chǎng)化方式運(yùn)營(yíng)政府?dāng)?shù)據(jù),促成外部主體的使用。目前,政府?dāng)?shù)據(jù)流動(dòng)面臨共享動(dòng)力不足、數(shù)據(jù)開放有限、政府?dāng)?shù)據(jù)授權(quán)運(yùn)營(yíng)沒(méi)有形成共識(shí)等表層困境,以及數(shù)據(jù)權(quán)屬不清、層級(jí)之間相互掣肘、流動(dòng)組織不成體系等深層困境[45],可以從協(xié)同確立政府?dāng)?shù)據(jù)權(quán)屬、以縱向協(xié)同聯(lián)動(dòng)橫向協(xié)同、協(xié)同推進(jìn)三種流動(dòng)方式等方面推進(jìn)政府?dāng)?shù)據(jù)流動(dòng)協(xié)同治理。

      5.3 學(xué)員論壇:“智能+”背景下的數(shù)據(jù)治理

      趙楊教授主持了該學(xué)員論壇,學(xué)員以小組合作和主題匯報(bào)的方式,聚焦企業(yè)數(shù)據(jù)治理、在線健康數(shù)據(jù)治理、信息資源數(shù)據(jù)治理等話題,圍繞各領(lǐng)域數(shù)據(jù)治理的問(wèn)題不足、優(yōu)化措施等維度,對(duì)“智能+”背景下的數(shù)據(jù)治理進(jìn)行了闡述。趙楊教授認(rèn)為在人工智能技術(shù)的賦能下,數(shù)據(jù)治理呈現(xiàn)出數(shù)據(jù)內(nèi)容更加豐富、數(shù)據(jù)處理更加快捷、數(shù)據(jù)管理更加高效、數(shù)據(jù)決策更加科學(xué)、數(shù)據(jù)服務(wù)更加精準(zhǔn)等新特征,因此應(yīng)重點(diǎn)從加強(qiáng)頂層設(shè)計(jì)、推進(jìn)依法治數(shù)、打破數(shù)據(jù)壁壘、強(qiáng)化風(fēng)險(xiǎn)防控以及注重技術(shù)創(chuàng)新等方面來(lái)推進(jìn)人工智能背景下數(shù)據(jù)治理工作的開展[46]。

      5.4 學(xué)員論壇:數(shù)據(jù)智能驅(qū)動(dòng)的管理決策

      特聘副研究員張帆、副教授黃永主持“數(shù)據(jù)智能驅(qū)動(dòng)的管理決策”學(xué)員論壇,引導(dǎo)學(xué)員聚焦場(chǎng)景、問(wèn)題、方法、應(yīng)用四個(gè)方面展開匯報(bào)。①在場(chǎng)景方面,學(xué)員圍繞智能閱讀、智能檔案、智能醫(yī)療、智能駕駛等場(chǎng)景展開匯報(bào);②在問(wèn)題方面,學(xué)員分享了算法歧視、算法綁架、算法趨同、信息堵塞、重復(fù)數(shù)據(jù)、數(shù)據(jù)缺失、虛擬數(shù)據(jù)等數(shù)據(jù)治理問(wèn)題;③在方法方面,學(xué)員分享了戰(zhàn)略坐標(biāo)圖、神經(jīng)網(wǎng)絡(luò)算法、圖表示學(xué)習(xí)、圖嵌入、知識(shí)圖譜等數(shù)據(jù)分析方法;④在應(yīng)用方面,學(xué)員分享了大數(shù)據(jù)在企業(yè)管理、金融投資(例如華為云系統(tǒng)化投資平臺(tái)——Fathom)、臨床輔助決策(例如百度靈醫(yī)智惠CDSS臨床輔助決策支持系統(tǒng))、政府管理決策(例如成都“數(shù)據(jù)-決策一體化”建設(shè))等不同領(lǐng)域的具體應(yīng)用。兩位老師提出應(yīng)該從加強(qiáng)數(shù)據(jù)治理立法建設(shè)、完善數(shù)據(jù)市場(chǎng)機(jī)制、構(gòu)建數(shù)據(jù)協(xié)同治理體系框架、提高公民信息安全素養(yǎng)等角度進(jìn)行數(shù)據(jù)治理,在保障數(shù)據(jù)安全的基礎(chǔ)上促進(jìn)數(shù)據(jù)價(jià)值釋放,驅(qū)動(dòng)數(shù)智管理決策和數(shù)字經(jīng)濟(jì)可持續(xù)發(fā)展。

      6 大數(shù)據(jù)學(xué)科建設(shè)

      計(jì)算機(jī)科學(xué)家、圖靈獎(jiǎng)獲得者Peter Naur于1974年首次提出數(shù)據(jù)科學(xué)(Data Science)概念,他認(rèn)為數(shù)據(jù)科學(xué)是一門基于數(shù)據(jù)處理的科學(xué)[47]。快速發(fā)展的數(shù)字化社會(huì)面臨著數(shù)據(jù)科學(xué)專門人才和具備數(shù)據(jù)素養(yǎng)的其他人才的巨大缺口[48],大數(shù)據(jù)學(xué)科建設(shè)成為時(shí)代之急需。大數(shù)據(jù)學(xué)科建設(shè)一方面強(qiáng)調(diào)理論探討,回應(yīng)數(shù)據(jù)科學(xué)的內(nèi)涵、外延和建設(shè)實(shí)踐等問(wèn)題,另一方面注重?cái)?shù)智化時(shí)代的信息系統(tǒng)實(shí)證研究方法的培訓(xùn)和科研實(shí)踐。

      6.1 吳丹:以人為本的數(shù)據(jù)科學(xué)教育

      數(shù)據(jù)科學(xué)是一門具有跨學(xué)科屬性的科學(xué),其核心問(wèn)題是從數(shù)據(jù)中提取知識(shí)以獲得對(duì)問(wèn)題或現(xiàn)象的重要見解,涉及收集、管理、分析、呈現(xiàn)等大數(shù)據(jù)生命周期全部方面的理論、方法和技術(shù)。數(shù)據(jù)科學(xué)的工作范式涵蓋了解問(wèn)題、收集和集成原始數(shù)據(jù)、根據(jù)數(shù)據(jù)創(chuàng)建和選擇模型、測(cè)試部署模型、結(jié)果可視化、撰寫報(bào)告等流程,已廣泛應(yīng)用于教育、零售、醫(yī)學(xué)等領(lǐng)域。

      基于德爾菲法對(duì)數(shù)據(jù)科學(xué)教育進(jìn)行特征分析,發(fā)現(xiàn)“以人為本”是數(shù)據(jù)科學(xué)教育的核心特征,而“以人為本”的數(shù)據(jù)科學(xué)教育需要落腳在注重?cái)?shù)據(jù)意識(shí)與數(shù)據(jù)素養(yǎng)的塑造、以問(wèn)題與情境作為解決數(shù)據(jù)問(wèn)題的驅(qū)動(dòng)、建構(gòu)可持續(xù)可解釋的數(shù)據(jù)解決方案三個(gè)方面[49]。吳丹教授研究團(tuán)隊(duì)在收集并分析來(lái)自全球iField學(xué)校的96個(gè)數(shù)據(jù)科學(xué)研究生課程信息的基礎(chǔ)上,構(gòu)建了以人為中心的數(shù)據(jù)科學(xué)研究生課程模型,涵蓋數(shù)據(jù)驅(qū)動(dòng)的方法和技術(shù),領(lǐng)域知識(shí),數(shù)據(jù)法律、道德和倫理,個(gè)人特質(zhì)的塑造和發(fā)展四個(gè)方面[50]。

      6.2 羅欣:數(shù)智化時(shí)代的信息系統(tǒng)實(shí)證研究方法

      羅欣教授介紹了提出問(wèn)題、文獻(xiàn)綜述、確定理論、選擇研究方法、數(shù)據(jù)收集與分析、撰寫文章等科研規(guī)范流程,總結(jié)了偏好同質(zhì)化分析方法、盲目追求過(guò)新研究主題等常見研究誤區(qū)。好的理論具有邏輯嚴(yán)密性、可解釋性、簡(jiǎn)潔性、可證偽性等特點(diǎn),理論的選擇需要解釋某一研究問(wèn)題的獨(dú)特性和普遍性,并最終回歸現(xiàn)實(shí)問(wèn)題的解決。

      學(xué)員通過(guò)小組匯報(bào)的方式,從研究方法、研究思路、理論支撐、模型構(gòu)建、數(shù)據(jù)收集、數(shù)據(jù)分析等方面分享了論文閱讀心得。羅教授進(jìn)行了總結(jié)與展望,強(qiáng)調(diào)采用多元研究方法和數(shù)據(jù)來(lái)源、收集充分的實(shí)驗(yàn)數(shù)據(jù)、選擇恰當(dāng)?shù)难芯繉?duì)象、注意不同子研究的銜接性等在科研實(shí)踐中需要考慮的問(wèn)題。

      7 結(jié)語(yǔ)

      為期6天的“大數(shù)據(jù)管理與應(yīng)用”暑期學(xué)校以多元的教學(xué)形式、豐富的學(xué)術(shù)交流活動(dòng)向?qū)W員和學(xué)者展示了大數(shù)據(jù)學(xué)科的研究特點(diǎn)和發(fā)展動(dòng)向,幫助學(xué)員開闊了學(xué)術(shù)視野,為學(xué)者搭建了一個(gè)學(xué)術(shù)交流的高質(zhì)平臺(tái),有助于促進(jìn)學(xué)者面向國(guó)家戰(zhàn)略需要,在信息資源管理學(xué)科基礎(chǔ)上,守正創(chuàng)新,繼續(xù)開展大數(shù)據(jù)技術(shù)與計(jì)算社會(huì)科學(xué)發(fā)展、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)安全、大數(shù)據(jù)治理、大數(shù)據(jù)學(xué)科建設(shè)等研究,不斷拓展大數(shù)據(jù)學(xué)科的研究領(lǐng)域與視野,創(chuàng)新大數(shù)據(jù)學(xué)科的研究方向、主題、方法與技術(shù),推動(dòng)數(shù)據(jù)科學(xué)領(lǐng)域研究的創(chuàng)新發(fā)展,為大數(shù)據(jù)的學(xué)術(shù)研究與教育發(fā)展持續(xù)作出貢獻(xiàn)。

      崇明县| 合水县| 葫芦岛市| 洱源县| 黑河市| 临湘市| 文化| 博爱县| 谢通门县| 平舆县| 万荣县| 如皋市| 晋州市| 花莲市| 石河子市| 深泽县| 淳化县| 舞阳县| 濉溪县| 宜都市| 大田县| 疏勒县| 焦作市| 新蔡县| 南郑县| 浦城县| 剑河县| 道真| 台中县| 澄城县| 常德市| 新巴尔虎左旗| 二连浩特市| 阳泉市| 永登县| 西丰县| 河西区| 疏附县| 五河县| 小金县| 沾化县|