劉靜羽 黃金霞 王昉
(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,北京 100190)
隨著科技發(fā)展和科技競(jìng)爭(zhēng)的加劇,科技情報(bào)和信息資源為科技發(fā)展提供保障與支撐作用的戰(zhàn)略價(jià)值日益凸顯[1]。當(dāng)前,國(guó)內(nèi)外形勢(shì)的變化,對(duì)戰(zhàn)略情報(bào)事業(yè)發(fā)展的要求不斷提高,開放信息環(huán)境的變化和愈加激烈的國(guó)際競(jìng)爭(zhēng)態(tài)勢(shì)給戰(zhàn)略情報(bào)事業(yè)帶來(lái)更大挑戰(zhàn)[2]。戰(zhàn)略情報(bào)事業(yè)的發(fā)展離不開高質(zhì)量的資源保障體系的支持,從世界高端智庫(kù)的建設(shè)實(shí)踐看,專業(yè)的數(shù)據(jù)中心能夠?yàn)榍閳?bào)分析提供強(qiáng)有力的信息支撐,因此信息化和數(shù)據(jù)資源將是未來(lái)智庫(kù)的重要特色之一,也符合當(dāng)前大數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新服務(wù)的時(shí)代要求。圖書館因其收藏有豐富的信息資源,是為智庫(kù)提供決策信息支持的重要保障機(jī)構(gòu)之一。
我國(guó)科技戰(zhàn)略情報(bào)事業(yè)發(fā)展態(tài)勢(shì)迅猛,有效地支撐了科技創(chuàng)新和政府決策,但因起步較晚,仍面臨數(shù)據(jù)獲取和利用等一些關(guān)鍵問題,包括缺乏統(tǒng)一的智庫(kù)相關(guān)數(shù)據(jù)的系統(tǒng)和獲取平臺(tái)、數(shù)據(jù)仍以文獻(xiàn)為主且呈現(xiàn)類型單一、數(shù)據(jù)管理工作不規(guī)范且缺乏共享、數(shù)據(jù)融合與研發(fā)能力不足、缺乏數(shù)據(jù)分析工具資源等。但是,關(guān)聯(lián)數(shù)據(jù)、情報(bào)計(jì)量與可視化技術(shù)、數(shù)字資源長(zhǎng)期保存技術(shù)等為新型智庫(kù)提供科學(xué)、系統(tǒng)的技術(shù)支持,更多類型的資源和工具的涌現(xiàn)也為智庫(kù)發(fā)展提供了數(shù)據(jù)基礎(chǔ)。
事實(shí)證明,只有建立高效、安全、高質(zhì)量的資源保障體系才能提升國(guó)家戰(zhàn)略情報(bào)工作實(shí)力。國(guó)家科技圖書文獻(xiàn)中心在其“十四五”規(guī)劃中明確提出,要加強(qiáng)立體化的數(shù)字資源保障建設(shè),增加智庫(kù)報(bào)告、年鑒、進(jìn)展、綜述、述評(píng)等三次文獻(xiàn)的采集[3]。作為國(guó)家科技戰(zhàn)略情報(bào)信息的重要保障力量,圖書館應(yīng)從國(guó)際形勢(shì)、國(guó)家對(duì)戰(zhàn)略情報(bào)的需要、戰(zhàn)略情報(bào)事業(yè)的發(fā)展、國(guó)內(nèi)外同行的競(jìng)爭(zhēng)、開放學(xué)術(shù)交流體系發(fā)展對(duì)戰(zhàn)略情報(bào)的需求等方面考慮,盡快構(gòu)建支撐戰(zhàn)略情報(bào)的數(shù)字資源保障體系,增加科技戰(zhàn)略與政策類、科技管理類、科研投入與產(chǎn)出類、科學(xué)領(lǐng)域前沿類、決策咨詢建議類等新型智庫(kù)支撐資源,并通過與其他科技資源、文獻(xiàn)資源的關(guān)聯(lián)組織和分析挖掘,實(shí)現(xiàn)各類數(shù)字資源的關(guān)聯(lián)揭示、情景敏感和一站式服務(wù),嘗試提供適應(yīng)決策流程的資源組織揭示,從國(guó)家層面提升資源建設(shè)水平和服務(wù)能力。
化柏林等[4]對(duì)數(shù)據(jù)環(huán)境下的科技情況資源保障體系進(jìn)行研究,回顧了目前世界主要國(guó)家的科技文獻(xiàn)資源建設(shè)情況,包括美國(guó)國(guó)防技術(shù)信息中心(DTIC)、全俄科學(xué)技術(shù)信息研究所(VINITI)、英國(guó)國(guó)防科技研究院知識(shí)服務(wù)部(DSIL)、法國(guó)武器文獻(xiàn)中心(CEDOCAR)、德國(guó)卡爾斯魯厄科學(xué)技術(shù)專業(yè)信息中心(FIZ)、日本科技振興機(jī)構(gòu)(JST)、加拿大科技信息研究所(CISTI)、印度國(guó)家科學(xué)交流與信息資源研究所(NISCAIR)等機(jī)構(gòu),并將其主要建設(shè)特點(diǎn)歸納為以下4個(gè)方面:①數(shù)字資源比重逐年增加、深加工資源獲取受到更大重視、力求以多種方式支撐信息獲取能力;②資源種類包括政府部門指令、預(yù)算信息、專利和專利應(yīng)用、研究和研究會(huì)議論文集、技術(shù)報(bào)告、會(huì)議資料、公共資料、征求意見報(bào)告、權(quán)威數(shù)據(jù)庫(kù)、引進(jìn)和加工電子型信息資源;③資源獲取方式以購(gòu)買為主;④資源組織方面,重視加工整理自產(chǎn)信息、開發(fā)科研科技數(shù)據(jù)庫(kù)、細(xì)化組織加工粒度、挖掘深層次信息、建立數(shù)字倉(cāng)儲(chǔ)等??傮w來(lái)看,各個(gè)機(jī)構(gòu)都非常注重加強(qiáng)多類型資源的保障,以及對(duì)于情報(bào)信息的精加工分析。
共建共享是科技情報(bào)資源保障體系的一個(gè)重要方面。21世紀(jì)初,為了不斷盤活現(xiàn)有資源價(jià)值,美國(guó)政府將不同情報(bào)機(jī)構(gòu)的信息數(shù)據(jù)整合成共建共享的數(shù)據(jù)庫(kù),如恐怖分子篩選數(shù)據(jù)庫(kù)(Terrorist Screening Database)以及國(guó)家情報(bào)圖書館(Library of National Intelligence)的信息共享環(huán)境(ISE)項(xiàng)目。ISE項(xiàng)目的目標(biāo)是實(shí)現(xiàn)國(guó)防、情報(bào)、國(guó)土安全、外交和執(zhí)法五大領(lǐng)域反恐信息的共享,從技術(shù)平臺(tái)、政策規(guī)范、程序、綱領(lǐng)、信息系統(tǒng)、架構(gòu)標(biāo)信等方面整合和協(xié)同已有的信息資源[5]。
建立專題數(shù)據(jù)庫(kù)是當(dāng)前戰(zhàn)略科技情報(bào)資源保障體系的重要內(nèi)容。在歐洲,德國(guó)國(guó)際政治與安全事務(wù)研究所(Stiftung Wissenschaft und Politik,SWP)按國(guó)家和地區(qū)劃分研究領(lǐng)域,形成覆蓋歐盟及其成員國(guó)領(lǐng)域、美洲領(lǐng)域、亞洲領(lǐng)域等專題數(shù)據(jù)庫(kù)。歐洲最大的國(guó)際關(guān)系研究資源庫(kù)“世界事務(wù)在線”(World Affairs Online,WAO),包含公共文獻(xiàn)工具、參考書目、新聞報(bào)道、學(xué)術(shù)報(bào)告等多種類型資源,并建立事實(shí)資料庫(kù)管理系統(tǒng),長(zhǎng)期維護(hù)[6]。
黃曉斌等[7]詳細(xì)調(diào)研了全球領(lǐng)先智庫(kù)蘭德公司的戰(zhàn)略情報(bào)資源保障體系情況,筆者認(rèn)為上述研究中提到的蘭德公司戰(zhàn)略情報(bào)資源保障體系所具備的特點(diǎn),值得我國(guó)參考。
(1)支撐戰(zhàn)略決策的數(shù)據(jù)信息體系中的各要素有機(jī)統(tǒng)一。支撐戰(zhàn)略情報(bào)的數(shù)據(jù)信息體系,一般包括數(shù)據(jù)信息需求、外源數(shù)據(jù)、自主開發(fā)專題數(shù)據(jù)信息庫(kù)、科學(xué)智能的數(shù)據(jù)信息搜集支撐方法和工具、數(shù)據(jù)加工分析人才隊(duì)伍。只有實(shí)現(xiàn)上述各要素的有機(jī)統(tǒng)一和良性互動(dòng),才能更好地支撐戰(zhàn)略決策。
(2)擁有“寬領(lǐng)域”“雙向綜合”“項(xiàng)目導(dǎo)向”的領(lǐng)域數(shù)據(jù)體系。蘭德公司針對(duì)不同的領(lǐng)域建立了較為完備的決策數(shù)據(jù)體系,能夠較好地響應(yīng)和支持不同項(xiàng)目的數(shù)據(jù)信息資源需求。
“寬領(lǐng)域”指的是蘭德公司的決策數(shù)據(jù)來(lái)源全面、類型豐富。蘭德公司通過直接獲取與間接獲取相結(jié)合的方式獲取數(shù)據(jù),直接獲取指開發(fā)多方式調(diào)查能力系統(tǒng)(MMIC)、組合分析工具(PAT)直接針對(duì)需求采集和積累數(shù)據(jù),間接獲取指通過其他渠道獲取數(shù)據(jù)。其數(shù)據(jù)類型主要包括3類:①數(shù)據(jù)資源類,主要包括內(nèi)外部數(shù)據(jù)資源,如自建數(shù)據(jù)資源、商業(yè)數(shù)據(jù)資源等;②項(xiàng)目資源類,主要包括調(diào)研數(shù)據(jù)、一次數(shù)據(jù)、二次數(shù)據(jù)等;③產(chǎn)品數(shù)據(jù)類,蘭德公司所開展的項(xiàng)目,其產(chǎn)生的各類數(shù)據(jù)產(chǎn)品也隨之轉(zhuǎn)化為戰(zhàn)略決策支撐體系的重要數(shù)據(jù)來(lái)源之一。
“雙向綜合”指的是以用戶需求為重點(diǎn),同時(shí)利用媒體平臺(tái)和數(shù)據(jù)共享平臺(tái),以開放的方式完善數(shù)據(jù)體系。另外,與多方合作建設(shè)信息資源,包括與經(jīng)濟(jì)信息中心、專業(yè)調(diào)查機(jī)構(gòu)、學(xué)術(shù)研究機(jī)構(gòu)等合作共建數(shù)據(jù)庫(kù),或者購(gòu)買數(shù)據(jù)資源,保證數(shù)據(jù)流通和變現(xiàn)。
“項(xiàng)目導(dǎo)向”指的是蘭德公司根據(jù)不同研究主題內(nèi)設(shè)10多個(gè)研究機(jī)構(gòu),每個(gè)研究機(jī)構(gòu)下根據(jù)學(xué)科特色細(xì)分為不同的研究項(xiàng)目,針對(duì)項(xiàng)目需求建設(shè)具有自身特色的信息資源。如蘭德公司為美國(guó)國(guó)家安全調(diào)查部開發(fā)的恐怖事件數(shù)據(jù)庫(kù)(RDWTI),已對(duì)4萬(wàn)多起恐怖事件進(jìn)行了編碼和詳細(xì)說明,并提供了與反恐相關(guān)的系統(tǒng)信息。
支撐科技戰(zhàn)略情報(bào)的資源保障體系,其建設(shè)目標(biāo)主要是服務(wù)于國(guó)家層面的科技決策。該體系應(yīng)以“知識(shí)體系”為核心,充分涵蓋高質(zhì)量的科技文獻(xiàn),包括論文與專利數(shù)據(jù)、科研規(guī)劃與基金項(xiàng)目數(shù)據(jù)、科技管理與科研投入產(chǎn)出數(shù)據(jù)、科學(xué)領(lǐng)域前沿趨勢(shì)數(shù)據(jù)、重要人才發(fā)現(xiàn)基礎(chǔ)數(shù)據(jù)、科研機(jī)構(gòu)數(shù)據(jù)、科研裝備與設(shè)施數(shù)據(jù)、領(lǐng)域關(guān)鍵技術(shù)數(shù)據(jù)、科技輿情監(jiān)測(cè)數(shù)據(jù)、重要社會(huì)經(jīng)濟(jì)發(fā)展數(shù)據(jù)等科技大數(shù)據(jù)資源。同時(shí),在資源保障的基礎(chǔ)上,綜合應(yīng)用深度學(xué)習(xí)、知識(shí)圖譜等技術(shù),實(shí)現(xiàn)人才、文獻(xiàn)、關(guān)鍵技術(shù)清單等多元數(shù)據(jù)的高度關(guān)聯(lián)和融合,完成文獻(xiàn)內(nèi)容中“作者與科學(xué)家”的貫通、關(guān)鍵技術(shù)問題與關(guān)鍵科學(xué)問題的貫通、關(guān)鍵問題與關(guān)鍵機(jī)構(gòu)及人才的貫通、前沿技術(shù)與創(chuàng)新產(chǎn)業(yè)的貫通,以實(shí)現(xiàn)基于數(shù)據(jù)的快速抽取、實(shí)時(shí)分析,以輔助戰(zhàn)略決策。
參考國(guó)內(nèi)外做法,本研究構(gòu)建了支撐科技戰(zhàn)略情報(bào)的資源保障體系(見圖1)。資源保障體系主要包括3個(gè)層次的內(nèi)容。
圖1 科技戰(zhàn)略情報(bào)資源保障體系
(1)數(shù)據(jù)需求層??萍紤?zhàn)略情報(bào)資源保障體系應(yīng)充分重視并注意及時(shí)收集科技戰(zhàn)略決策用戶主動(dòng)提出的數(shù)據(jù)需求;同時(shí),情報(bào)分析人員也應(yīng)通過多種渠道調(diào)研、發(fā)現(xiàn)盡可能多的數(shù)據(jù)需求,以補(bǔ)充用戶需求和需要,并進(jìn)行資源的遴選。在遴選基礎(chǔ)上,資源保障體系則通過數(shù)據(jù)采集、數(shù)據(jù)購(gòu)買的方式獲取相關(guān)數(shù)據(jù)。
(2)數(shù)據(jù)內(nèi)容層。數(shù)據(jù)內(nèi)容層是科技戰(zhàn)略情報(bào)資源保障體系的核心模塊。結(jié)合當(dāng)前國(guó)內(nèi)圖書情報(bào)機(jī)構(gòu)實(shí)際,科技戰(zhàn)略情報(bào)資源體系內(nèi)容的構(gòu)建要充分整合已有資源和符合新需求的資源。在資源整合的基礎(chǔ)上,重點(diǎn)圍繞科技情報(bào)事業(yè)發(fā)展現(xiàn)狀和需要,從數(shù)據(jù)層面按類別進(jìn)行梳理,將原有的各類信息打散重組成能夠支撐科技戰(zhàn)略情報(bào)分析的不同數(shù)據(jù)集,形成情報(bào)分析工作所需的高質(zhì)量“原材料”,包括高質(zhì)量論文、專利數(shù)據(jù)、人才數(shù)據(jù)、項(xiàng)目數(shù)據(jù)、科研管理數(shù)據(jù)等。
(3)工具機(jī)制層。該模塊為數(shù)據(jù)內(nèi)容層的建設(shè)提供工具和機(jī)制的支持,包括提供數(shù)據(jù)信息搜集分析的工具,以及打通數(shù)據(jù)獲取的合作、購(gòu)買渠道等,從而保障整個(gè)科技戰(zhàn)略情報(bào)保障體系的運(yùn)行。
建設(shè)科技戰(zhàn)略情報(bào)資源保障體系,則需要從4個(gè)方面著手,即加強(qiáng)“雙向綜合”的數(shù)據(jù)需求獲取與分析機(jī)制建設(shè)、“寬領(lǐng)域”的基礎(chǔ)來(lái)源數(shù)據(jù)體系建設(shè)、科學(xué)智能與綜合多元的工具機(jī)制建設(shè),以及多元化的數(shù)據(jù)資源獲取渠道建設(shè)。
2.2.1 “雙向綜合”的數(shù)據(jù)需求獲取與分析機(jī)制建設(shè)
一方面,根據(jù)不同的決策目標(biāo)和領(lǐng)域,設(shè)立需求獲取與分析的不同的項(xiàng)目組,配備相應(yīng)的人員,直接獲取決策層的數(shù)據(jù)需求。另一方面,開發(fā)多種科技戰(zhàn)略決策需求調(diào)查與分析工具,定期收集分析國(guó)家和機(jī)構(gòu)科技發(fā)展規(guī)劃、重大項(xiàng)目任務(wù)等,推進(jìn)關(guān)于數(shù)據(jù)體系的研究。數(shù)據(jù)需求分析和研究成果,由項(xiàng)目組上報(bào)至決策層。綜合以上雙向互動(dòng)內(nèi)容,明確并不斷更新決策數(shù)據(jù)體系目標(biāo)。
2.2.2 “寬領(lǐng)域”的基礎(chǔ)來(lái)源數(shù)據(jù)體系建設(shè)
支撐科技戰(zhàn)略情報(bào)資源保障體系應(yīng)以實(shí)現(xiàn)各類決策場(chǎng)景為目標(biāo),遴選、獲取、整合、利用機(jī)構(gòu)已有基礎(chǔ)數(shù)據(jù)和外部數(shù)據(jù)資源,并結(jié)合開發(fā)專題數(shù)據(jù)信息庫(kù)形式,建立全面豐富、權(quán)威可靠的基礎(chǔ)來(lái)源數(shù)據(jù)體系。重點(diǎn)建設(shè)9類數(shù)據(jù),主要內(nèi)容與建設(shè)方法如下。
(1)高質(zhì)量論文與專利數(shù)據(jù)。研究型論文與專利在目前依然是科研成果發(fā)布和交流的主要途徑,提供高質(zhì)量、可信賴的內(nèi)容是國(guó)際學(xué)術(shù)交流平臺(tái)建設(shè)的一個(gè)永恒主題[8]。同時(shí),專利數(shù)據(jù)對(duì)于分析和預(yù)警專利侵權(quán)風(fēng)險(xiǎn)、識(shí)別“卡脖子”技術(shù)[9],以及促進(jìn)我國(guó)知識(shí)產(chǎn)權(quán)信息服務(wù)發(fā)展[10]等方面至關(guān)重要。因此,加強(qiáng)對(duì)于高質(zhì)量論文內(nèi)容和專利信息的獲取與保障,對(duì)于推動(dòng)國(guó)家科技創(chuàng)新有著十分重要的意義。
這部分?jǐn)?shù)據(jù)的主要來(lái)源包括全球知名引文數(shù)據(jù)庫(kù)(如Web of Science、CSCD)、湯森路透(THOMSON REUTERS)及全球其他專利數(shù)據(jù)庫(kù),全球主要的機(jī)構(gòu)知識(shí)庫(kù)、標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)、知名預(yù)印本平臺(tái)(如arXiv、bioRxiv、SSRN、ChemRxiv)、重要基金資助機(jī)構(gòu)的成果共享庫(kù)(如NSF-PARPubMed Central、NPArC、EPMC、J-STAGE、J-STAGE DATA、KAKEN、NSFCOR、CAS IR GRID、中國(guó)國(guó)家自然科學(xué)基金委基礎(chǔ)研究知識(shí)庫(kù))等。
上述數(shù)據(jù)源一部分為商業(yè)資源,一部分是開放資源。對(duì)于商業(yè)資源,建議在持續(xù)訂購(gòu)、更新維護(hù)已有重要數(shù)據(jù)資源的基礎(chǔ)上,擴(kuò)大使用權(quán)益,開展更多類型高質(zhì)量資源的本地化或數(shù)據(jù)合作,對(duì)數(shù)據(jù)內(nèi)容進(jìn)行提取分析,形成各類圍繞戰(zhàn)略決策需求的信息庫(kù)。例如:從綜述論文中選擇各領(lǐng)域的重要的評(píng)論期刊和重要論文,形成核心領(lǐng)域評(píng)論數(shù)據(jù)庫(kù);從全文中抽取科學(xué)問題,形成問題-文章數(shù)據(jù);從重要會(huì)議中提取會(huì)議征集資源和會(huì)議議題資源等。
(2)科研規(guī)劃與基金項(xiàng)目數(shù)據(jù)。科研規(guī)劃與基金項(xiàng)目數(shù)據(jù)被認(rèn)為包含大量可供分析的知識(shí)[11]。而實(shí)體清單關(guān)系到科技前沿、國(guó)家安全等重要方面的內(nèi)容,體現(xiàn)出一個(gè)國(guó)家對(duì)于科技戰(zhàn)略發(fā)展的布局,美國(guó)近年來(lái)強(qiáng)化“實(shí)體清單”阻礙我國(guó)科技創(chuàng)新[12]。
該領(lǐng)域值得關(guān)注的重要數(shù)據(jù)資源包括:歐美主要發(fā)達(dá)國(guó)家科技規(guī)劃,如美國(guó)海軍研究署的《海軍科技戰(zhàn)略》、美國(guó)聯(lián)邦運(yùn)輸部的《科技戰(zhàn)略規(guī)劃綱要》和《智能交通系統(tǒng)戰(zhàn)略規(guī)劃2020—2025》等專題戰(zhàn)略規(guī)劃文本,歐盟的《戰(zhàn)略能源技術(shù)規(guī)劃》《歐盟疫苗戰(zhàn)略》《歐洲處理器和半導(dǎo)體科技計(jì)劃聯(lián)合聲明》,德國(guó)《高技術(shù)戰(zhàn)略2025》。另外,美國(guó)商務(wù)部的出口管制實(shí)體清單、《歐盟兩用品出口管制條例》等是需要關(guān)注的重點(diǎn)。
目前大部分科技政策、戰(zhàn)略規(guī)劃、指南、基金項(xiàng)目數(shù)據(jù),以及全球科技布局與政策等能借助公開渠道獲取,可通過網(wǎng)絡(luò)爬蟲方式采集到本地。但在資源的使用過程中應(yīng)注意資源來(lái)源平臺(tái)對(duì)于數(shù)據(jù)采集的限制、資源版權(quán)規(guī)定和使用授權(quán)。在編制專題數(shù)據(jù)庫(kù)、引用和使用相關(guān)數(shù)據(jù)時(shí),應(yīng)在授權(quán)范圍內(nèi)使用。如未獲得相應(yīng)授權(quán),應(yīng)以購(gòu)買或合作的方式爭(zhēng)取相應(yīng)授權(quán),以便于對(duì)上述資源進(jìn)行更好的分析和利用。
(3)科技管理與科研投入產(chǎn)出數(shù)據(jù)??萍脊芾砼c科研投入產(chǎn)出數(shù)據(jù),對(duì)于科技戰(zhàn)略情報(bào)決策同樣至關(guān)重要??萍脊芾頂?shù)據(jù)來(lái)源廣泛、類型豐富,主要包括科技項(xiàng)目數(shù)據(jù)、科研人員數(shù)據(jù)、科研機(jī)構(gòu)數(shù)據(jù)、科研投入產(chǎn)出數(shù)據(jù)、管理過程數(shù)據(jù)等。利用科技管理數(shù)據(jù)開展分析挖掘,并服務(wù)于管理與決策活動(dòng),是新時(shí)期科技資源高效利用的重要途徑[13]。科研投入產(chǎn)出數(shù)據(jù)是科技管理數(shù)據(jù)中的一個(gè)重要組成部分,也是衡量一個(gè)國(guó)家綜合國(guó)力和科技創(chuàng)新水平的重要指標(biāo)。
在建設(shè)支撐戰(zhàn)略情報(bào)的資源保障體系中,應(yīng)充分重視科技管理數(shù)據(jù)資源的積累,積極獲取并整合國(guó)家和機(jī)構(gòu)層面包括財(cái)務(wù)、人員、項(xiàng)目,以及經(jīng)費(fèi)、預(yù)算、國(guó)際合作等各類管理信息。同時(shí),加大對(duì)全球重要國(guó)家和地區(qū)、科研機(jī)構(gòu)的各項(xiàng)科技統(tǒng)計(jì)數(shù)據(jù),包括科研經(jīng)費(fèi)投入、重要機(jī)構(gòu)年報(bào)、技術(shù)交易額、項(xiàng)目獲獎(jiǎng)、專利申請(qǐng)授權(quán)、高新技術(shù)企業(yè)等資源的采集,如美國(guó)科學(xué)基金會(huì)國(guó)家科學(xué)與工程統(tǒng)計(jì)中心的數(shù)據(jù)、世界投入產(chǎn)出數(shù)據(jù)(WIOT)和我國(guó)《全國(guó)科技經(jīng)費(fèi)投入統(tǒng)計(jì)公報(bào)》等權(quán)威數(shù)據(jù)。
(4)科學(xué)領(lǐng)域前沿趨勢(shì)數(shù)據(jù)??茖W(xué)領(lǐng)域前沿趨勢(shì)數(shù)據(jù)是直接揭示和評(píng)價(jià)最新科技成果的重要數(shù)據(jù)資源,主要包括各類科技情報(bào)產(chǎn)品快報(bào)、簡(jiǎn)報(bào)、研究報(bào)告、評(píng)估報(bào)告、清單、全球知名智庫(kù)報(bào)告、科技趨勢(shì)預(yù)測(cè)、科技創(chuàng)新與社會(huì)經(jīng)濟(jì)發(fā)展指數(shù)、科研成果和機(jī)構(gòu)排名榜單、國(guó)內(nèi)外高等教育學(xué)科體系。
此類數(shù)據(jù)資源涵蓋范圍廣,部分內(nèi)容可以公開獲取到相關(guān)信息,如Nature Index(自然指數(shù))年度榜單、Gartner重要戰(zhàn)略技術(shù)趨勢(shì)、國(guó)際組織發(fā)布的報(bào)告(如世界知識(shí)產(chǎn)權(quán)組織發(fā)布的全球創(chuàng)新指數(shù))等,但部分資源需要通過商業(yè)訂購(gòu)才能獲取,如《麻省理工科技評(píng)論》(MIT Technology Review)、IEEE年度技術(shù)預(yù)測(cè)等,以及一些重要學(xué)協(xié)會(huì)或出版社有關(guān)科學(xué)突破、科學(xué)發(fā)現(xiàn)、年度技術(shù)預(yù)測(cè)期刊(如Science Online、ACM Advances in Artificial Intelligence、Annual Reviews、IEE Review、Trends in Chemistry、Nature Reviews等)。
對(duì)于需要公開采集的資源,圖書情報(bào)機(jī)構(gòu)應(yīng)隨時(shí)跟蹤,掌握資源的更新動(dòng)態(tài),做到及時(shí)獲??;對(duì)于需要采購(gòu)的資源,需要在充分評(píng)估后考慮納入資源采購(gòu)清單,積極發(fā)揮國(guó)家或機(jī)構(gòu)聯(lián)盟的采購(gòu)優(yōu)勢(shì),獲得資源的使用授權(quán)。同時(shí),還需要對(duì)已訂購(gòu)數(shù)據(jù)庫(kù)中的資源進(jìn)行分析,提煉出于科技領(lǐng)域前沿趨勢(shì)相關(guān)的數(shù)據(jù),在節(jié)約采購(gòu)成本的同時(shí),充分發(fā)揮已有資源的利用價(jià)值。
(5)重要人才數(shù)據(jù)。人才數(shù)據(jù)對(duì)于人才流動(dòng)預(yù)警與監(jiān)測(cè)、人才發(fā)現(xiàn)與推薦、國(guó)際科研合作等方面都具有重要價(jià)值。因此,支撐科技戰(zhàn)略情報(bào)決策資源保障體系應(yīng)主要考慮加強(qiáng)對(duì)以下數(shù)據(jù)內(nèi)容的建設(shè),包括全球重大科技獎(jiǎng)項(xiàng)(如諾貝爾獎(jiǎng)、美國(guó)國(guó)家科學(xué)獎(jiǎng)、MIT全球創(chuàng)新者榜單、菲爾茲獎(jiǎng)、圖靈獎(jiǎng)、中國(guó)國(guó)家科學(xué)技術(shù)獎(jiǎng)等)獲獎(jiǎng)人員、國(guó)際重要學(xué)術(shù)會(huì)議(如SPIE Fellow、IEEE Fellow)人員信息、兩院院士名錄、其他主要國(guó)家院士名單、國(guó)家級(jí)科研機(jī)構(gòu)統(tǒng)計(jì)名單、重要學(xué)術(shù)機(jī)構(gòu)在職人員清單、重要科技企業(yè)榜單(如福布斯2020全球企業(yè)2000強(qiáng)榜、全球創(chuàng)新企業(yè)100強(qiáng)名單)、德科集團(tuán)《全球人才競(jìng)爭(zhēng)力指數(shù)》等。
在數(shù)據(jù)獲取的基礎(chǔ)上,還應(yīng)面向具體需求構(gòu)建人才信息專題庫(kù)。方法包括遴選分析來(lái)自重要機(jī)構(gòu)名錄、全球重大科技獎(jiǎng)項(xiàng)、國(guó)內(nèi)外重要學(xué)術(shù)會(huì)議中的人才信息,如姓名、性別、年齡、教育背景、現(xiàn)任職機(jī)構(gòu)、學(xué)科領(lǐng)域等,構(gòu)建海量數(shù)據(jù)的人才基礎(chǔ)數(shù)據(jù)庫(kù),為科技情報(bào)決策提供更好支撐。
(6)科研裝備設(shè)施數(shù)據(jù)??蒲醒b備設(shè)施數(shù)據(jù)是推動(dòng)科技創(chuàng)新中所需要的數(shù)據(jù)資源,特別是在開放科學(xué)的環(huán)境下,儀器設(shè)備成為開放科學(xué)基礎(chǔ)設(shè)施中的重要組成部分。目前歐美等發(fā)達(dá)國(guó)家已經(jīng)建成了各具特色的科研基礎(chǔ)設(shè)施和大型儀器等科研基礎(chǔ)條件資源體系,在科研基礎(chǔ)設(shè)施與科研儀器開放共享實(shí)踐方面積累了較為豐富的建設(shè)與運(yùn)營(yíng)經(jīng)驗(yàn)。同時(shí),為提升大型科研儀器設(shè)備開放共享的使用效率,國(guó)外非常注重開放共享平臺(tái)的建設(shè)[14]。我國(guó)為加快推進(jìn)科研儀器開放共享,進(jìn)一步提高科技資源利用效率,自2014年起國(guó)家、部委層面從整體布局到逐層推進(jìn),制定了眾多政策文件與實(shí)施規(guī)范,有效避免了儀器的重復(fù)購(gòu)置,提高了儀器設(shè)備的使用率[15]。
在上述背景下,圖書情報(bào)機(jī)構(gòu)應(yīng)充分整合、采集國(guó)內(nèi)外大科學(xué)設(shè)施、大型科學(xué)儀器設(shè)備信息,服務(wù)于我國(guó)科研需要。重要數(shù)據(jù)源包括:國(guó)家層面的有科技資源共享服務(wù)平臺(tái)、中國(guó)科技資源共享網(wǎng)(escience.org.cn)、國(guó)家科技圖書文獻(xiàn)中心(NSTL)、中國(guó)科學(xué)院科技大數(shù)據(jù)知識(shí)發(fā)現(xiàn)平臺(tái);省級(jí)平臺(tái)如首都科技條件平臺(tái)、上海研發(fā)公共服務(wù)平臺(tái)、廣東省科技資源共享網(wǎng)平臺(tái)等;國(guó)外知名實(shí)驗(yàn)室及大科學(xué)裝置(研究機(jī)構(gòu))名單,如美國(guó)勞倫斯伯克利國(guó)家實(shí)驗(yàn)室、麻省理工學(xué)院林肯實(shí)驗(yàn)室等。
(7)領(lǐng)域關(guān)鍵技術(shù)數(shù)據(jù)。戰(zhàn)略情報(bào)決策離不開領(lǐng)域關(guān)鍵技術(shù)數(shù)據(jù)的支持,為做好科技戰(zhàn)略決策,需要針對(duì)不同學(xué)科領(lǐng)域獲取和集成關(guān)鍵技術(shù)數(shù)據(jù),如化合物、材料數(shù)據(jù)、設(shè)備、儀器、電子元器件、產(chǎn)品等。
領(lǐng)域關(guān)鍵技術(shù)數(shù)據(jù)具備綜合性強(qiáng)、類型分散等特點(diǎn),獲取和分析難度較大。以能源領(lǐng)域戰(zhàn)略情報(bào)所需的資源為例,重要數(shù)據(jù)源包括但不限于:BP報(bào)告(英國(guó)石油公司發(fā)布數(shù)據(jù)報(bào)告)、IEA數(shù)據(jù)庫(kù)(含二氧化碳排放、煤炭、電力、石油等數(shù)據(jù))、美國(guó)能源部(DOE)專利數(shù)據(jù)庫(kù)Enerdata(含數(shù)據(jù)嵌入報(bào)告,包括世界能源消耗、原油產(chǎn)量、天然氣產(chǎn)量、成品油生產(chǎn)、煤炭和褐煤生產(chǎn)、世界用電量、可再生能源風(fēng)能和太陽(yáng)能、世界二氧化碳排放等數(shù)據(jù))。
上述數(shù)據(jù)資源,既包括商業(yè)訂購(gòu)資源,也包括互聯(lián)網(wǎng)開放資源。如何根據(jù)情報(bào)分析需求,對(duì)資源進(jìn)行精準(zhǔn)、低成本地訂購(gòu)、采集、整合、分析是該類數(shù)據(jù)資源建設(shè)的難點(diǎn)。建議參考蘭德公司的模式,建立面向領(lǐng)域的專題信息庫(kù),并在一定的范圍內(nèi)進(jìn)行數(shù)據(jù)共享,以支持戰(zhàn)略決策分析。
(8)科技輿情監(jiān)測(cè)數(shù)據(jù)。當(dāng)前,隨著社交媒體的發(fā)展,關(guān)于科技類的輿情信息在數(shù)量和更新頻率上都呈持續(xù)增長(zhǎng)態(tài)勢(shì)[16]。及時(shí)、優(yōu)質(zhì)的情報(bào)是應(yīng)急決策成功的核心要素,如果不對(duì)輿情信息加以快速有效地收集和分析,大量滋生的謠言將會(huì)降低情報(bào)分析質(zhì)量,影響科技戰(zhàn)略決策。因此,圖書情報(bào)機(jī)構(gòu)應(yīng)重視對(duì)于科技輿情監(jiān)測(cè)數(shù)據(jù)的收集和分析能力。
當(dāng)前重要的科技輿情主要來(lái)自一些權(quán)威的監(jiān)測(cè)源,包括傳統(tǒng)媒體如《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》《華盛頓郵報(bào)》《人民日?qǐng)?bào)》《朝日新聞》,還包括一些新媒體,如人民網(wǎng)、央視網(wǎng)欄目新聞?lì)l道、喜馬拉雅音頻新聞、愛奇藝新聞視頻、新浪科技新聞、新浪微博等。
目前我國(guó)圖書情報(bào)機(jī)構(gòu)在科技輿情信息監(jiān)測(cè)方面還缺乏系統(tǒng)和成熟的方法,仍需要進(jìn)一步加強(qiáng)研究與實(shí)踐的探索。如有學(xué)者提出將人工智能的方式引入網(wǎng)絡(luò)輿情服務(wù)工作中,從而更好地解放生產(chǎn)力,提高網(wǎng)絡(luò)輿情的監(jiān)測(cè)與分析效能和質(zhì)量,但實(shí)際效果還有待進(jìn)一步檢驗(yàn)[17]。
(9)重要的社會(huì)經(jīng)濟(jì)發(fā)展數(shù)據(jù)??萍紕?chuàng)新的目標(biāo)之一是推動(dòng)社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展,在開展科技活動(dòng)的過程中需要大量的社會(huì)經(jīng)濟(jì)發(fā)展數(shù)據(jù)作為支撐,以明確科技發(fā)展方向,提升科技成果的轉(zhuǎn)化率。因此,要充分重視為科研工作者提供權(quán)威、豐富的社會(huì)經(jīng)濟(jì)發(fā)展數(shù)據(jù)。
從目前各類科研機(jī)構(gòu)的需求看,重要的商業(yè)經(jīng)濟(jì)、法律經(jīng)濟(jì)類數(shù)據(jù)庫(kù)是需求的重點(diǎn)。具體內(nèi)容包括全球主要經(jīng)濟(jì)發(fā)展指標(biāo)、經(jīng)濟(jì)發(fā)展規(guī)劃、碳排放指標(biāo)、金融市場(chǎng)動(dòng)態(tài)、科技企業(yè)發(fā)展指標(biāo)等。數(shù)據(jù)來(lái)源主要包括OECD經(jīng)合組織數(shù)據(jù)庫(kù),以及國(guó)內(nèi)的中國(guó)經(jīng)濟(jì)與社會(huì)發(fā)展統(tǒng)計(jì)數(shù)據(jù)庫(kù)、國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)、政府工作報(bào)告、全球證券市場(chǎng)金融指數(shù)等。其中有一部分?jǐn)?shù)據(jù)來(lái)源為商業(yè)數(shù)據(jù)庫(kù),如MIS全球新興市場(chǎng)商業(yè)資訊數(shù)據(jù)庫(kù)、Business Market Research Collection商業(yè)市場(chǎng)研究數(shù)據(jù)庫(kù)。
此外,圖書情報(bào)機(jī)構(gòu)還應(yīng)加強(qiáng)對(duì)于各類政策信息資源的利用與挖掘。一方面,各國(guó)國(guó)家科技信息政策能充分反映本國(guó)的重大政策建議、重要前沿研究及重點(diǎn)活動(dòng),對(duì)科技戰(zhàn)略決策分析有著重要意義[18];另一方面,根據(jù)我國(guó)《著作權(quán)法》第五條規(guī)定,著作權(quán)法不適用于法律、法規(guī),國(guó)家機(jī)關(guān)的決議、決定、命令和其他具有立法、行政、司法性質(zhì)的文件,及其官方正式譯文,這就給了相應(yīng)政策信息更大的利用空間,便于資源的收集和分析。例如,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心推出“科技政策匯”平臺(tái),對(duì)科技政策進(jìn)行深度加工、標(biāo)引、分析和服務(wù)。
2.2.3 科學(xué)智能與綜合多元的工具機(jī)制建設(shè)
在科學(xué)智能的工具建設(shè)方面,應(yīng)建設(shè)智能化的數(shù)據(jù)信息搜集和數(shù)據(jù)分析工具,從而實(shí)現(xiàn)目標(biāo)信息源的實(shí)時(shí)監(jiān)測(cè)跟蹤和知識(shí)內(nèi)容的快速更新。同時(shí),還需要綜合應(yīng)用深度學(xué)習(xí)、知識(shí)圖譜等技術(shù),實(shí)現(xiàn)基于數(shù)據(jù)的快速抽取、實(shí)時(shí)分析,從而輔助戰(zhàn)略決策。
2.2.4 多元化的數(shù)據(jù)資源獲取渠道建設(shè)
在綜合多元的機(jī)制建設(shè)方面,應(yīng)構(gòu)建多元化的數(shù)據(jù)資源獲取渠道,針對(duì)數(shù)據(jù)資源的具體情況,制定包括采購(gòu)、采集、數(shù)據(jù)交換、本地鏡像、資源共建共享等在內(nèi)的多元數(shù)據(jù)獲取渠道。此外,要更加重視數(shù)據(jù)合作,與國(guó)內(nèi)外政府機(jī)構(gòu)、科研機(jī)構(gòu)及其他智庫(kù)數(shù)據(jù)平臺(tái)開展協(xié)同合作,拓展數(shù)據(jù)資源類型和獲取途徑。
面向未來(lái),情報(bào)工作的戰(zhàn)略選擇應(yīng)該重視發(fā)展基于數(shù)據(jù)的情報(bào)研究,進(jìn)而建立以智能情報(bào)為核心的決策支持系統(tǒng),充分發(fā)揮情報(bào)研究的決策咨詢作用[19]。為進(jìn)一步推動(dòng)上述設(shè)計(jì)方案落實(shí),本研究認(rèn)為應(yīng)從以下3個(gè)方面做好工作。
(1)加強(qiáng)對(duì)全球范圍內(nèi)高質(zhì)量戰(zhàn)略情報(bào)資源的掌握。在建設(shè)科技戰(zhàn)略情報(bào)的資源保障體系過程中,應(yīng)重視并持續(xù)調(diào)研國(guó)外高端智庫(kù)的數(shù)據(jù)中心,分析其數(shù)字資源特點(diǎn)和發(fā)展現(xiàn)狀,以用于部署我國(guó)對(duì)于科技戰(zhàn)略情報(bào)資源的獲取與利用。同時(shí),調(diào)研國(guó)內(nèi)外智庫(kù)報(bào)告、科技政策文件、市場(chǎng)報(bào)告、市場(chǎng)行業(yè)數(shù)據(jù)、年鑒、統(tǒng)計(jì)手冊(cè)、工具平臺(tái)等數(shù)字資源,形成支撐我國(guó)智庫(kù)發(fā)展的資源內(nèi)容體系建設(shè)方案,提出資源清單,并研究適應(yīng)決策流程的智庫(kù)資源組織方法與利用方式。
(2)提高戰(zhàn)略情報(bào)資源的獲取和服務(wù)能力。可從目前廣泛關(guān)注的智庫(kù)資源建設(shè)入手,試點(diǎn)開展智庫(kù)資源建設(shè):獲取部分智庫(kù)報(bào)告及其相關(guān)文檔(文獻(xiàn)、專利、數(shù)據(jù)等),采集一定年份的國(guó)家科技政策資源,采購(gòu)一定數(shù)量的行業(yè)統(tǒng)計(jì)報(bào)告、年鑒、分析工具等;初步建設(shè)智庫(kù)數(shù)字資源發(fā)現(xiàn)及服務(wù)平臺(tái)“智庫(kù)數(shù)字資源中心”,實(shí)現(xiàn)智庫(kù)報(bào)告、科技政策與文獻(xiàn)資源中年鑒、統(tǒng)計(jì)報(bào)告、專利等資源的關(guān)聯(lián)發(fā)現(xiàn)和分析統(tǒng)計(jì)。同時(shí),在充分調(diào)研科技戰(zhàn)略情報(bào)資源需求的基礎(chǔ)上,加快構(gòu)建我國(guó)科技智庫(kù)數(shù)字資源保障與服務(wù)平臺(tái),提升智庫(kù)資源的揭示和服務(wù)能力。
(3)加強(qiáng)戰(zhàn)略情報(bào)資源的權(quán)益保障研究。研究現(xiàn)有數(shù)字資源權(quán)益保障模式與戰(zhàn)略情報(bào)工作相融合的方式。加強(qiáng)從信息采集、存儲(chǔ)、組織、利用各個(gè)環(huán)節(jié)的權(quán)益管理規(guī)范研究[20]。一方面規(guī)避我國(guó)對(duì)于相關(guān)信息資源使用可能涉及的侵權(quán)風(fēng)險(xiǎn);另一方面從對(duì)數(shù)字資源享有何種使用權(quán)益入手[21],促進(jìn)相關(guān)資源發(fā)揮更大的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。