袁 偉 石 蕾
(1.中國(guó)科學(xué)技術(shù)信息研究所,北京 100038;2.國(guó)家科技基礎(chǔ)條件平臺(tái)中心,北京 100862)
大數(shù)據(jù)背景下科技資源信息挖掘與利用的思考
袁 偉1石 蕾2
(1.中國(guó)科學(xué)技術(shù)信息研究所,北京 100038;2.國(guó)家科技基礎(chǔ)條件平臺(tái)中心,北京 100862)
科技資源信息是科技創(chuàng)新的基礎(chǔ)條件,也是科技創(chuàng)新實(shí)力的重要體現(xiàn)。概述國(guó)內(nèi)外科技資源信息的發(fā)展態(tài)勢(shì),闡述科技資源信息在科研創(chuàng)新性中的關(guān)鍵作用,總結(jié)我國(guó)科技資源信息的發(fā)展現(xiàn)狀,分析當(dāng)前科技資源信息發(fā)展存在的問(wèn)題,探討大數(shù)據(jù)背景下加強(qiáng)科技資源信息挖掘與利用的努力方向和思路,以期為科技資源信息進(jìn)一步促進(jìn)科技進(jìn)步與發(fā)展提供參考。
大數(shù)據(jù);科技資源;科技資源信息;信息挖掘;信息利用
大數(shù)據(jù)是指在合理時(shí)間內(nèi)使用傳統(tǒng)方法或工具無(wú)法實(shí)現(xiàn)分析或處理的規(guī)模巨大的數(shù)據(jù)集合[1]。大數(shù)據(jù)的應(yīng)用揭示了過(guò)去傳統(tǒng)方式無(wú)法展現(xiàn)的相關(guān)關(guān)系,促進(jìn)了數(shù)據(jù)的融合與資源的整合。隨著大數(shù)據(jù)時(shí)代的到來(lái),對(duì)數(shù)據(jù)的生產(chǎn)加工能力、占有能力以及大數(shù)據(jù)處理和分析能力,將成為一個(gè)國(guó)家能否把握全球競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵指標(biāo)。
科技資源是科技活動(dòng)中人力、物力、財(cái)力以及組織、管理、信息等軟硬件要素的總稱[2],是科技創(chuàng)新和經(jīng)濟(jì)社會(huì)發(fā)展重要的支撐和保障??萍假Y源的總量間接制約著國(guó)家的創(chuàng)新能力提升,世界發(fā)達(dá)國(guó)家無(wú)一例外地都擁有強(qiáng)大的科技資源生產(chǎn)、占有和使用能力。作為科技資源的描述性信息,科技資源信息充分反映了科技資源客觀狀況、特點(diǎn)、發(fā)展?fàn)顟B(tài)、使用方式等,是促進(jìn)科技資源開(kāi)放利用的重要基礎(chǔ),也是重要的科技資源類型。
改革開(kāi)放以來(lái),我國(guó)科技資源狀況發(fā)生了大幅改善,積累了相當(dāng)數(shù)量的儀器設(shè)備、文獻(xiàn)、標(biāo)本、數(shù)據(jù)及人才資源,有力地支撐了國(guó)家科技創(chuàng)新。特別是在大數(shù)據(jù)時(shí)代的影響和推動(dòng)下,科技創(chuàng)新活動(dòng)日新月異,科技資源信息的產(chǎn)生途徑也異常豐富,通過(guò)互聯(lián)網(wǎng)、移動(dòng)設(shè)備、智能終端產(chǎn)生的科技資源信息更呈爆炸式增長(zhǎng)。當(dāng)前科技資源信息獲取也已經(jīng)從時(shí)間、距離上的障礙轉(zhuǎn)變?yōu)閮?nèi)容選擇上的障礙,如何從大量科技資源中獲取有價(jià)值的、能夠直接用于解決科研問(wèn)題、攻克技術(shù)難點(diǎn)的知識(shí)成為主要關(guān)注的因素[3]。此外,隨著社會(huì)的發(fā)展,科學(xué)研究的問(wèn)題也越來(lái)越復(fù)雜,僅靠單個(gè)平臺(tái)提供科技資源已不能滿足當(dāng)前科技發(fā)展的需要,大數(shù)據(jù)發(fā)展為科技創(chuàng)新發(fā)展提供了新的思路和技術(shù)支撐,通過(guò)多渠道、多來(lái)源整合科技資源信息,形成海量大數(shù)據(jù)基礎(chǔ)上的多點(diǎn)協(xié)同創(chuàng)新,也成為解決復(fù)雜科學(xué)問(wèn)題的重要基礎(chǔ)。綜合來(lái)看,對(duì)科技資源信息的科學(xué)分析、深入挖掘和綜合利用,已成為科技創(chuàng)新、經(jīng)濟(jì)社會(huì)發(fā)展和管理決策的重要依據(jù)[4]。
然而,當(dāng)前我國(guó)對(duì)科技資源信息的管理和利用能力,與新時(shí)期我國(guó)建設(shè)創(chuàng)新型國(guó)家的需求以及實(shí)現(xiàn)創(chuàng)新驅(qū)動(dòng)發(fā)展的戰(zhàn)略目標(biāo)存在一定的差距,進(jìn)一步優(yōu)化科技資源優(yōu)化配置,提高科技資源利用效率的旺盛需求和挑戰(zhàn)仍然并存。因此,通過(guò)深入分析大數(shù)據(jù)背景下科技資源信息的基本特征,以及大數(shù)據(jù)對(duì)科技資源信息挖掘和利用的影響,集成利用好數(shù)量大、種類多、增速快的科技資源信息成為我國(guó)科學(xué)研究及經(jīng)濟(jì)社會(huì)發(fā)展的關(guān)鍵因素[5],探究大數(shù)據(jù)背景下我國(guó)科技資源信息的挖掘與利用具有重要的意義和價(jià)值。
當(dāng)前,我國(guó)進(jìn)入科技創(chuàng)新發(fā)展戰(zhàn)略實(shí)施的新時(shí)期,實(shí)現(xiàn)全面提升科技創(chuàng)新能力目標(biāo)對(duì)科技資源信息化水平以及信息挖掘分析能力提出了更高的要求,而提升政府管理決策能力也越來(lái)越依賴海量科技資源大數(shù)據(jù)信息的綜合分析。在目標(biāo)需求的引導(dǎo)和帶動(dòng)下,政府有關(guān)部門和科技資源機(jī)構(gòu)大力推進(jìn)科技資源信息化工作,取得了積極進(jìn)展和顯著成效。聚焦物力科技資源,我國(guó)已經(jīng)在多個(gè)領(lǐng)域建成了一批國(guó)家科技資源共享服務(wù)平臺(tái),在科研設(shè)施、科學(xué)儀器、科學(xué)數(shù)據(jù)、生物種質(zhì)、科學(xué)實(shí)驗(yàn)材料所涉及的多個(gè)學(xué)科領(lǐng)域形成了一大批專門開(kāi)展科技資源信息化、從事資源利用與信息挖掘并面向全社會(huì)開(kāi)展科技資源公共服務(wù)的科技資源中心(庫(kù)、館),建成了國(guó)家科技資源共享服務(wù)平臺(tái)門戶系統(tǒng),專門用于科技資源信息的整合集成與分析挖掘。這些資源中心和門戶系統(tǒng)對(duì)國(guó)家管理決策、科學(xué)研究發(fā)展發(fā)揮了重要的支撐和保障作用。按照《國(guó)務(wù)院關(guān)于國(guó)家重大科研基礎(chǔ)設(shè)施和大型科研儀器向社會(huì)開(kāi)放的意見(jiàn)》(國(guó)發(fā)〔2014〕70號(hào))要求建成的重大科研基礎(chǔ)設(shè)施和大型科研儀器網(wǎng)絡(luò)管理平臺(tái),已對(duì)各部門、各高校院所的科研設(shè)施和儀器進(jìn)行信息化整理并向社會(huì)公布。
與此同時(shí),各部門、行業(yè)、單位也積極推動(dòng)各類科技資源信息化并用于科學(xué)研究或公共服務(wù)。如依托于北京大學(xué)成立的國(guó)家醫(yī)療數(shù)據(jù)中心,收集、整理了近400家醫(yī)院超過(guò)10余年共4800多萬(wàn)條的病案首頁(yè)數(shù)據(jù),并將數(shù)據(jù)全部進(jìn)行了數(shù)字化,為臨床醫(yī)師和科研人員的醫(yī)學(xué)科學(xué)研究提供了基礎(chǔ)數(shù)據(jù)支撐[6]。再如黑龍江省已完成了700余家家單位近4000臺(tái)(套)20萬(wàn)元以上大型儀器設(shè)備的資源信息數(shù)字化,此外還收錄高端制造服務(wù)設(shè)備進(jìn)600臺(tái)(套),實(shí)現(xiàn)了海量資源信息的高度整合[7]。科研人員利用這些科技資源信息在使用儀器設(shè)施過(guò)程中改進(jìn)了操作方法,完善了實(shí)驗(yàn)數(shù)據(jù),形成了更準(zhǔn)確的試驗(yàn)結(jié)果。大量的科技資源信息為科研儀器利用與管理、科學(xué)數(shù)據(jù)分析和科研效率提升提供了強(qiáng)大支撐。
同時(shí),隨著國(guó)家信息化工作的快速推進(jìn),大量統(tǒng)計(jì)數(shù)據(jù)、財(cái)政投入數(shù)據(jù)以及科技人才信息等也通過(guò)多種信息化手段成為公共可利用的大數(shù)據(jù)資源,為科技資源信息大數(shù)據(jù)挖掘奠定重要的基礎(chǔ)。
大數(shù)據(jù)是計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)和社會(huì)學(xué)等多學(xué)科交叉滲透所形成的。隨著現(xiàn)代信息化、網(wǎng)絡(luò)化等技術(shù)手段的應(yīng)用,科技資源信息擺脫了地域上的屏障和束縛,人、財(cái)、物等各類科技資源信息源源不斷地產(chǎn)生,其信息量迅速攀升,覆蓋的科技領(lǐng)域范圍也不斷擴(kuò)大,通過(guò)運(yùn)用科學(xué)方法處理,最終將這些信息整合形成了由結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的科技資源信息大數(shù)據(jù)。同時(shí),科技資源信息來(lái)源在種類上趨于多樣,不僅包括科技文獻(xiàn)資源信息、科學(xué)數(shù)據(jù)資源信息、儀器科技資源信息等傳統(tǒng)的科技資源信息,還有實(shí)時(shí)傳播信息(如科技快報(bào)、天氣預(yù)報(bào)等)、參考工具信息(如年鑒、手冊(cè)等)、內(nèi)部科技資料(如專業(yè)技術(shù)圖片、視聽(tīng)音像等)、網(wǎng)絡(luò)灰色科技信息(如科技機(jī)構(gòu)發(fā)布的科技政策、科技新聞、產(chǎn)品信息等)以及個(gè)人在網(wǎng)站、微博、個(gè)人網(wǎng)頁(yè)發(fā)布的科技觀點(diǎn)、手稿等新的科技資源信息[8],這些形式多樣的科技資源信息源不斷增加,相互影響、結(jié)合,又會(huì)形成新的科技資源信息來(lái)源。此外,物聯(lián)網(wǎng)智慧城市、智慧醫(yī)療、智能電網(wǎng)以及群體感知等新興技術(shù)的應(yīng)用,也使各行各業(yè)在其業(yè)務(wù)發(fā)展過(guò)程中形成新的科技資源信息大數(shù)據(jù)的來(lái)源。
一些領(lǐng)域科技資源信息在快速發(fā)展的同時(shí),也帶動(dòng)了其他領(lǐng)域的共同發(fā)展。例如,氣象科技資源信息的發(fā)展為農(nóng)業(yè)生產(chǎn)帶來(lái)了巨大的益處,氣象條件與農(nóng)業(yè)生產(chǎn)有著非常密切的關(guān)聯(lián),農(nóng)業(yè)生產(chǎn)過(guò)程中的溫濕度、日照強(qiáng)弱、風(fēng)力風(fēng)向等氣象因子都會(huì)影響農(nóng)作物的產(chǎn)量和品質(zhì)。現(xiàn)今全國(guó)已建成了2000多個(gè)氣象地面站、120多個(gè)高空探測(cè)站、300多個(gè)雷達(dá)站和近百個(gè)酸雨監(jiān)測(cè)站[9],通過(guò)對(duì)這些多源站點(diǎn)中的科技資源進(jìn)行信息化整合,形成了數(shù)量多、覆蓋全的氣象科技資源信息,通過(guò)分析和應(yīng)用這些氣象科技資源信息,為國(guó)家管理部門進(jìn)行農(nóng)業(yè)區(qū)域規(guī)劃提供了參考,同時(shí)也為相關(guān)科學(xué)研究提供了基礎(chǔ)數(shù)據(jù)支撐。
大數(shù)據(jù)技術(shù)是一種先進(jìn)的技術(shù),有著信息容量大、傳播范圍廣等優(yōu)點(diǎn),大數(shù)據(jù)技術(shù)的運(yùn)用有利于高價(jià)值科技資源信息在多領(lǐng)域、深層次間實(shí)現(xiàn)更有效的信息公開(kāi)與傳播??萍假Y源的高效利用水平取決于科技資源信息的公開(kāi)程度。經(jīng)過(guò)數(shù)年發(fā)展,我國(guó)已初步實(shí)現(xiàn)科技資源信息多渠道公開(kāi),如國(guó)家科技資源共享服務(wù)平臺(tái)建設(shè)、科技文獻(xiàn)或數(shù)據(jù)出版、科技資源報(bào)表發(fā)布、科技人財(cái)物信息公開(kāi)等。以科技期刊出版為例,目前我國(guó)已形成較完善的科技期刊數(shù)字化出版模式,利用大數(shù)據(jù)相關(guān)的計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)期刊文獻(xiàn)數(shù)字信息加工、存儲(chǔ)、整合、編輯和出版,并開(kāi)始探索科學(xué)數(shù)據(jù)出版等多元化出版模式[10],以進(jìn)一步拓展科技資源信息的公開(kāi)渠道。此外,各部門、各地方圍繞科技資源信息公開(kāi)制定了一系列法規(guī)政策,如中國(guó)氣象局制定了《氣象資料共享管理辦法》,國(guó)土資源部制定了《公益性地質(zhì)資料提供利用展現(xiàn)辦法”和《深部地球物理探測(cè)數(shù)據(jù)共享管理辦法》,農(nóng)業(yè)部制定了《農(nóng)作物種質(zhì)資源管理辦法》等。各省市也通過(guò)制定和實(shí)施相關(guān)科技資源共享管理辦法,從政府和科技資源管理單位等多主體的權(quán)利、義務(wù)和責(zé)任等方面對(duì)科技資源信息公開(kāi)做出了明確規(guī)定[11],有效推動(dòng)了大數(shù)據(jù)背景下的科技資源信息公開(kāi)。
盡快我國(guó)在科技資源信息管理、公開(kāi)與利用方面開(kāi)展的大量工作取得了巨大進(jìn)展,但與歐美等發(fā)達(dá)國(guó)家相比仍然存在很多不足與問(wèn)題。突出表現(xiàn)在以下幾個(gè)方面:一是科技資源信息生產(chǎn)受到普遍關(guān)注,然而大量科技資源由于未得到科學(xué)及時(shí)的描述并建立索引而石沉大海;二是科技資源信息管理體制機(jī)制尚不健全,尚未建立互聯(lián)互通的科技資源信息基礎(chǔ)保障體系,導(dǎo)致信息分散,利用率不高;三是科技資源信息尚未形成統(tǒng)一的標(biāo)準(zhǔn)化規(guī)范體系,科技資源信息量大、異構(gòu)的特點(diǎn)制約了科技資源信息的快速傳播與廣泛利用;四是對(duì)科技資源信息分析挖掘和利用的技術(shù)體系尚需完善,對(duì)信息挖掘的需求和目標(biāo)還不甚明確,從而導(dǎo)致大量科技資源沒(méi)有得到充分利用。
海量、充沛的科技資源信息是開(kāi)展科技資源信息挖掘與利用的前提和基礎(chǔ),建立完整的適用于大數(shù)據(jù)背景下的科技資源信息管理體系,有效積累科技資源信息,是提高科技資源利用效率的首要任務(wù)。當(dāng)前,我國(guó)通過(guò)科技計(jì)劃、行業(yè)業(yè)務(wù)發(fā)展、產(chǎn)學(xué)研結(jié)合、企業(yè)自主研發(fā)等方式產(chǎn)生了大量的科技資源,應(yīng)依托法人單位建立穩(wěn)定的科技資源數(shù)字化機(jī)制,逐步豐富和完善科技資源信息基礎(chǔ)。同時(shí),借助大數(shù)據(jù)管理方法與模式,在基礎(chǔ)層面對(duì)科技資源數(shù)據(jù)進(jìn)行多、精、準(zhǔn)的分類處理,運(yùn)用大數(shù)據(jù)相關(guān)技術(shù)將資源數(shù)據(jù)信息化與數(shù)字化,并轉(zhuǎn)換成利于后續(xù)應(yīng)用的大數(shù)據(jù)結(jié)構(gòu),通過(guò)引入先進(jìn)的大數(shù)據(jù)處理手段,夯實(shí)科技資源信息基礎(chǔ)。
同時(shí),在大數(shù)據(jù)背景下對(duì)科技資源信息的充分挖掘與廣泛應(yīng)用有賴于高效的公開(kāi)機(jī)制。首先需要建立科技資源信息開(kāi)放宏觀政策環(huán)境,充分發(fā)揮政府部門職能作用,摸清各主體對(duì)科技資源信息公開(kāi)的需求,并利用大數(shù)據(jù)的網(wǎng)絡(luò)便利性和覆蓋廣泛性等特性在各個(gè)層面上組織和協(xié)調(diào)各類科技資源信息的公開(kāi)活動(dòng),形成統(tǒng)一管理、分層負(fù)責(zé)的科技資源信息公開(kāi)機(jī)制。專門制定基于大數(shù)據(jù)環(huán)境下的科技資源信息公開(kāi)披露政策,包括信息公開(kāi)權(quán)利、責(zé)任、義務(wù)和總體規(guī)劃等,樹(shù)立共建共享理念,解決阻礙科技資源信息公開(kāi)的體制性問(wèn)題。同時(shí),建立完善科技資源信息報(bào)告制度,定期及時(shí)向社會(huì)公布現(xiàn)有科技資源的現(xiàn)狀、更新和升級(jí)情況,編制科技資源信息發(fā)布計(jì)劃,健全科技資源信息開(kāi)放目錄制度。推動(dòng)建立完備的以大數(shù)據(jù)應(yīng)用為基礎(chǔ)的科技資源信息庫(kù),利用大數(shù)據(jù)的優(yōu)勢(shì),開(kāi)辟科技資源信息公開(kāi)渠道。
加強(qiáng)科技資源信息集成與匯聚,需要利用多種渠道、多種方式對(duì)這些科技資源信息進(jìn)行加工、處理、分類和優(yōu)化。應(yīng)當(dāng)充分利用大數(shù)據(jù)采集技術(shù)、存儲(chǔ)技術(shù)、云存儲(chǔ)、云計(jì)算等基礎(chǔ)架構(gòu)技術(shù),依托如“中國(guó)科技云”等大數(shù)據(jù)設(shè)施環(huán)境進(jìn)行信息集成與匯聚的模式創(chuàng)新、應(yīng)用創(chuàng)新和外延服務(wù)創(chuàng)新,形成基于大數(shù)據(jù)的科技資源信息管理、信息調(diào)度和信息處理的基礎(chǔ)環(huán)境。此外,公共財(cái)政支持的科技計(jì)劃項(xiàng)目、科研業(yè)務(wù)工作等也產(chǎn)生大量的科技資源信息,通過(guò)國(guó)家科技管理信息系統(tǒng)、國(guó)家科技報(bào)告制度、國(guó)家科技資源共享服務(wù)平臺(tái)匯聚了大量科技人、財(cái)、物信息。對(duì)于這些信息,可探索建立統(tǒng)一的科技資源信息集成和匯聚平臺(tái),形成資源信息相對(duì)集中、資源實(shí)體物理分布的信息集成與匯聚體系。提高科技財(cái)政投入效率優(yōu)化科技資源配置、支撐政府有效決策。
針對(duì)當(dāng)前科技資源信息數(shù)量多、來(lái)源廣、格式多樣、增長(zhǎng)速度快,如果缺少統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,難以實(shí)現(xiàn)科技資源信息的充分傳播。為使科技資源信息適應(yīng)大數(shù)據(jù)環(huán)境下的信息交換模式,需要制定統(tǒng)一的科技資源信息標(biāo)準(zhǔn),規(guī)范各機(jī)構(gòu)的科技資源信息建設(shè)行為。在國(guó)家、行業(yè)標(biāo)準(zhǔn)的基礎(chǔ)上,應(yīng)建立統(tǒng)一的科技資源信息數(shù)據(jù)標(biāo)準(zhǔn),結(jié)合大數(shù)據(jù)環(huán)境下的信息處理要求與規(guī)范,建立一套從科技資源信息采集、信息傳輸、信息處理、信息存儲(chǔ)、信息發(fā)布與服務(wù)等的完整標(biāo)準(zhǔn)化體系,規(guī)范提供相關(guān)科技資源信息的背景描述性信息,建設(shè)大數(shù)據(jù)背景下常態(tài)化的科技資源信息標(biāo)準(zhǔn)化日常管理規(guī)范,保證科技資源信息內(nèi)容的質(zhì)量和科技含金量。
科技資源信息涉及國(guó)家經(jīng)濟(jì)、社會(huì)發(fā)展等各個(gè)方面,將科技資源信息轉(zhuǎn)化為知識(shí)甚至智慧,是未來(lái)科技創(chuàng)新驅(qū)動(dòng)發(fā)展的必然趨勢(shì)。要充分挖掘和利用科技資源信息,建立高效的信息數(shù)據(jù)分析和利用的應(yīng)用技術(shù)體系,如將信息進(jìn)行關(guān)聯(lián)性價(jià)值分析的應(yīng)用技術(shù)系統(tǒng),實(shí)現(xiàn)多信息充分融合,通過(guò)系統(tǒng)對(duì)科技資源信息進(jìn)行垂直整合或?qū)ο嚓P(guān)科技領(lǐng)域進(jìn)行水平整合,這就需要大數(shù)據(jù)系統(tǒng)自動(dòng)采集大量數(shù)據(jù),學(xué)習(xí)大量相關(guān)規(guī)則。通過(guò)利用人工智能、機(jī)器學(xué)習(xí)等領(lǐng)域的理論,以科技資源信息數(shù)據(jù)分析為核心,融合云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)等大數(shù)據(jù)技術(shù),研究開(kāi)發(fā)非結(jié)構(gòu)化數(shù)據(jù)處理、非關(guān)系型數(shù)據(jù)管理系統(tǒng)和數(shù)據(jù)可視化軟件等先進(jìn)大數(shù)據(jù)處理工具系統(tǒng),為大數(shù)據(jù)背景下的科技資源信息挖掘與利用提供先進(jìn)的技術(shù)支撐。
在大數(shù)據(jù)背景下開(kāi)展科技資源信息分析挖掘與利用的關(guān)鍵問(wèn)題就是要找準(zhǔn)需求。針對(duì)科技創(chuàng)新、民生發(fā)展、國(guó)家安全等關(guān)鍵問(wèn)題,運(yùn)用先進(jìn)的大數(shù)據(jù)技術(shù)進(jìn)行相關(guān)資源信息的收集整理,充分利用大數(shù)據(jù)的先進(jìn)管理模式和信息處理手段,對(duì)科技資源信息進(jìn)行有效的分析挖掘,形成可供使用的知識(shí)結(jié)果,為科技創(chuàng)新和管理決策提供支撐。
同時(shí),利用大數(shù)據(jù)自身的優(yōu)勢(shì),探尋面向科技創(chuàng)新市場(chǎng)的巨大需求,順應(yīng)當(dāng)前以市場(chǎng)為主體的科技創(chuàng)新決策部署,研究能夠滿足更廣泛市場(chǎng)需求的科技資源信息產(chǎn)品,以支撐科技創(chuàng)新研究與決策市場(chǎng)化發(fā)展,將成為大數(shù)據(jù)背景下科技資源信息挖掘與利用的另一重要領(lǐng)域。
隨著我國(guó)科技資源規(guī)??焖僭鲩L(zhǎng),科技資源信息海量、復(fù)雜、異構(gòu)等特點(diǎn)愈發(fā)明顯,大數(shù)據(jù)的特點(diǎn)和發(fā)展趨勢(shì)對(duì)科技資源信息的管理和利用提出了更多更大的挑戰(zhàn),使得以往相對(duì)獨(dú)立、封閉的科技資源應(yīng)用模式難以適應(yīng)新形勢(shì)下的科技創(chuàng)新活動(dòng)。雖然我國(guó)科技資源信息化程度明顯提高,資源信息的公開(kāi)渠道更加多樣和便捷,科技資源信息基礎(chǔ)設(shè)施也得到較快發(fā)展,但仍然面臨著科技資源信息數(shù)量龐雜、信息源頭眾多、結(jié)構(gòu)內(nèi)容各異等諸多問(wèn)題,從而導(dǎo)致科技資源信息內(nèi)容的利用率較低。
我國(guó)科技資源信息的積累和整合工作起步較晚,對(duì)大數(shù)據(jù)的理論研究和技術(shù)應(yīng)用也才開(kāi)始。然而,當(dāng)前的大數(shù)據(jù)環(huán)境為科技資源信息的發(fā)展提供了良好的發(fā)展契機(jī)和廣闊發(fā)展空間,其他領(lǐng)域的成功經(jīng)驗(yàn)為科技資源信息的挖掘與利用提供了借鑒。利用先進(jìn)的大數(shù)據(jù)理論和方法,深入挖掘科技資源信息價(jià)值,提高科技資源信息服務(wù)能力,有助于發(fā)揮科技資源對(duì)科技創(chuàng)新和經(jīng)濟(jì)社會(huì)發(fā)展的支撐作用。
在大數(shù)據(jù)背景下加強(qiáng)對(duì)科技資源信息挖掘和利用,積極面向科技創(chuàng)新發(fā)展和管理決策需求,加強(qiáng)科技資源的匯聚、公開(kāi)與整合,加強(qiáng)科技資源信息標(biāo)準(zhǔn)化體系建設(shè),研發(fā)相關(guān)軟件與工具,加強(qiáng)科技資源信息基礎(chǔ)設(shè)施建設(shè),深度挖掘與利用相關(guān)科技資源信息,實(shí)現(xiàn)科技資源信息利用的最優(yōu)化,保障科技資源受益群體,促進(jìn)資源效益最大化,是未來(lái)相當(dāng)長(zhǎng)時(shí)間內(nèi)的工作目標(biāo)和主要任務(wù)。
[1]王學(xué)琴, 楊劍, 康磊, 等.大數(shù)據(jù)驅(qū)動(dòng)科技信息資源市場(chǎng)化開(kāi)發(fā)利用[J].中國(guó)科技信息, 2015(5): 29-30.
[2]丁厚德.科技資源及其配置的研究[J].中國(guó)科技資源導(dǎo)刊 , 2009, 41(2): 1-7.DOI: 10.3772/j.issn.1674-1544.2009.02.001
[3]李揚(yáng).科技圖書(shū)館一站式知識(shí)產(chǎn)品與服務(wù)研究[C]//全國(guó)圖書(shū)館學(xué)情報(bào)學(xué)集成創(chuàng)新與發(fā)展學(xué)術(shù)研討會(huì),2007.
[4]鄒佳利, 山紅梅.基于云計(jì)算的科技資源共享問(wèn)題研究 [J].科技管理研究, 2013, 33(8): 186-189.
[5]楊慧, 宋華.大數(shù)據(jù)背景下的信息資源管理與利用[J].管理觀察 , 2016(3): 47-49.
[6]陳敏, 劉寧.醫(yī)療健康大數(shù)據(jù)發(fā)展現(xiàn)狀研究[J].中國(guó)醫(yī)院管理 , 2017, 37(2): 46-48.
[7]王宏起, 程淑娥, 李玥.大數(shù)據(jù)環(huán)境下區(qū)域科技資源共享平臺(tái)云服務(wù)模式研究[J].情報(bào)理論與實(shí)踐, 2017,40(3): 42-47.
[8]宋立榮, 齊娜.我國(guó)網(wǎng)絡(luò)科技信息資源開(kāi)發(fā)中的問(wèn)題及對(duì)策思考[J].中國(guó)基礎(chǔ)科學(xué), 2012, 14(2): 39-44.
[9]崔巍.大數(shù)據(jù)在氣象服務(wù)中的應(yīng)用與分析[J].低碳世界 , 2016(26): 121-122.
[10]張碩, 韓紀(jì)富, 史海英.大數(shù)據(jù)時(shí)代科技期刊數(shù)字化發(fā)展探析[J].科技視界, 2015(33): 109-110.
[11]陳志輝, 孫亮, 馬欣, 等.我國(guó)科技資源共享立法策略研究[J].中國(guó)科技論壇, 2013(8): 5-8.
Reflections on Mining and Utilization of Sci-Tech Resources Information Under Big Data
YUAN Wei1, SHI Lei2
(1.Institute of Scientific and Technical Information of China, Beijing 100038; 2.National Science and Technology Infrastructure Management center, Beijing 100862)
Sci-tech resources information is not only the foundation of sci-tech innovation, but also an significant manifestation of sci-tech creative strength. This paper summarizes the development trend of domestic and international sci-tech resources information, expounds the key role of sci-tech resources information in scienti fi c research and innovation, summarizes the development status of information resources in China, analyzes the existing problems in the development of sci-tech resources information, discusses the mining and utilization of the direction and thinking of strengthening the sci-tech resources information under big data background, in order to provide reference for further promotion of the sci-tech resources information.
big data, scientific and technical, resources, scientific and technical resources information,information mining, information utilization
G203
A
10.3772/j.issn.1674-1544.2017.06.001
袁偉(1962—),男,中國(guó)科學(xué)技術(shù)信息研究所教授,研究方向:科技資源管理戰(zhàn)略研究;石蕾(1982—),女,國(guó)家科技基礎(chǔ)條件平臺(tái)中心副研究員,研究方向:科技資源管理(通訊作者)。
國(guó)家自然科學(xué)基金項(xiàng)目“科技基礎(chǔ)條件對(duì)創(chuàng)新能力影響的定量研究”(m1551001)。
2017年8月14日。