• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      科學(xué)數(shù)據(jù)情報(bào)化及其在圖書館學(xué)科化服務(wù)中的應(yīng)用研究

      2024-11-05 00:00:00馬麗麗楊碩
      圖書館界 2024年5期

      [摘 要]人工智能技術(shù)的發(fā)展給圖書館知識服務(wù)帶來了機(jī)遇和挑戰(zhàn)。從圖書館學(xué)科化服務(wù)的視角出發(fā),論述科學(xué)數(shù)據(jù)情報(bào)化的發(fā)展現(xiàn)狀與趨勢、問題和挑戰(zhàn),提出科學(xué)數(shù)據(jù)情報(bào)化的實(shí)現(xiàn)途徑及技術(shù)方法體系,探討科學(xué)數(shù)據(jù)情報(bào)化在圖書館學(xué)科化服務(wù)中的應(yīng)用場景,包括智慧館員、科學(xué)數(shù)據(jù)數(shù)字化管理、人工智能科學(xué)家、輔助同行評議、科研誠信評價(jià)、虛擬仿真和智能教育等,以期為數(shù)智時(shí)代下今后圖書館學(xué)科化服務(wù)提供思路和參考。

      [關(guān)鍵詞]科學(xué)數(shù)據(jù);情報(bào)化;圖書館;學(xué)科化服務(wù)

      [中圖分類號]G250[文獻(xiàn)標(biāo)志碼]A[文章編號]1005-6041(2024)05-0034-06

      1 引 言

      科學(xué)數(shù)據(jù)(Scientific Data)作為國家數(shù)據(jù)戰(zhàn)略的有機(jī)組成,在實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略、促進(jìn)產(chǎn)業(yè)現(xiàn)代化變革、支撐公眾健康、維護(hù)國家安全與社會(huì)穩(wěn)定等方面具有重大價(jià)值,已成為國家重要的戰(zhàn)略科技資產(chǎn)和競爭要素[1]??茖W(xué)數(shù)據(jù)情報(bào)化作為一個(gè)新興的研究方向,通過發(fā)揮情報(bào)學(xué)領(lǐng)域的技術(shù)優(yōu)勢,與大數(shù)據(jù)、信息資源管理等領(lǐng)域交叉融合,為基于科學(xué)數(shù)據(jù)綜合利用的自然科學(xué)研究及創(chuàng)新活動(dòng)提供服務(wù),從而實(shí)現(xiàn)數(shù)據(jù)增值。2020年,伴隨AlphaFold的推出[2-3],AlphaFold2成功預(yù)測了人類98.5[WTB3]%[WTBZ]的蛋白質(zhì)3D結(jié)構(gòu),進(jìn)一步顯示了數(shù)據(jù)密集型科研范式下科學(xué)數(shù)據(jù)情報(bào)化擁有的廣泛應(yīng)用前景。本文在概述科學(xué)數(shù)據(jù)情報(bào)化發(fā)展現(xiàn)狀、趨勢、問題和挑戰(zhàn)基礎(chǔ)上,重點(diǎn)探討科學(xué)數(shù)據(jù)情報(bào)化的實(shí)現(xiàn)途徑及在圖書館學(xué)科化服務(wù)中的應(yīng)用場景,為大數(shù)據(jù)背景下的圖書館知識服務(wù)理論研究和實(shí)踐提供參考。

      2 科學(xué)數(shù)據(jù)情報(bào)化概述

      2.1 發(fā)展現(xiàn)狀與趨勢

      在中國知網(wǎng)中可檢索到“情報(bào)化”相關(guān)的文獻(xiàn)70余篇。情報(bào)化的概念可追溯到20世紀(jì)80年代初國內(nèi)關(guān)于“情報(bào)化社會(huì)”的討論[4-5]。在相關(guān)研究中,有學(xué)者提出情報(bào)化社會(huì)來源于“后工業(yè)社會(huì)”,認(rèn)為知識和情報(bào)已成為比物質(zhì)、能源更重要的資源,使社會(huì)經(jīng)濟(jì)運(yùn)行產(chǎn)生深刻變革。同一時(shí)期,業(yè)界也引發(fā)關(guān)于圖書館工作的情報(bào)化轉(zhuǎn)變和挑戰(zhàn)的討論[6-7]。十幾年來,隨著全球信息化和數(shù)字化進(jìn)程的加速,關(guān)于信息或大數(shù)據(jù)的“情報(bào)化”問題雖然熱度漸起,但相關(guān)研究仍停留在企業(yè)運(yùn)營數(shù)據(jù)情報(bào)化等層面[8-10]。

      廣義范疇上的科學(xué)數(shù)據(jù)包括通過實(shí)驗(yàn)、觀測、調(diào)查等科技活動(dòng)獲取的原始數(shù)據(jù),以及按特定需求系統(tǒng)加工生成的衍生數(shù)據(jù)[11]。一些發(fā)達(dá)國家和地區(qū)較早即重視科學(xué)數(shù)據(jù)的戰(zhàn)略價(jià)值和數(shù)據(jù)利用,如2018年美國國立衛(wèi)生研究院(NIH)發(fā)布第一個(gè)數(shù)據(jù)科學(xué)管理戰(zhàn)略《NIH數(shù)據(jù)科學(xué)戰(zhàn)略計(jì)劃》,旨在最大程度地提高NIH產(chǎn)生的大量醫(yī)學(xué)數(shù)據(jù)的利用率和科學(xué)價(jià)值,推動(dòng)美國的生物醫(yī)學(xué)研究;從《開放科學(xué)2030》到“地平線2020”再到“歐洲云計(jì)劃”,歐盟一直是開放科學(xué)和科學(xué)數(shù)據(jù)共享的重要推動(dòng)者;2021年法國發(fā)布《大數(shù)據(jù)、算法和源代碼政策:2021—2024路線圖》,旨在打通科研數(shù)據(jù)壁壘,建設(shè)全國一體化的科研大數(shù)據(jù)平臺。近年來,我國也越來越重視科學(xué)數(shù)據(jù)的規(guī)范管理和高水平共享。2018年,國務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》;2023年12月31日,國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素x”三年行動(dòng)計(jì)劃(2024—2026年)》,并選取工業(yè)制造、現(xiàn)代農(nóng)業(yè)、商貿(mào)流通等12個(gè)行業(yè)和領(lǐng)域先行推動(dòng)。在人工智能、機(jī)器學(xué)習(xí)等技術(shù)的“加持”下,勢必將帶來科學(xué)數(shù)據(jù)情報(bào)化的變革性發(fā)展,其未來發(fā)展?jié)摿Σ蝗菪∮U[12]。總體而言,科學(xué)數(shù)據(jù)情報(bào)化的作用及必要性體現(xiàn)在以下方面。1)科學(xué)數(shù)據(jù)情報(bào)化是科技創(chuàng)新智能化的發(fā)展趨勢。當(dāng)前人工智能等新一代信息技術(shù)快速發(fā)展,有研究稱科學(xué)研究將進(jìn)入“智能化科研”(AI4R)的第五范式[13],科學(xué)數(shù)據(jù)對科研活動(dòng)的基礎(chǔ)支撐作用也越來越顯著。借助大數(shù)據(jù)挖掘和分析技術(shù),進(jìn)行學(xué)科領(lǐng)域多源科學(xué)數(shù)據(jù)以及跨學(xué)科間的融合、關(guān)聯(lián),將科學(xué)數(shù)據(jù)轉(zhuǎn)化為有情報(bào)價(jià)值的信息有助于促進(jìn)科學(xué)研究向數(shù)字化、智能化發(fā)展。2)科學(xué)數(shù)據(jù)情報(bào)化是現(xiàn)代社會(huì)數(shù)據(jù)利用的現(xiàn)實(shí)需求。美國前國家情報(bào)總監(jiān)丹·考茨曾說:“情報(bào)界的首要任務(wù)是縮小數(shù)據(jù)和決策之間的鴻溝?!痹诋?dāng)前互聯(lián)網(wǎng)“數(shù)據(jù)爆炸”的時(shí)代背景下,通過科學(xué)數(shù)據(jù)情報(bào)化,揭示海量數(shù)據(jù)背后隱藏的規(guī)律和趨勢,輔助科技決策,為學(xué)科態(tài)勢掃描、預(yù)測預(yù)警等提供支撐,滿足行業(yè)市場在產(chǎn)業(yè)投資、資源配置、技術(shù)突破等方面的綜合需求[8,14]。3)科學(xué)數(shù)據(jù)情報(bào)化是現(xiàn)代圖書館服務(wù)縱向發(fā)展的必然選擇。對數(shù)量大、類型復(fù)雜、碎片化的科學(xué)數(shù)據(jù)進(jìn)行關(guān)聯(lián)、挖掘、提煉后形成情報(bào),以易懂、直觀的情報(bào)產(chǎn)品呈現(xiàn)給用戶是現(xiàn)代圖書館服務(wù)的必然需求點(diǎn)。在以網(wǎng)絡(luò)信息為主要載體的情報(bào)3.0時(shí)代下[15],科學(xué)數(shù)據(jù)情報(bào)化有助于圖書館從“科學(xué)數(shù)據(jù)管理”服務(wù)向“科學(xué)數(shù)據(jù)情報(bào)”服務(wù)的增值性轉(zhuǎn)變,能在數(shù)據(jù)服務(wù)中凸顯情報(bào)化特色。

      2.2 問題和挑戰(zhàn)

      2.2.1 高水平開放共享是制約科學(xué)數(shù)據(jù)情報(bào)化的重要因素。隨著《科學(xué)數(shù)據(jù)管理辦法》的發(fā)布,國內(nèi)科學(xué)數(shù)據(jù)的開放創(chuàng)新生態(tài)已逐步形成。但由于不同領(lǐng)域的科學(xué)數(shù)據(jù)缺乏統(tǒng)一的格式和標(biāo)準(zhǔn),學(xué)科間仍存在隔閡,給科學(xué)數(shù)據(jù)的質(zhì)量控制、匯交廣度和整合利用帶來了困難,高質(zhì)量的科學(xué)數(shù)據(jù)供給仍然不足。同時(shí),隨著數(shù)據(jù)共享和開放的推動(dòng),科學(xué)數(shù)據(jù)情報(bào)化也面臨著數(shù)據(jù)隱私、數(shù)據(jù)安全和知識產(chǎn)權(quán)等問題的挑戰(zhàn),統(tǒng)籌科學(xué)數(shù)據(jù)開放與安全利用的數(shù)據(jù)治理制度有待完善。

      2.2.2 “信息化”并不等于“情報(bào)化”。當(dāng)前各行各業(yè)的信息化、數(shù)字化建設(shè)如火如荼,針對特定學(xué)科領(lǐng)域的各類科學(xué)數(shù)據(jù)中心、數(shù)據(jù)倉儲(chǔ)等科學(xué)大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)也取得了較大進(jìn)展,科學(xué)數(shù)據(jù)采集、管理、建模等技術(shù)也得到較大提高。但是,目前業(yè)界普遍存在著“重存儲(chǔ)、輕利用”的問題,僅是科學(xué)數(shù)據(jù)和資源的集成與匯編,不能實(shí)現(xiàn)完全意義上的“情報(bào)化”,導(dǎo)致數(shù)據(jù)的積累與數(shù)據(jù)的利用之間仍存在明顯的鴻溝。

      2.2.3 科學(xué)數(shù)據(jù)情報(bào)化的關(guān)鍵在“化”。從思維邏輯方面來看,情報(bào)化是一種理性、經(jīng)驗(yàn)與人腦認(rèn)知活動(dòng)結(jié)合的復(fù)雜思維活動(dòng),當(dāng)前我國科學(xué)數(shù)據(jù)服務(wù)人員的數(shù)據(jù)分析技術(shù)已處于世界領(lǐng)先水平,但基于海量科學(xué)數(shù)據(jù)開展價(jià)值信息提取的情報(bào)思維和能力仍是科學(xué)數(shù)據(jù)情報(bào)化工作的瓶頸。從技術(shù)方面來看,科學(xué)數(shù)據(jù)的情報(bào)提取整體上仍缺乏現(xiàn)代、高效的計(jì)算和分析手段,智能化、智慧化仍是未來很長一段時(shí)間內(nèi)科學(xué)數(shù)據(jù)情報(bào)化面臨的挑戰(zhàn)。

      3 科學(xué)數(shù)據(jù)情報(bào)化的實(shí)現(xiàn)途徑

      科學(xué)數(shù)據(jù)的“情報(bào)化”既是目標(biāo),也是手段,不僅關(guān)注數(shù)據(jù)的獲取、存儲(chǔ)和整合,更重要的是提取和洞察其中所蘊(yùn)含的知識和情報(bào)信息,提高數(shù)據(jù)的可理解性和可利用性。以下分四個(gè)階段闡述科學(xué)數(shù)據(jù)情報(bào)化的實(shí)現(xiàn)途徑。

      3.1 科學(xué)數(shù)據(jù)的收集與整合

      科學(xué)數(shù)據(jù)的收集與整合是情報(bào)化的基礎(chǔ),只有保障數(shù)據(jù)的準(zhǔn)確性、一致性和可信度才能確保從中提取的情報(bào)具有可靠性。該階段涉及多源異構(gòu)數(shù)據(jù)的結(jié)構(gòu)化,并對原始數(shù)據(jù)中的噪聲、錯(cuò)誤、缺失或冗余信息等進(jìn)行預(yù)處理,主要步驟如下。1)數(shù)據(jù)采集與預(yù)處理。數(shù)據(jù)采集前,需要明確采集的目標(biāo)和范圍,并選擇適當(dāng)?shù)臄?shù)據(jù)源和采集方法。除了科研活動(dòng)中通過傳感器、實(shí)驗(yàn)儀器等直接獲得的實(shí)驗(yàn)數(shù)據(jù),科學(xué)數(shù)據(jù)常用的數(shù)據(jù)源還包括媒體、網(wǎng)站、開放獲取(OA)數(shù)據(jù)、領(lǐng)域?qū)I(yè)數(shù)據(jù)庫等渠道可獲得的公開信息,以及通過文獻(xiàn)數(shù)據(jù)庫、專利數(shù)據(jù)庫、商業(yè)數(shù)據(jù)庫等合法獲得的信息。然后,對采集的原始數(shù)據(jù)進(jìn)行預(yù)處理,以便后續(xù)的清洗和整合,其中缺失值處理和異常值檢測是兩個(gè)重要的預(yù)處理方法。2)數(shù)據(jù)清洗與轉(zhuǎn)換。為了確保數(shù)據(jù)的準(zhǔn)確性和一致性,需要對數(shù)據(jù)中的噪聲、錯(cuò)誤和冗余信息進(jìn)行修復(fù)和去除,并將原始數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù)集以滿足后續(xù)處理的需求??衫镁幊陶Z言、數(shù)據(jù)處理軟件和數(shù)據(jù)庫管理系統(tǒng)等工具,結(jié)合缺失值處理、噪聲去除、數(shù)據(jù)沖突解決、元數(shù)據(jù)等技術(shù),提高科學(xué)數(shù)據(jù)的質(zhì)量、適用性和可分析性。3)數(shù)據(jù)集成與融合。

      將多個(gè)數(shù)據(jù)源整合為統(tǒng)一的數(shù)據(jù)集需要解決不同數(shù)據(jù)源的語義差異、數(shù)據(jù)格式差異和數(shù)據(jù)質(zhì)量差異等問題,常用的方法包括基于映射規(guī)則的數(shù)據(jù)集成和基于機(jī)器學(xué)習(xí)的數(shù)據(jù)融合。基于映射規(guī)則的數(shù)據(jù)集成方法通過定義一組映射規(guī)則,將不同數(shù)據(jù)源的數(shù)據(jù)映射到一個(gè)統(tǒng)一的模式中;基于機(jī)器學(xué)習(xí)的數(shù)據(jù)融合方法利用機(jī)器學(xué)習(xí)算法,通過對數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)來生成一個(gè)融合后的數(shù)據(jù)集。

      3.2 科學(xué)數(shù)據(jù)的分析與挖掘

      數(shù)據(jù)分析與挖掘作為科學(xué)數(shù)據(jù)情報(bào)化的核心環(huán)節(jié),主要是利用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等方法來揭示數(shù)據(jù)中隱藏的模式、關(guān)聯(lián)規(guī)則和異常情況等,降低科研人員和決策者從海量數(shù)據(jù)中提取價(jià)值信息的難度。主要方法有以下幾種。1)數(shù)據(jù)挖掘技術(shù)。通常使用計(jì)算機(jī)編輯程序?qū)Υ髷?shù)據(jù)進(jìn)行分析、模式識別和預(yù)測。通過使用統(tǒng)計(jì)軟件、機(jī)器學(xué)習(xí)庫和數(shù)據(jù)可視化工具等,結(jié)合分類、預(yù)測、關(guān)聯(lián)規(guī)則挖掘和異常檢測等技術(shù),從大規(guī)??茖W(xué)數(shù)據(jù)中提取信息。2)自然語言處理(NLP)。作為一種可自動(dòng)發(fā)現(xiàn)、提取和分析信息的文本挖掘方法,NLP技術(shù)在科學(xué)文獻(xiàn)的知識發(fā)現(xiàn)中有成熟的應(yīng)用[16]。通過文本分析、關(guān)鍵詞提取和實(shí)體識別等技術(shù),自動(dòng)解析科學(xué)論文、專利和研究報(bào)告等非結(jié)構(gòu)化的大規(guī)模文本數(shù)據(jù),幫助科研人員發(fā)現(xiàn)研究熱點(diǎn)。3)數(shù)據(jù)建模。基于已有科學(xué)數(shù)據(jù)構(gòu)建模型,從大規(guī)模數(shù)據(jù)中學(xué)習(xí)更高層次的特征表示,以揭示數(shù)據(jù)中的潛在關(guān)系、趨勢和規(guī)律,實(shí)現(xiàn)對未來事件的預(yù)測。常用的技術(shù)包括回歸分析、聚類分析、決策樹等統(tǒng)計(jì)學(xué)方法[17]。4)圖像處理技術(shù)。圖像形式的科學(xué)數(shù)據(jù)挖掘在科學(xué)數(shù)據(jù)情報(bào)化中的應(yīng)用日益重要。例如,通過深度學(xué)習(xí)技術(shù)對天空圖像進(jìn)行分析和處理,可以幫助科研人員發(fā)現(xiàn)新的天體、研究宇宙演化、進(jìn)行遙感地物識別等;利用生物醫(yī)學(xué)圖像分析可以幫助醫(yī)生進(jìn)行疾病早期診斷等[18-19]。

      3.3 科學(xué)數(shù)據(jù)的情報(bào)推理與轉(zhuǎn)化

      情報(bào)推理是將科學(xué)數(shù)據(jù)轉(zhuǎn)化為可用情報(bào)的關(guān)鍵過程,通過運(yùn)用情報(bào)學(xué)的理論和方法,對科學(xué)數(shù)據(jù)背后的“暗信息”進(jìn)行研究、甄別、篩選、判斷和推理,從中提取有價(jià)值的情報(bào)信息。1)扎根理論。多用于研究人類行為和社會(huì)現(xiàn)象背后的意義和動(dòng)因,是一種定性研究方法[20]。在科學(xué)數(shù)據(jù)的情報(bào)推理轉(zhuǎn)化過程中,扎根理論可以幫助研究人員更好地揭示科學(xué)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)性,為情報(bào)工作提供更加準(zhǔn)確和有洞察力的解釋。2)“以目標(biāo)為中心”方法。2003年,

      美國情報(bào)家羅伯特·克拉克等提出一種情報(bào)分析流程[21],這種方法強(qiáng)調(diào)情報(bào)工作目標(biāo)的主導(dǎo)地位,始終將用戶需求納入決策,圍繞目標(biāo),由所有利益相關(guān)者協(xié)同參與情報(bào)分析過程。3)統(tǒng)計(jì)分析方法。主要利用假設(shè)檢驗(yàn)、相關(guān)分析、回歸分析、因子分析等多種定量分析方法,對科學(xué)數(shù)據(jù)進(jìn)行計(jì)算、解釋和推理,發(fā)現(xiàn)科學(xué)數(shù)據(jù)的分布特征、變化趨勢、相關(guān)關(guān)系等,為最終做出正確的情報(bào)結(jié)論提供數(shù)據(jù)支撐。4)科學(xué)計(jì)量法。主要通過文獻(xiàn)計(jì)量、文本計(jì)量、主題聚類、社會(huì)網(wǎng)絡(luò)分析等方法來揭示學(xué)科領(lǐng)域的現(xiàn)狀、演化特征、前沿?zé)狳c(diǎn)和競爭態(tài)勢等。常用的數(shù)據(jù)源主要為科技論文、專利、政策文件、報(bào)告等,分析維度包括時(shí)間、國家、機(jī)構(gòu)、主題等。除了充分運(yùn)用情報(bào)學(xué)方法,特定學(xué)科領(lǐng)域?qū)I(yè)知識和方法的結(jié)合應(yīng)用也很重要,并在必要時(shí)積極借助專家智慧對分析結(jié)果進(jìn)行解讀。

      3.4 科學(xué)數(shù)據(jù)的情報(bào)產(chǎn)品與輸出

      情報(bào)產(chǎn)品的形成與輸出是決定科學(xué)數(shù)據(jù)情報(bào)化效果的“最后一公里”,產(chǎn)品形式一般包括簡報(bào)、快報(bào)、研究報(bào)告、數(shù)據(jù)集、數(shù)據(jù)庫、知識圖譜等類型,情報(bào)產(chǎn)品既要專業(yè)準(zhǔn)確,又要淺顯易懂,方便不同領(lǐng)域的用戶理解和采用。

      數(shù)據(jù)可視化、虛擬現(xiàn)實(shí)等技術(shù)可以為用戶提供直觀、交互式的情報(bào)利用環(huán)境,用戶可進(jìn)行檢索、瀏覽、數(shù)據(jù)定制、圖表可視化、視覺生成、音頻輸出等交互操作,加強(qiáng)用戶對數(shù)據(jù)和情報(bào)的深入理解。另外,未來AI技術(shù)將在科學(xué)數(shù)據(jù)情報(bào)化的自動(dòng)化流程、智能算法、數(shù)據(jù)可視化、智慧推薦、生成式情報(bào)等方面實(shí)現(xiàn)更加暢通的人機(jī)交互溝通。

      4 科學(xué)數(shù)據(jù)情報(bào)化在圖書館學(xué)科化服務(wù)中的應(yīng)用場景設(shè)想

      科學(xué)數(shù)據(jù)與一般數(shù)據(jù)等不同,具有明顯的學(xué)科性。因此,科學(xué)數(shù)據(jù)服務(wù)需要服務(wù)者具備專業(yè)學(xué)科、數(shù)據(jù)分析、圖書文獻(xiàn)和情報(bào)學(xué)的綜合素養(yǎng)。國內(nèi)外很多高校和專業(yè)圖書館都提供基于學(xué)科館員團(tuán)隊(duì)的面向研究機(jī)構(gòu)的學(xué)科化服務(wù)。學(xué)科館員既擁有某學(xué)科的自然科學(xué)背景,又熟悉圖書情報(bào)工作,在此服務(wù)優(yōu)勢下,科學(xué)數(shù)據(jù)服務(wù)已成為近年來圖書館學(xué)科化服務(wù)的重要內(nèi)容之一[15,22]。研究科學(xué)數(shù)據(jù)情報(bào)化,可實(shí)現(xiàn)科學(xué)數(shù)據(jù)的有機(jī)整合和增值利用,為學(xué)科化服務(wù)注入新的活力,其應(yīng)用場景可如圖1所示。

      4.1 基于知識挖掘和重組的智慧館員服務(wù)

      擁有豐富的紙本和電子文獻(xiàn)資源以及各種專業(yè)數(shù)據(jù)庫一直是圖書館的一大重要優(yōu)勢。在現(xiàn)有學(xué)科化服務(wù)基礎(chǔ)上,學(xué)科館員要發(fā)揮文獻(xiàn)資源優(yōu)勢,進(jìn)行科學(xué)數(shù)據(jù)的細(xì)粒度知識挖掘和重新組織,綜合運(yùn)用情報(bào)技術(shù)、文獻(xiàn)計(jì)量方法、統(tǒng)計(jì)方法、人工智能、ChatGPT等新技術(shù),依托智慧數(shù)據(jù)平臺,改進(jìn)傳統(tǒng)的圖書館參考咨詢服務(wù),為科研人員快速了解學(xué)科領(lǐng)域國內(nèi)外進(jìn)展、前沿方向、技術(shù)布局、交叉研究等提供智慧問答和咨詢服務(wù),助力搶占領(lǐng)域科技制高點(diǎn)。

      4.2 科學(xué)數(shù)據(jù)的數(shù)字管理與重用服務(wù)

      大數(shù)據(jù)時(shí)代,科學(xué)數(shù)據(jù)的綜合分析已成為科技創(chuàng)新的重要支撐,如美國航空航天局(NASA)的地球科學(xué)數(shù)據(jù)和信息系統(tǒng),美國國家海洋與大氣管理局(NOAA)的海洋氣候大數(shù)據(jù)管理,生命科學(xué)領(lǐng)域的NCBI、GenBank、EMBL、UniProt等科學(xué)數(shù)據(jù)倉儲(chǔ),對相關(guān)領(lǐng)域的科技創(chuàng)新發(fā)揮了重要作用[23-24]。在服務(wù)過程中,學(xué)科館員可發(fā)揮學(xué)科背景和情報(bào)學(xué)的交叉優(yōu)勢,輔助研究機(jī)構(gòu)制訂科學(xué)數(shù)據(jù)管理計(jì)劃,為研究機(jī)構(gòu)的科學(xué)數(shù)據(jù)收集、長期存儲(chǔ)、共享、數(shù)據(jù)知識產(chǎn)權(quán)、數(shù)據(jù)安全評估等提供服務(wù);聯(lián)合數(shù)據(jù)技術(shù)人員開展學(xué)科領(lǐng)域特色科學(xué)數(shù)據(jù)的采集、二次加工、標(biāo)注和關(guān)聯(lián),利用AI大模型等先進(jìn)技術(shù)開展大規(guī)模文獻(xiàn)的知識挖掘,提升科學(xué)數(shù)據(jù)的質(zhì)量和可重用性[25-26]。

      4.3 人工智能科學(xué)家

      2020年,英國利物浦大學(xué)開發(fā)了一款人工智能機(jī)器人化學(xué)家,之后,國內(nèi)外“機(jī)器人化學(xué)家”的多項(xiàng)成果不斷出現(xiàn)在《科學(xué)》《自然》等高水平期刊上[27-29]。2023年3月,我國科技部、自然科學(xué)基金委聯(lián)合啟動(dòng)了“人工智能驅(qū)動(dòng)的科學(xué)研究”(AI for Science)專項(xiàng),緊密結(jié)合數(shù)學(xué)、物理、化學(xué)、天文等基礎(chǔ)學(xué)科關(guān)鍵問題開展布局。有理由相信,未來將出現(xiàn)更多的“機(jī)器人數(shù)學(xué)家”“機(jī)器人物理學(xué)家”“機(jī)器人天文學(xué)家”等人工智能科學(xué)家。圖書館科學(xué)數(shù)據(jù)情報(bào)化的作用在于,通過對特定領(lǐng)域文獻(xiàn)和科學(xué)數(shù)據(jù)的深度加工,為人工智能科學(xué)家設(shè)計(jì)提供可行的科學(xué)實(shí)驗(yàn)方案,增加實(shí)驗(yàn)的成功率和可信度。

      4.4 科學(xué)數(shù)據(jù)質(zhì)量評價(jià)與同行評議輔助

      在數(shù)據(jù)驅(qū)動(dòng)的科技創(chuàng)新生態(tài)環(huán)境內(nèi),科學(xué)數(shù)據(jù)質(zhì)量評價(jià)將成為科研人員、期刊編輯、審稿專家、學(xué)術(shù)出版機(jī)構(gòu)等關(guān)注的共同問題[30]。圖書館可結(jié)合領(lǐng)域特色,建立特定學(xué)科的科學(xué)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)體系,為投稿人員提供科學(xué)數(shù)據(jù)質(zhì)量評價(jià)、論文影響力預(yù)測和投稿期刊推薦等服務(wù),為審稿人員提供來稿數(shù)據(jù)質(zhì)量審查、審稿專家智能推薦、科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)化存檔等輔助服務(wù)。

      4.5 科技查重與科研誠信評價(jià)

      科學(xué)數(shù)據(jù)開放共享、ChatGPT技術(shù)等雖然有效推動(dòng)了科學(xué)研究的變革,但其背后潛在的數(shù)據(jù)造假和科研誠信風(fēng)險(xiǎn)也愈發(fā)受到學(xué)界關(guān)注[31-32]。科學(xué)數(shù)據(jù)情報(bào)化通過對實(shí)驗(yàn)數(shù)據(jù)、文章圖片、專利、科研項(xiàng)目等科學(xué)數(shù)據(jù)的整合,可為學(xué)術(shù)出版機(jī)構(gòu)、研究機(jī)構(gòu)學(xué)術(shù)委員會(huì)、學(xué)術(shù)會(huì)議舉辦方、科技項(xiàng)目管理部門等提供豐富的科技查重?cái)?shù)據(jù)池。通過建立完善的科技查重?cái)?shù)據(jù)庫,開發(fā)先進(jìn)的智能語義檢測、圖像識別算法等深度學(xué)習(xí)技術(shù),為用戶提供實(shí)驗(yàn)數(shù)據(jù)重用、圖片相似性檢測、專利技術(shù)查新、科技項(xiàng)目查重、科學(xué)數(shù)據(jù)正確引用等服務(wù)。

      4.6 虛擬仿真實(shí)驗(yàn)和智能教育

      作為一種新的科學(xué)研究和科研教學(xué)形式,虛擬仿真實(shí)驗(yàn)具有不受傳統(tǒng)實(shí)驗(yàn)室時(shí)空限制,有效降低實(shí)驗(yàn)感染風(fēng)險(xiǎn)及野外考察危險(xiǎn)性,教學(xué)沉浸感與交互性更強(qiáng)等優(yōu)點(diǎn),在生物學(xué)、地球科學(xué)、海洋科學(xué)、動(dòng)物科學(xué)、臨床醫(yī)學(xué)等領(lǐng)域得到廣泛應(yīng)用[33-34]。通過對特定領(lǐng)域科學(xué)數(shù)據(jù)進(jìn)行整合、知識表示、邏輯關(guān)聯(lián)等情報(bào)化處理,為虛擬仿真實(shí)驗(yàn)提供專業(yè)的知識結(jié)構(gòu)支撐,結(jié)合虛擬現(xiàn)實(shí)、區(qū)塊鏈、數(shù)字孿生、知識圖譜、元宇宙概念等技術(shù),為科學(xué)實(shí)驗(yàn)提供實(shí)體與虛擬相結(jié)合的場景再現(xiàn)。

      5 結(jié) 語

      在當(dāng)前科學(xué)數(shù)據(jù)數(shù)量激增、用戶信息需求不斷提高、科學(xué)數(shù)據(jù)服務(wù)轉(zhuǎn)型升級等現(xiàn)實(shí)背景下,科學(xué)數(shù)據(jù)的深度利用是圖書館學(xué)科化服務(wù)中學(xué)科館員面臨的一個(gè)重要挑戰(zhàn)和機(jī)遇??茖W(xué)數(shù)據(jù)情報(bào)化適應(yīng)圖書館知識服務(wù)向智能化發(fā)展的趨勢,是將圖書情報(bào)、信息技術(shù)、智能工具與特定學(xué)科領(lǐng)域知識深度融合的一個(gè)重要途徑。另外,圖書館的科學(xué)數(shù)據(jù)情報(bào)化服務(wù)思維要從線性向系統(tǒng)性轉(zhuǎn)變,通過科學(xué)數(shù)據(jù)與其他數(shù)據(jù)的多維關(guān)聯(lián),致力于將科學(xué)數(shù)據(jù)轉(zhuǎn)化為易于理解的加工服務(wù)產(chǎn)品,更精準(zhǔn)地滿足新時(shí)代的科研需求。

      [參考文獻(xiàn)]

      [1]郭華東,鄒自明,陳剛,等.科學(xué)數(shù)據(jù)支撐國家重大戰(zhàn)略需求的若干思考[J].科學(xué)通報(bào),2024,69(9):1116-11.

      [2]JUMPER J,EVANS R,PRITZEL A,et al.Highly Accurate Protein Structure Prediction with AlphaFold[J].Nature,2021,596(7873):583-589.

      [3]TUNYASUVUNAKOOL K,ADLER J,WU Z,et al.Highly Accurate Protein Structure Prediction for the Human Proteome[J].Nature,2021,596(7873):590-596.

      [4]肖光.情報(bào)化社會(huì)[J].情報(bào)科學(xué),1980(1):88.

      [5]唐贊雄.情報(bào)化時(shí)代的情報(bào)管理[J].情報(bào)學(xué)刊,1987(1):58-60.

      [6]路林.談專業(yè)圖書館工作情報(bào)化問題[J].圖書館雜志,1985(4):33-34.

      [7]宋繼偉,石進(jìn),呂美香,等.信息情報(bào)化的關(guān)鍵:構(gòu)建CIS分析模塊的思考[J].圖書情報(bào)工作,2012,56(24):33-38.

      [8]張登軍.新媒體時(shí)代企業(yè)財(cái)務(wù)數(shù)據(jù)實(shí)現(xiàn)情報(bào)化途徑探討[J].科技傳播,2017,9(23):178-179.

      [9]張敏.財(cái)務(wù)信息情報(bào)化過程研究[J].現(xiàn)代情報(bào),2013,33(6):112-116.

      [10]曹艷秋,李金蓮.上市公司財(cái)務(wù)信息情報(bào)化過程分析[J].中外企業(yè)家,2016(1):131-132.

      [11]蔣星.國外高校圖書館科學(xué)數(shù)據(jù)管理調(diào)研現(xiàn)狀與啟示[J].圖書館界,2020(1):32-37.

      [12]張婧睿,孫蒙鴿,韓濤.科研智能化趨勢下科研數(shù)據(jù)研究[J].科學(xué)觀察,2023,18(4):49-61.

      [13]李國杰.智能化科研(AI4R):第五科研范式[J].中國科學(xué)院院刊,2024,39(1):1-9.

      [14]王振宇.美國情報(bào)界“數(shù)據(jù)+智能”戰(zhàn)略體系初探[J].軍事文摘,2022(3):33-37.

      [15]吳晨生,張惠娜,劉如,等.追本溯源:情報(bào)3.0時(shí)代對情報(bào)定義的思考[J].情報(bào)學(xué)報(bào),2017,36(1):1-4.

      [16]劉媛.美國自然語言處理技術(shù)專利情報(bào)分析及啟示:基于1999—2018年專利數(shù)據(jù)[J].科技管理研究,2020,40(6):201-209.

      [17]聶少軍,汪運(yùn)鵬,王春,等.激波風(fēng)洞測力信號的頻域數(shù)據(jù)深度學(xué)習(xí)建模分析方法[J].振動(dòng)與沖擊,2023,42(13):296-302,315.

      [18]李曉龍,蔡洪波,黎華麗,等.基于模糊聚類的大視場地基光學(xué)天文圖像薄云識別與分析[J].激光與光電子學(xué)進(jìn)展,2022,59(16):171-177.

      [19]彭斌,白靜,李文靜,等.面向圖像分類的視覺Transformer研究進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2024,18(2):320-344.

      [20]盛東方.我國圖書情報(bào)研究中的扎根理論應(yīng)用[J].圖書館論壇,2020,40(8):78-86.

      [21]吳素彬,陳云,王科選,等.美國“以目標(biāo)為中心”的情報(bào)分析流程研究[J].情報(bào)雜志,2013,32(4):6-9,21.

      [22]師榮華,劉細(xì)文.基于數(shù)據(jù)生命周期的圖書館科學(xué)數(shù)據(jù)服務(wù)研究[J].圖書情報(bào)工作,2011,55(1):39-42.

      [23]劉煒.發(fā)達(dá)國家地質(zhì)大數(shù)據(jù)管理現(xiàn)狀分析與啟示:以美、英、澳、加為例[J].高校地質(zhì)學(xué)報(bào),2022,28(2):274-286.

      [24]姜恩波,李娜.開放科學(xué)環(huán)境下的歐盟研究數(shù)據(jù)開放共享研究[J].世界科技研究與發(fā)展,2020,42(6):655-666.

      [25]秦順,李昊沂,邢文明.數(shù)據(jù)管理計(jì)劃評估準(zhǔn)則:實(shí)踐模式、核心要素及其啟示[J].圖書館論壇,2023,43(5):81-94.

      [26]李斯.圖書情報(bào)科研人員對高校圖書館科學(xué)數(shù)據(jù)共享的感知風(fēng)險(xiǎn)研究[J].圖書館學(xué)研究,2019(9):44-53.

      [27]SLATTERY A,WEN MrYBzUN2U/aL+6VzM+G63g==Z,TENBLAD P,et al.Automated Self-optimization,Intensification,and Scale-up of Photocatalysis in Flow[J].Science,2024,383(6681):1817.

      [28]BURGER B,MAFFETTONE P M,GUSEV V V,et al.A Mobile Robotic Chemist[J].Nature,2020,583(7815):237-241.

      [29]段偉文.人工智能科學(xué)家對科學(xué)認(rèn)識論的挑戰(zhàn)[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023,35(11):4-12.

      [30]撒旭,王健,范智萱,等.數(shù)據(jù)期刊同行評議視角下科學(xué)數(shù)據(jù)質(zhì)量評價(jià)指標(biāo)識別[J].圖書情報(bào)工作,2020,64(17):123-130.

      [31]周謹(jǐn)平.ChatGPT應(yīng)用中的科研誠信風(fēng)險(xiǎn)及其倫理治理[J].中南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2024,30(1):31-37,198.

      [32]徐彤陽,任浩然.數(shù)字圖書館視域下學(xué)術(shù)論文圖像篡改造假檢測研究[J].現(xiàn)代情報(bào),2018,38(7):81-87.

      [33]羅珽,冷偉.沉浸式虛擬現(xiàn)實(shí)技術(shù)在地球科學(xué)中的應(yīng)用[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2021,51(6):431-440.

      [34]李琰,張佳琳,饒星,等.基于數(shù)字化的高校虛擬仿真實(shí)驗(yàn)教學(xué)平臺建設(shè)與實(shí)踐[J].實(shí)驗(yàn)室研究與探索,2023,42(10):233-238.

      [作者簡介]馬麗麗(1989—),女,博士,副研究館員,中國科學(xué)院武漢文獻(xiàn)情報(bào)中心;楊 碩(1997—),女,碩士,華中師范大學(xué)信息管理學(xué)院。

      [說 明]本文分別系2023年度中國科學(xué)院文獻(xiàn)情報(bào)能力建設(shè)專項(xiàng)課題“數(shù)字化科研信息素養(yǎng)培訓(xùn)與服務(wù)”(項(xiàng)目編號:E2291108)、中國科學(xué)院武漢文獻(xiàn)情報(bào)中心“青年領(lǐng)軍人才計(jì)劃”(項(xiàng)目編號:E0KZ451)的研究成果之一。

      古田县| 芜湖县| 建湖县| 武陟县| 厦门市| 获嘉县| 永川市| 遂川县| 高台县| 昌江| 尼木县| 文登市| 石嘴山市| 贺兰县| 邳州市| 中江县| 聂荣县| 绥江县| 九龙城区| 天峨县| 克拉玛依市| 平远县| 万荣县| 新巴尔虎右旗| 南漳县| 监利县| 紫金县| 宜良县| 正宁县| SHOW| 屏东县| 辉南县| 和顺县| 阜阳市| 岳西县| 南安市| 汕头市| 温州市| 长武县| 乐东| 宁明县|