• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術在科研管理方面的應用

      2020-01-17 01:37:38
      黑龍江科學 2020年20期
      關鍵詞:原始數(shù)據(jù)科研成果數(shù)據(jù)挖掘

      聶 迪

      (黑龍江省科學院大慶分院,黑龍江 大慶 163319)

      1 數(shù)據(jù)挖掘技術的涵義與方法

      數(shù)據(jù)挖掘是指從一定的原始數(shù)據(jù)中利用一定的方法挖掘其中的隱含信息的過程。數(shù)據(jù)挖掘是一種計算機科學,與統(tǒng)計學、情報學等有相關性。簡單地說,傳統(tǒng)的信息處理所采用的統(tǒng)計方法是線性的、簡單的,而數(shù)據(jù)挖掘是將原始數(shù)據(jù)通過更為復雜的統(tǒng)計思維,納入一些專家系統(tǒng)作為邏輯,以模式識別等方式來挖掘更為深刻的信息。

      數(shù)據(jù)挖掘技術常用的方法如下:

      神經網絡法。該方法對高等生物的神經網絡系統(tǒng)進行了模擬,使得挖掘工具的處理單元能夠通過不斷地學習來提升對數(shù)據(jù)的認知,就像一個人體一樣,在不同的數(shù)據(jù)環(huán)境中,逐步形成自己的認知思維。具有抗干擾、非線性學習、聯(lián)想記憶等優(yōu)勢。

      決策樹法。該方法是基于對目標變量產生作用的差異而形成分類,因此能夠利用相應的標準對原始數(shù)據(jù)開展分類,并以于樹形結構的形式存在。在決策樹算法的發(fā)展中,經歷了ID3算法、C4.5算法等。這種方法具有透明性、易于理解等優(yōu)勢。

      遺傳算法。該算法是對生物界群體繁殖以及基因結合等進行的模擬,利用基因結合、交叉變異、自然淘汰等模式,來實現(xiàn)數(shù)據(jù)的總結與學習,使得處理單元能夠從不規(guī)則中找出規(guī)律?;凇斑m者生存”的原理,具有隱含并行性、容易與別的模型結合等優(yōu)勢。

      粗糙集法。該方法能夠對一些非完整的數(shù)據(jù)進行一定的處理,在一定的條件下可以實現(xiàn)對數(shù)據(jù)的彌補和完善,有一定的推理性和邏輯分析性,可以有效地建立預測模型。

      模糊集法。該方法基于模糊集合理論對原始數(shù)據(jù)開展模糊評判、模糊決策,與粗糙集方法有一定的類似。

      關聯(lián)規(guī)則法。該方法在數(shù)據(jù)挖掘中經常被使用,以Apriori算法為主,能夠找出所有的頻集,并由此建立強關聯(lián)規(guī)則。

      2 科研管理中數(shù)據(jù)挖掘的步驟

      第一,定義問題。為使數(shù)據(jù)挖掘活動具有清晰準確的目標,需要對要解決的問題進行定義,要清楚地定位需要解決的問題是什么,如評價科研成果、評價科研效率等,因為不同的目標和問題所需要的模型是完全不同的。

      第二,構建數(shù)據(jù)挖掘庫。在確定好需要解決的問題后,需要選擇有效的原始數(shù)據(jù)。對于數(shù)據(jù)挖掘技術的實施來說,原始數(shù)據(jù)通常是越多越好,但并不是需要濫用,在收集到所有的數(shù)據(jù)后,要對其進行一定的選擇,并對數(shù)據(jù)進行描述與匯總,利用傳統(tǒng)的數(shù)據(jù)統(tǒng)計進行元數(shù)據(jù)的搭建,形成數(shù)據(jù)庫。

      第三,分析數(shù)據(jù)。通常是利用數(shù)據(jù)分析軟件進行數(shù)據(jù)的初步分析,因為原始數(shù)據(jù)過于龐大,且很難找到重點,應借助SPSS之類的工具進行歸類,找出不同影響性的數(shù)據(jù)。

      第四,準備數(shù)據(jù)。具體工作是選擇變量、選擇記錄、創(chuàng)建新變量、轉換變量。

      第五,構建模型。通過數(shù)據(jù)挖掘實現(xiàn)對某個問題的解決,需要的工作是多方面的,因此構建模型需要長期實行,反復開展,需要對大量的算法和數(shù)學邏輯進行參考,并在運行后反復優(yōu)化。通常情況下會先用一部分信息構建模型,并利用剩余的信息對模型進行測試,甚至需要另一部分數(shù)據(jù)進行驗證。

      第六,模型的評價。在對模型初步建立之后,還需要對其進行綜合性地評價,對不同的數(shù)據(jù)下得到的結果的合理性進行專家評價,使模型更有價值。在實踐中,通過數(shù)據(jù)挖掘技術來解決一定的問題,還面臨著經濟、人力、技術等方面的限制,所以,應評價這種模型實施的各方面的可行性。

      第七,模型實施。在建立了初步的模型并被認定為可行之后,就能夠開展具體的實施,以對問題進行及時有效地解決。

      3 數(shù)據(jù)挖掘技術下科研管理工作的轉變

      3.1 注重科研數(shù)據(jù)的原始積累

      要積極提升科研單位的信息收集能力,構建更廣范的科技文獻、專利信息、論文信息以及科研單位自身各類信息的數(shù)據(jù)庫,包括科研工作者的基礎信息、科研成果等,并充分使用。還應把科研管理的數(shù)據(jù)挖掘延伸到全球科研信息,如對于某個研究所來說,其研究的方向在全球有很多科研機構與成果,該單位就應在全球范圍內進行原始數(shù)據(jù)的收集。原始數(shù)據(jù)的收集是重要的,也是很難完全做到的,如科研成果,不僅需要在主流的論文知識平臺上進行信息的搜索,還有大量的專利平臺、新聞報道、科學家的演講等。在數(shù)據(jù)挖掘技術的發(fā)展中,應當對各類信息進行準確有效地收集,同時淘汰一些失去價值的數(shù)據(jù),如過期的甚至錯誤的科研成果等。

      在科研管理和科研活動中,應當充分意識到原始數(shù)據(jù)的重要性,對原始數(shù)據(jù)進行準確地保留,同時在對外部數(shù)據(jù)進行收集時,也能更好地篩選出有用的信息,有利于最終的數(shù)據(jù)模型的搭建。

      3.2 有效地增強科研管理項目決策的科學性

      針對科研管理及數(shù)據(jù)挖掘機制的開拓,還應從具體的科研管理項目決策上入手,使決策更具科學性。應基于信息篩選的理念,進一步細化科研管理工作,充分利用數(shù)據(jù)挖掘的優(yōu)勢思維,基于云計算的模式,對研究的領域、可能得到的學術成果進行深入的分析;積極地借鑒國內外相關學術成果的現(xiàn)有文獻,找出最合適的研究思路,并對科學課題的創(chuàng)新性和可行性進行判斷,對其意義與必要性進行判斷。在數(shù)據(jù)挖掘思維及技術的指導下,科研管理項目的科學性很容易被監(jiān)測,科研人員也能夠被督促,使項目決策更具有科學性。

      3.3 注重更深層次的科研活動服務提供力度

      各類科研機構的科研項目,通常由科研工作者以某個機構的研究為主進行申請。和過去的科研活動管理、信息化技術的應用相比,科研工作者僅是根據(jù)具體的科研工作,向上級領導單位進行申請書的投遞,而后者則對申請內容進行進一步分析。在具體的實踐中,會出現(xiàn)申請力度不足、相關數(shù)據(jù)殘缺、有一定的錯誤信息等,使得科研管理水平降低,有時會存在申請課題與實際需求差距較大,以致于最終申請無法通過。在數(shù)據(jù)挖掘技術的應用過程中,數(shù)據(jù)更加透明,也更為豐富,科研單位應掌握數(shù)據(jù)挖掘的思維和技術,對數(shù)據(jù)領域進行分析、研究、準確預測,探索構建科研管理、數(shù)據(jù)挖掘的模型,與此同時,基于數(shù)據(jù)可視化的理念,得到成型的相關報告,這可以給工作人員提供更為全面的數(shù)據(jù)信息,并對其中的內在聯(lián)系進行梳理。較為準確的信息就能夠對科研工作人員的工作進行全面地指導,使科研管理與數(shù)據(jù)管理達到深層次的服務目標,提高科研管理的質量水平。

      3.4 重視科研資源的合理配置及管理的適當優(yōu)化

      科研管理工作牽涉諸多的科研資源,管理單位應對各種資源進行合理配置,進一步對數(shù)據(jù)管理進行優(yōu)化。第一,對相關數(shù)據(jù)開展廣泛的采集和初步的篩選,構建相應的數(shù)據(jù)管理資源庫、人才庫、科研成果庫等。第二,對科研機構的自身發(fā)展進行一定的科研評判,構建相對健全的科研模型,包括科研資源研究模型、科研成果模型等,并對其中的參數(shù)進行有效地計算,進一步制定完善的管理規(guī)則。第三,利用定量化績效考核的思路,及時搭建科研資源的基礎配置。以決策支持管理工具為基礎,有效地對相應的數(shù)據(jù)進行管理,基于數(shù)據(jù)挖掘的模式對科研機構的資源開展科學配置。

      猜你喜歡
      原始數(shù)據(jù)科研成果數(shù)據(jù)挖掘
      GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
      科研成果轉化
      水運工程(2022年7期)2022-07-29 08:36:12
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
      中國科研成果震撼全球
      全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術實現(xiàn)5 級自動駕駛
      汽車零部件(2017年4期)2017-07-12 17:05:53
      加強醫(yī)療科技自主創(chuàng)新和科研成果轉化
      基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      審批復雜 科研成果落地難
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      从江县| 右玉县| 元朗区| 西和县| 凤山市| 海门市| 康定县| 定州市| 峨眉山市| 界首市| 塔城市| 公安县| 莲花县| 东乡县| 红河县| 穆棱市| 瑞安市| 且末县| 株洲县| 清远市| 谢通门县| 衢州市| 资兴市| 宁蒗| 吴江市| 穆棱市| 武威市| 兴山县| 夏河县| 福鼎市| 承德县| 嘉义市| 当阳市| 武陟县| 姚安县| 九龙坡区| 麻江县| 德清县| 买车| 敖汉旗| 浮山县|