鄭海霞
摘 ? 要:由于網(wǎng)絡(luò)中信息的愈加豐富以及拓?fù)浣Y(jié)構(gòu)的復(fù)雜性,使得信息存在著信息數(shù)量過載和資源導(dǎo)向迷向的問題,面對當(dāng)今網(wǎng)絡(luò)中浩如煙海的信息,如何實現(xiàn)在其中進(jìn)行有效數(shù)據(jù)的挖掘使其更好地應(yīng)用到實驗室信息管理系統(tǒng)中成為當(dāng)今實驗室管理人員所要面臨的重要考驗。基于此,本篇文章中筆者針對于實驗室信息管理系統(tǒng)中數(shù)據(jù)挖掘的應(yīng)用進(jìn)行分析和論述。
關(guān)鍵詞:數(shù)據(jù)挖掘 ?實驗室 ?信息管理 ?系統(tǒng)
中圖分類號:TP311.1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2019)09(b)-0179-02
隨著時代的不斷發(fā)展,各國都開始愈發(fā)重視數(shù)據(jù)挖掘在實驗室信息管理系統(tǒng)中的重要性。在我國也不例外,雖然很多數(shù)據(jù)得以被應(yīng)用,但是在數(shù)據(jù)之后內(nèi)涵的大量信息未被應(yīng)用,故此,重視數(shù)據(jù)挖掘在實驗室信息管理系統(tǒng)中的應(yīng)用對于社會各行業(yè)等都有著較為深遠(yuǎn)的影響,從中可以獲得和提取無法預(yù)料的模式,并且可以透過不同的數(shù)據(jù)庫推斷出其中的知識。
1 ?數(shù)據(jù)挖掘相關(guān)概念的闡述
數(shù)據(jù)挖掘是隨著時代發(fā)展而新興的熱門學(xué)科,其理論基礎(chǔ)來源于統(tǒng)計學(xué)科和數(shù)據(jù)庫系統(tǒng)相關(guān)知識,再通過機(jī)器獲得相關(guān)算法來發(fā)現(xiàn)模式,從而實現(xiàn)將大量數(shù)據(jù)庫中的信息進(jìn)行整合使其變換成相對容易被理解的知識再被進(jìn)一步供相關(guān)人員進(jìn)行使用的目的。數(shù)據(jù)挖掘可以對相關(guān)數(shù)據(jù)進(jìn)行自動或者半自動分析,從而在其中獲得數(shù)據(jù)的模型或者相關(guān)的知識,故此,認(rèn)為數(shù)據(jù)挖掘僅僅是發(fā)現(xiàn)知識或者僅僅是為了獲得數(shù)據(jù)的想法是不正確的。當(dāng)前在我國,數(shù)據(jù)挖掘可以被應(yīng)用于人工智能和電子商務(wù)等領(lǐng)域。
2 ?實驗室管理系統(tǒng)的發(fā)展歷程
在20世紀(jì)90年代末至本世紀(jì)初,LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)才逐漸引入我國,并開始被相關(guān)研究人員所了解。此后,我國實驗室管理信息系統(tǒng)學(xué)術(shù)相關(guān)研討與展示會的成功創(chuàng)辦和我國相關(guān)實驗室管理系統(tǒng)的建設(shè)以及相關(guān)軟件系統(tǒng)的開發(fā)都對LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)在我國的推廣起到了推波助瀾的作用。2001年12月,隨著我國不斷打開國門加入了世界貿(mào)易組織(即WTO)使得許多國外的實驗室管理理念和LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)的相關(guān)產(chǎn)品進(jìn)入我國,以及我國國內(nèi)相關(guān)行業(yè)與國外同行業(yè)的競爭加劇,雖然很多國外的LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)相關(guān)產(chǎn)品具有較為成熟的技術(shù)水平,但是很多LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)相關(guān)產(chǎn)品不能實現(xiàn)很好的中國化,實施的成功率較低,對此形勢,迫使我國國內(nèi)相關(guān)行業(yè)必須要不斷提高自身的管理水平,研究出適合我國本土使用的LIMS網(wǎng)絡(luò)技術(shù)系統(tǒng)來增強(qiáng)其競爭力,從而推進(jìn)實驗室管理系統(tǒng)的不斷發(fā)展,生產(chǎn)處更具靈活性的LIMS網(wǎng)絡(luò)技術(shù)系統(tǒng)相關(guān)產(chǎn)品。
3 ?在實驗室信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘的重要性
數(shù)據(jù)挖掘的任務(wù)就是將大量的、模糊的數(shù)據(jù)集中在一起進(jìn)行識別,從中挖掘出其背后所蘊含的信息,進(jìn)而將其轉(zhuǎn)化為可供人們方便理解使用的模式的過程。但是由于互聯(lián)網(wǎng)自身存在的復(fù)雜性和更新速度快等特性,使得數(shù)據(jù)挖掘成為一門涉及統(tǒng)計學(xué)、數(shù)據(jù)庫、模糊數(shù)學(xué)等諸多知識的交叉學(xué)科。因此,其技術(shù)的復(fù)雜性使得數(shù)據(jù)挖掘成為了一門社會各界認(rèn)為任重而道遠(yuǎn)的研究熱點。
4 ?數(shù)據(jù)挖掘在實驗室信息管理系統(tǒng)應(yīng)用中的現(xiàn)狀
就近年來看,數(shù)據(jù)挖掘在各個領(lǐng)域都有了長足的進(jìn)步,例如,在醫(yī)學(xué)對疾病的治療和新藥物的開發(fā),乃至基因方面的研究都取得了出色的成果。但是,仍舊存在著只對數(shù)據(jù)進(jìn)行采取和對數(shù)據(jù)結(jié)果的看重的現(xiàn)象,并未深入對數(shù)據(jù)本身進(jìn)行分析,且數(shù)據(jù)挖掘相關(guān)的算法頗多,僅依賴于LIMS網(wǎng)絡(luò)系統(tǒng)技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,同時,面對著不斷快速發(fā)展的時代,如果不對數(shù)據(jù)進(jìn)行科學(xué)的處理就無法迅速從其中獲得有效的信息,從而產(chǎn)生資源大量浪費的現(xiàn)象,對此,重視數(shù)據(jù)挖掘能夠高效地應(yīng)用于實驗室信息管理系統(tǒng)中是當(dāng)前實驗室信息管理人員所需要重視的研究方向。
5 ?數(shù)據(jù)挖掘在實驗室信息管理系統(tǒng)應(yīng)用中存在的問題
5.1 數(shù)據(jù)挖掘方法方面
數(shù)據(jù)挖掘技術(shù)越來越應(yīng)用于更多的發(fā)展領(lǐng)域,不斷出現(xiàn)新的數(shù)據(jù)挖掘的相關(guān)任務(wù),使得數(shù)據(jù)挖掘技術(shù)成為更加充滿美好發(fā)展前景的領(lǐng)域。當(dāng)前,數(shù)據(jù)挖掘技術(shù)包含了數(shù)據(jù)表征和相關(guān)分析、數(shù)據(jù)回歸等涉及廣泛的數(shù)據(jù)分析和數(shù)據(jù)知識,但是這些任務(wù)不能實現(xiàn)在同一個范式下使用同樣的數(shù)據(jù)庫,并且其中還需要大量的數(shù)據(jù)挖掘的相關(guān)算法。除此之外,還可以在數(shù)據(jù)庫搜索知識時實現(xiàn)多維空間對數(shù)據(jù)的探索,同時通過將多學(xué)科開放的數(shù)據(jù)進(jìn)行集中可以提高數(shù)據(jù)挖掘技術(shù)的能力。大部分的數(shù)據(jù)還是停留在互聯(lián)網(wǎng)的大環(huán)境之中,且有些可能出存在著殘缺甚至模糊,為此,提升互聯(lián)網(wǎng)大環(huán)境下對數(shù)據(jù)的發(fā)現(xiàn)和處理能力能夠促進(jìn)數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展。
5.2 數(shù)據(jù)挖掘算法方面
數(shù)據(jù)挖掘要求能夠及時有效地從多個數(shù)據(jù)庫中挖掘出相關(guān)的數(shù)據(jù)并提取出有關(guān)的信息,對此數(shù)據(jù)挖掘的算法必須具有有效性和一定的伸縮性。由于數(shù)據(jù)庫中數(shù)據(jù)分布具有廣泛性和流動性快的特征,為此所挖掘的數(shù)據(jù)很有可能呈片段式,并且要將這些片段的數(shù)據(jù)進(jìn)行處理,最終將其合并起來。
5.3 數(shù)據(jù)挖掘類型方面
數(shù)據(jù)挖掘技術(shù)由于涉及諸多領(lǐng)域,對此,其數(shù)據(jù)挖掘的類型也呈多樣化的特點,既包括動態(tài)數(shù)據(jù)也包括靜態(tài)數(shù)據(jù),既包括時間數(shù)據(jù)又包括空間數(shù)據(jù),但是要想讓系統(tǒng)進(jìn)行所有數(shù)據(jù)類型的挖掘是無法實現(xiàn)的。
6 ?數(shù)據(jù)挖掘技術(shù)在實驗室信息管理系統(tǒng)中的應(yīng)用
6.1 數(shù)據(jù)挖掘和預(yù)處理階段
可以采用開源log4日志引擎系統(tǒng)來實現(xiàn)在不影響系統(tǒng)性能的前提下方便獲取實驗室信息管理系統(tǒng)的使用以及用戶的訪問情況的目的,數(shù)據(jù)挖掘來自于系統(tǒng)中的日志數(shù)據(jù)系統(tǒng),為減少因數(shù)據(jù)數(shù)量過多而加重的負(fù)擔(dān),可以只保留所認(rèn)為最有用的數(shù)據(jù),使一些沒有字段的信息被刪除掉。同時要建立索引來保證在檢索頻繁的情況下依舊能保證數(shù)據(jù)存儲性能的良好,從而達(dá)到提高實驗室信息管理數(shù)據(jù)庫效率的目的。
6.2 數(shù)據(jù)挖掘技術(shù)的應(yīng)用
由于各個用戶都有著自己獨特的需求,對此實驗室信息管理系統(tǒng)要根據(jù)數(shù)據(jù)記錄對其進(jìn)行聚類分析,從而找到訪問頻率較高的板塊來為用戶提供更加優(yōu)質(zhì)的服務(wù)。首先要進(jìn)行數(shù)據(jù)源的前期清洗工作,要將系統(tǒng)中之前是數(shù)據(jù)紀(jì)錄進(jìn)行刪除同時也要刪除掉已經(jīng)離職的用戶的訪問數(shù)據(jù)記錄,并主要針對系統(tǒng)總的訪問次數(shù)和當(dāng)年的訪問次數(shù)進(jìn)行記錄從而使得數(shù)據(jù)更加能夠貼近用戶的實際訪問情況。其次,要對所挖掘的數(shù)據(jù)進(jìn)行聚類分析,將其分類為活躍、一般和懶惰三個系統(tǒng)模塊,從而可以了解到用戶對每個板塊的使用情況,進(jìn)而為用戶提供更為方便的服務(wù)。
7 ?結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)是一門涉及諸多學(xué)科的技術(shù),雖然目前我國對于其相關(guān)的研究已經(jīng)獲得了一定的成果,但是數(shù)據(jù)挖掘技術(shù)仍舊缺乏較為完善的理論系統(tǒng),對此社會各學(xué)者都積極對此展開相關(guān)研究,從而出現(xiàn)了百花齊放的特征。而將數(shù)據(jù)挖掘應(yīng)用于實驗室信息管理系統(tǒng)之中,從中找到其內(nèi)在知識和聯(lián)系,揭示其內(nèi)在規(guī)律對科研項目、人員及其成果的評價方面都能起到重要的作用,同時對進(jìn)一步提高數(shù)據(jù)挖掘技術(shù)在實驗室信息管理系統(tǒng)之中的應(yīng)用也具有積極的促進(jìn)作用。
參考文獻(xiàn)
[1] 李海林,楊麗彬.信息管理專業(yè)數(shù)據(jù)挖掘人才培養(yǎng)模式研究[J].計算機(jī)時代,2017(11):92-94.
[2] 李玥,吳麗麗,魏霖靜.高等農(nóng)業(yè)院校信息管理與信息系統(tǒng)專業(yè)培養(yǎng)模式與專業(yè)改革探索[J].河北農(nóng)業(yè)大學(xué)學(xué)報:農(nóng)林教育版,2017,19(5):34-38.
[3] 張美華,王文濤.數(shù)據(jù)挖掘技術(shù)在機(jī)房信息管理中的應(yīng)用[J].電腦知識與技術(shù),2017,13(12):5-6,30.