肖鵬飛 謝英 劉秀蘭
摘要:利用歷史大數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項(xiàng)目研究過程中的規(guī)律,在教改課題與科研項(xiàng)目管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對(duì)歷史數(shù)據(jù)價(jià)值的提煉與分析,為教改課題與科研項(xiàng)目的申報(bào)條件設(shè)計(jì)提供參考,能實(shí)時(shí)掌握研究人員在每年度項(xiàng)目課題研究中的情況,與預(yù)期進(jìn)行對(duì)比分析,及時(shí)捕捉到項(xiàng)目課題在研究過程中的異常,及時(shí)采取相關(guān)措施改善項(xiàng)目課題研究。通過前端圖形化的直觀展示,為教改課題與科研項(xiàng)目管理決策提供數(shù)據(jù)支持,多維度分析研究整體與個(gè)體情況,提供實(shí)時(shí)的數(shù)據(jù)支持服務(wù),實(shí)現(xiàn)服務(wù)型教改課題與科研項(xiàng)目研究管理的目標(biāo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;科研項(xiàng)目管理;教學(xué)改革
引言
醫(yī)學(xué)高等院校及附屬醫(yī)療機(jī)構(gòu)每年在教學(xué)改革課題管理與科研項(xiàng)目管理的過程中累積了海量的教改與科研項(xiàng)目的相關(guān)歷史數(shù)據(jù),在一定時(shí)間周期內(nèi)必須進(jìn)行數(shù)據(jù)分割備份,以保證系統(tǒng)的運(yùn)行效率,這些備份的數(shù)據(jù)僅提供簡(jiǎn)單的查詢備份所用,各部門只能從一個(gè)個(gè)信息孤島中進(jìn)行人工關(guān)聯(lián)提出有用信息,費(fèi)時(shí)費(fèi)力,計(jì)算也并不一定科學(xué)。數(shù)據(jù)挖掘技術(shù)更多是從實(shí)際的數(shù)據(jù)出發(fā),利用機(jī)器學(xué)習(xí)中頻繁模式、分類和聚類的技術(shù)來分析、挖掘、預(yù)測(cè)一些對(duì)實(shí)際有用的結(jié)果。近年來高校及附屬醫(yī)院及醫(yī)療機(jī)構(gòu)紛紛建設(shè)了各具特色的大數(shù)據(jù)平臺(tái)系統(tǒng),有效地利用這些數(shù)據(jù)也是教改的一個(gè)重要研究?jī)?nèi)容,這些課題的數(shù)據(jù)通過數(shù)據(jù)挖掘技術(shù)和方法[1],能充分、快捷、準(zhǔn)確地實(shí)現(xiàn)信息化的科研管理方式。
1. 教改課題管理系統(tǒng)的現(xiàn)狀
各高校及各大附屬醫(yī)療機(jī)構(gòu)的教改課題與科研項(xiàng)目管理單位一般由教務(wù)科與科研科進(jìn)行共同管理,主要存在以下幾個(gè)問題[2]。
1.1 管理數(shù)據(jù)來源廣泛,審核過程冗繁
目前的教改課題與科研項(xiàng)目管理一般采用研究人員填報(bào)、各級(jí)部門和教務(wù)科研科聯(lián)合審核的方式進(jìn)行,數(shù)據(jù)填報(bào)和審核量大,申報(bào)的需要審核的相關(guān)數(shù)據(jù)基本包含了申報(bào)團(tuán)隊(duì)的基本信息、申報(bào)書、提供的評(píng)審材料、相關(guān)的財(cái)務(wù)支撐數(shù)據(jù)等,各部門審核過程相對(duì)冗長(zhǎng)煩瑣。
1.2 容易形成數(shù)據(jù)孤島
高校及各大附屬醫(yī)療機(jī)構(gòu)的教改課題管理系統(tǒng)與各職能部門的信息系統(tǒng)相互獨(dú)立運(yùn)行,相關(guān)數(shù)據(jù)無法集成,形成了大量的數(shù)據(jù)孤島。多年的教改與科研項(xiàng)目周期,積累了大量的教改課題與科研項(xiàng)目管理的歷史研究數(shù)據(jù),并沒有開展進(jìn)一步的挖掘和分析,只是進(jìn)行了簡(jiǎn)單導(dǎo)出導(dǎo)入的再次分析功能,統(tǒng)計(jì)結(jié)構(gòu)簡(jiǎn)單。對(duì)歷史數(shù)據(jù)的挖掘主要內(nèi)容是課題研究相關(guān)的頻次,如重點(diǎn)項(xiàng)目與課題的參與率、不同職稱和不同學(xué)歷的參與率、項(xiàng)目課題的延續(xù)性等,通過趨勢(shì)圖、分布圖來挖掘分析形成各類報(bào)表則很難實(shí)現(xiàn)。
1.3 重結(jié)題管理,輕研究服務(wù)指導(dǎo)
教改課題與科研項(xiàng)目管理由于技術(shù)與人力的短缺,主要是以結(jié)題管理為主,輕個(gè)性化的研究指導(dǎo)服務(wù)。相關(guān)研究人員除了關(guān)心本人的課題與項(xiàng)目申報(bào)及結(jié)題,更希望了解和學(xué)習(xí)教改課題申報(bào)書的撰寫方法和課題的研究方法,并能提供相關(guān)專業(yè)研究人員的專項(xiàng)培訓(xùn),從而提高教改課題與科研項(xiàng)目的申報(bào)和研究水平。
2. 數(shù)據(jù)挖掘技術(shù)的應(yīng)用
數(shù)據(jù)挖掘(data mining,DM)是一門新興的、匯聚多個(gè)學(xué)科的交叉性學(xué)科,這是一個(gè)很了不起的處理過程,即從龐大的數(shù)據(jù)中,將未知、隱含及具備潛在價(jià)值的信息進(jìn)行提取的過程。數(shù)據(jù)挖掘?qū)⒏咝阅苡?jì)算、機(jī)器學(xué)習(xí)、人工智能、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)可視化、數(shù)據(jù)庫(kù)技術(shù)和專家系統(tǒng)等多個(gè)范疇的理論和技術(shù)融合在一起。數(shù)據(jù)挖掘技術(shù)在教改科研課題管理中的應(yīng)用研究,流程圖如圖1所示。
3. 數(shù)據(jù)挖掘技術(shù)在科研項(xiàng)目管理中的需求分析與設(shè)計(jì)
3.1 科研項(xiàng)目管理包括縱向課題、橫向課題、專項(xiàng)任務(wù)的管理
縱向課題的管理包括課題申報(bào)、課題立項(xiàng)、課題評(píng)審、課題變更、課題中檢、課題結(jié)題等內(nèi)容;橫向課題和專項(xiàng)任務(wù)包括合同評(píng)審、階段評(píng)審、驗(yàn)收等內(nèi)容[3]。
科研成果包括論文成果、著作成果、專利成果、音像軟件的鑒定、申報(bào)以及推廣應(yīng)用;科研檔案管理包括電子檔案管理和紙質(zhì)檔案管理;科研經(jīng)費(fèi)管理是科研管理中的重要工作,分為縱向經(jīng)費(fèi)管理和橫向經(jīng)費(fèi)管理,包括合同經(jīng)費(fèi)、配套經(jīng)費(fèi)、經(jīng)費(fèi)預(yù)算、經(jīng)費(fèi)到賬、經(jīng)費(fèi)報(bào)銷等管理;科研設(shè)備管理部分主要分為設(shè)備采購(gòu)、設(shè)備日常管理、計(jì)量設(shè)備管理、倉(cāng)庫(kù)出入庫(kù)管理、涉密設(shè)備管理;網(wǎng)絡(luò)評(píng)審管理是基于局域網(wǎng)實(shí)現(xiàn)項(xiàng)目基本信息管理、網(wǎng)絡(luò)評(píng)審、網(wǎng)絡(luò)審批、網(wǎng)上公文傳遞等功能。
3.2 應(yīng)用大數(shù)據(jù)的挖掘技術(shù)
應(yīng)用大數(shù)據(jù)的挖掘技術(shù),可以實(shí)現(xiàn)對(duì)各類科研項(xiàng)目課題研究的歷史數(shù)據(jù)進(jìn)行價(jià)值挖掘,通過前端圖形化展示使各類科研項(xiàng)目課題研究的特點(diǎn)更加直觀,通過多維的數(shù)據(jù)挖掘評(píng)價(jià)維度,展示項(xiàng)目承擔(dān)者的學(xué)術(shù)能力水平與發(fā)展?jié)摿?,可以從不同角度分析包括教改課題研究在內(nèi)的整體與個(gè)體情況。充分利用歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項(xiàng)目研究過程中的規(guī)律,開展不同維度上的課題研究數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)每個(gè)課題的深度分析,展現(xiàn)課題研究的趨勢(shì)信息和預(yù)警信息。利用大數(shù)據(jù)高性能計(jì)算的優(yōu)勢(shì),展示課題研究的實(shí)時(shí)數(shù)據(jù),為有針對(duì)性的教改課題研究指導(dǎo)提供依據(jù),并且能夠及時(shí)發(fā)現(xiàn)教改課題研究在各項(xiàng)指標(biāo)上的異常,通過趨勢(shì)圖、統(tǒng)計(jì)圖等,可以使教務(wù)科研管理部門及時(shí)捕捉到教學(xué)改革課題與科研項(xiàng)目研究過程中的異常,并及時(shí)采取相關(guān)改進(jìn)措施。
3.2.1 成立信息技術(shù)與大數(shù)據(jù)數(shù)據(jù)處理團(tuán)隊(duì)
根據(jù)需要,成立專門的信息技術(shù)與大數(shù)據(jù)數(shù)據(jù)分析專家團(tuán)隊(duì)。歷史大數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建受到軟硬件、專業(yè)技術(shù)人員能力等客觀因素的影響,成立專門的信息技術(shù)與大數(shù)據(jù)的數(shù)據(jù)分析專家團(tuán)隊(duì),保障歷史大數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)具有完整與正確可靠的設(shè)計(jì),保障決策數(shù)據(jù)來源與數(shù)據(jù)倉(cāng)庫(kù)模型的準(zhǔn)確性。
3.2.2 大數(shù)據(jù)處理過程
歷史大數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)抽取、清洗與分析設(shè)計(jì)。大數(shù)據(jù)主要來源于教改課題與科研項(xiàng)目管理系統(tǒng)、人事管理系統(tǒng)、研究人員發(fā)展評(píng)價(jià)管理系統(tǒng)、財(cái)務(wù)系統(tǒng)等,數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)前需要進(jìn)行抽取、清洗去除無效數(shù)據(jù),保證基礎(chǔ)數(shù)據(jù)準(zhǔn)確進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),根據(jù)專家組、教務(wù)科研科、研究人員等角色的需求分析設(shè)計(jì)各類維度表與指標(biāo)KPI的度量值,實(shí)現(xiàn)將數(shù)據(jù)轉(zhuǎn)化為知識(shí),為決策服務(wù)的目的。
3.2.3 圖形化展示結(jié)果
研究數(shù)據(jù)結(jié)果的直觀圖形化展示。數(shù)據(jù)挖掘分析結(jié)果的前端圖形化展示,使教改課題與科研項(xiàng)目研究中的特點(diǎn)更加直觀,為管理決策提供直接的數(shù)據(jù)支持。通過趨勢(shì)圖、統(tǒng)計(jì)圖、直方圖、百分比圖等使管理者能及時(shí)捕捉到研究過程中的變化,及時(shí)采取相關(guān)應(yīng)對(duì)措施。
3.3 大數(shù)據(jù)挖掘的實(shí)現(xiàn)過程
系統(tǒng)在醫(yī)院內(nèi)部網(wǎng)絡(luò)環(huán)境下運(yùn)行,技術(shù)路線圖如圖2所示。
4. 數(shù)據(jù)挖掘技術(shù)在教改科研課題管理中的應(yīng)用研究
(1)利用相關(guān)的教改與科研課題項(xiàng)目及相關(guān)財(cái)務(wù)、人事、研究人員發(fā)展評(píng)價(jià)系統(tǒng)等的歷史大數(shù)據(jù)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),確定管理數(shù)據(jù)倉(cāng)庫(kù)的主題包括課題申報(bào)、課題評(píng)審、研究進(jìn)度、研究成果等,進(jìn)一步設(shè)計(jì)教改課題研究分析維度和粒度,建立數(shù)據(jù)倉(cāng)庫(kù)的模型。通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)課題與項(xiàng)目中研究過程的規(guī)律,完善教改課題的結(jié)題指標(biāo)和相關(guān)立項(xiàng)政策的制定。
(2)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)必須進(jìn)行抽取、清洗與加載,去除無效的數(shù)據(jù),確保數(shù)據(jù)的完整性、正確性和可靠性。通過清洗的數(shù)據(jù)如指南方向、負(fù)責(zé)人、研究成果、參與人、年度等相關(guān)數(shù)據(jù)進(jìn)入大數(shù)據(jù)中心,這些數(shù)據(jù)通過后續(xù)的數(shù)據(jù)挖掘可以得出每個(gè)課題的按期結(jié)題概率分析,經(jīng)費(fèi)使用合理性分析,整體研究進(jìn)展趨勢(shì)信息情況、整體經(jīng)費(fèi)使用情況、研究成果推廣情況等的預(yù)警與指導(dǎo)。
(3)數(shù)據(jù)挖掘技術(shù)的設(shè)計(jì)主要采用神經(jīng)網(wǎng)絡(luò)與決策樹等相關(guān)人工智能算法。決策樹(decision tree,DT)分類算法是一種以決策樹形式表示的分類規(guī)則,能夠根據(jù)一定的規(guī)則將眾多的數(shù)據(jù)分類,從中挖掘出有價(jià)值的、潛在的信息,適合分類及處理預(yù)測(cè)模型的任務(wù),結(jié)論易于解釋和理解。神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有高度的抗干擾能力,所以,在各個(gè)領(lǐng)域內(nèi)神經(jīng)網(wǎng)絡(luò)算法應(yīng)用廣泛,基于關(guān)聯(lián)規(guī)則分析的分類算法搜索頻繁模式與類標(biāo)號(hào)之間的強(qiáng)關(guān)聯(lián),有效避免了決策樹歸納一次只考慮一個(gè)屬性的限制,使其比一些傳統(tǒng)的分類算法更為準(zhǔn)確。通過對(duì)教改課題與科研項(xiàng)目數(shù)據(jù)進(jìn)行分析,達(dá)到趨勢(shì)分析、預(yù)測(cè)偏差預(yù)警,來發(fā)現(xiàn)影響教改課題研究的因素和影響機(jī)制,實(shí)現(xiàn)將數(shù)據(jù)轉(zhuǎn)化為知識(shí),為決策服務(wù)的目的[4]。
通過前面對(duì)系統(tǒng)業(yè)務(wù)流程的分析及功能模塊的描述說明,可將科研業(yè)務(wù)管理系統(tǒng)中實(shí)體對(duì)象如教師職工、課題、論文、校本教材等實(shí)體數(shù)據(jù)集開發(fā)系統(tǒng)整體的功能圖,如圖3所示。
5. 數(shù)據(jù)挖掘技術(shù)在教改科研課題中的研究應(yīng)用效果評(píng)價(jià)
(1)為教改科研項(xiàng)目課題申報(bào)管理提供依據(jù),通過數(shù)據(jù)挖掘技術(shù)掌握項(xiàng)目課題研究與教師職稱、專業(yè)、研究方向、研究成果之間的關(guān)聯(lián)關(guān)系,有針對(duì)性地為課題管理提供專業(yè)研究學(xué)習(xí),同時(shí)為申報(bào)條件設(shè)計(jì)提供參考。
(2)為教改科研項(xiàng)目課題研究提供參考,研究人員可以實(shí)時(shí)掌握自身在年度課題研究中的位置,掌握本人相關(guān)評(píng)價(jià)指標(biāo)在研究進(jìn)度、研究成果等不同維度上與其他課題組比較存在的優(yōu)勢(shì)和不足,為研究人員改善課題研究情況提供依據(jù)。
(3)通過大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)可以對(duì)教改科研課題研究的進(jìn)展與預(yù)期進(jìn)行對(duì)比分析,及時(shí)發(fā)現(xiàn)此研究在各項(xiàng)指標(biāo)上的異常,通過趨勢(shì)圖、統(tǒng)計(jì)圖、百分比圖等使教務(wù)科研管理部門及時(shí)捕捉到教學(xué)改革課題與科研項(xiàng)目在研究過程中的異常,有利于及時(shí)采取相關(guān)應(yīng)對(duì)措施。
結(jié)語
在科研管理信息化中充分利用歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項(xiàng)目研究過程中的規(guī)律,開展不同維度上的課題研究數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)每個(gè)課題的深度分析,展現(xiàn)課題研究的趨勢(shì)信息和預(yù)警信息利用大數(shù)據(jù)高性能計(jì)算的優(yōu)勢(shì)[5],展示課題研究的實(shí)時(shí)數(shù)據(jù),為有針對(duì)性的教改課題研究指導(dǎo)提供依據(jù),為科研項(xiàng)目課題的管理決策者提供數(shù)據(jù)支持,并及時(shí)采取相關(guān)改進(jìn)措施。
參考文獻(xiàn):
[1]戴麗娟.大數(shù)據(jù)技術(shù)在高校教育中的應(yīng)用探討[J].信息與電腦(理論版),2019, (15):39-240.
[2]吳學(xué)會(huì),李佳恒,叢慧源,等.大數(shù)據(jù)技術(shù)在中醫(yī)高校教改課題管理中的應(yīng)用研究[J].中國(guó)中醫(yī)藥現(xiàn)代遠(yuǎn)程教育,2019, 17(7):146-148.
[3]胡曉林,劉劼,葛宏,等.信息化在科研管理中的應(yīng)用及發(fā)展[J].技術(shù)與創(chuàng)新管理,2014,35(1):17-20.
[4]谷建英.基于.NET的科研管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].石家莊:河北科技大學(xué),2013.
[5]彭靜,李秀瀅.數(shù)據(jù)挖掘技術(shù)在教務(wù)管理系統(tǒng)中的應(yīng)用[J].信息系統(tǒng)工程,2021,(4):44-46.
作者簡(jiǎn)介:肖鵬飛,碩士研究生,高級(jí)工程師,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)、智能大數(shù)據(jù)、圖形圖像處理。
基金項(xiàng)目:湖南中醫(yī)藥大學(xué)教學(xué)改革項(xiàng)目(編號(hào):2019-JG056)。