劉 濤 馬 慧 翁方宸 劉天威 伍高飛 王 鶴 李學(xué)俊 張玉清1,
1(西安電子科技大學(xué)網(wǎng)絡(luò)與信息安全學(xué)院 西安 710126)2(海南大學(xué)網(wǎng)絡(luò)空間安全學(xué)院(密碼學(xué)院) ???570208)3(中國科學(xué)院大學(xué)國家計算機(jī)網(wǎng)絡(luò)入侵防范中心 北京 101408)
全國密碼技術(shù)競賽自2015年創(chuàng)辦以來,已成功舉辦了6屆.從第1屆的39家參賽單位共110個參賽隊伍,到2021年第6屆的60家參賽單位共333個參賽隊伍參加,已成為目前國內(nèi)密碼領(lǐng)域級別最高、影響力最大的經(jīng)典賽事.目前對競賽相關(guān)的研究與分析主要分為3大類:一類是從競賽組織者角度對競賽本身的開展和實(shí)施進(jìn)行總結(jié)[1-2],姚慧等人[3]基于模糊層次分析法對研究生競賽項目進(jìn)行量化分析并優(yōu)選;一類是從競賽參與者角度對人才培養(yǎng)的影響和作用進(jìn)行探討[4-6],戴鑫等人[7]采用專家訪談法和探索性因子分析法對1 291名大學(xué)生調(diào)查結(jié)果進(jìn)行分析;一類是從競賽數(shù)據(jù)角度對其他因素的影響進(jìn)行定類與定量的分析,Su等人[8]采用獨(dú)立樣本t檢驗分析性別、籍貫、參加比賽頻率等影響大學(xué)生社會適應(yīng)能力的因素.
基于以上分類和相關(guān)的文獻(xiàn)調(diào)查,本文總結(jié)了目前競賽分析類論文存在的不足:1)在視角上,現(xiàn)有文獻(xiàn)大多基于某個參賽主體,缺乏從賽事整體、行業(yè)發(fā)展和舉辦方等視角來分析;2)在方法上,現(xiàn)有文獻(xiàn)大多采用問卷調(diào)查進(jìn)行統(tǒng)計歸納,缺乏合理的數(shù)據(jù)分析方法;3)在觀點(diǎn)上,現(xiàn)有文獻(xiàn)大多基于個體的現(xiàn)象和結(jié)果進(jìn)行總結(jié),缺乏堅實(shí)且廣泛的數(shù)據(jù)支撐.針對上述不足,本文首次對全國密碼技術(shù)競賽進(jìn)行深入的系統(tǒng)剖析,基于獲獎數(shù)據(jù),采用熵權(quán)法和TOPSIS綜合評價法對歷年獲獎數(shù)據(jù)進(jìn)行處理與分析,主要工作與貢獻(xiàn)如下:
1) 基于熵權(quán)法,通過線性加權(quán)方式對歷屆參賽單位進(jìn)行排名,對排名前3的參賽單位的作品和獲獎情況進(jìn)行統(tǒng)計,結(jié)合其在密碼學(xué)相關(guān)領(lǐng)域的投入,剖析獲獎原因;
2) 對官方6大類作品和A,B類命題的獲獎作品進(jìn)行整理,分析獲獎作品分布情況,探究作品的選題分類和獲獎情況之間的關(guān)系;
3) 對參賽作品領(lǐng)域進(jìn)行細(xì)致分類,探索作品所選領(lǐng)域和方向?qū)ψ罱K獲獎的影響,先通過TOPSIS綜合評價法對不同領(lǐng)域獲獎作品進(jìn)行分析,再基于作品簡介進(jìn)行深入分析,從中提煉出不同名次作品具備的特點(diǎn).
通過在全國密碼技術(shù)競賽官網(wǎng)和部分官方媒體的新聞報道中,收集了2015年第1屆至2021年第6屆的獲獎數(shù)據(jù),其中2020年由于疫情的原因競賽沒有舉辦.我們將收集到的數(shù)據(jù)進(jìn)行了歸納整理.該競賽在2015年第1屆和2016年第2屆時設(shè)置獎項為1等獎、2等獎、3等獎和優(yōu)勝獎,自2017年第3屆起更改獎項設(shè)置為特等獎、1等獎、2等獎、3等獎,并且以后的每屆比賽一直延續(xù)了該獎項設(shè)置.因此,本文全篇研究選取了2017—2021年間近4屆比賽的獲獎情況作為分析的數(shù)據(jù)來源,具體數(shù)據(jù)如表1所示:
表1 2015—2021歷年具體獲獎數(shù)據(jù)
1.2.1 處理方法
競賽數(shù)據(jù)有著不同的特點(diǎn),需要對應(yīng)不同的數(shù)據(jù)處理方法.本文選取熵權(quán)法和TOPSIS綜合評價法作為主要的數(shù)據(jù)處理方法.
1) 熵權(quán)法[9].在信息論中,熵是對不確定性的一種度量.信息量越大不確定性越小,熵越小,在綜合評價中對結(jié)果的影響反而越大,對應(yīng)有較大的權(quán)重.例如特等獎所占權(quán)重更大,基本算法步驟如下:
① 將各個獎項指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理.數(shù)據(jù)指標(biāo)一般分為成本型、效應(yīng)型和區(qū)間型等,對于本文數(shù)據(jù)應(yīng)選取效應(yīng)型指標(biāo),也就是指標(biāo)值越大越好.將各獎項數(shù)據(jù)歸一化到區(qū)間[0,1),假設(shè)給定i個獎項指標(biāo)的數(shù)據(jù)x1,x2,…,xi,對于j學(xué)校的各個獎項指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化后,得到:
(1)
② 計算第i項指標(biāo)下第j個學(xué)校占該指標(biāo)的比重:
(2)
③ 根據(jù)信息熵的定義,1組數(shù)據(jù)的信息熵:
(3)
④ 根據(jù)信息熵的計算公式,計算各個指標(biāo)的信息熵,進(jìn)而得到各個指標(biāo)的權(quán)重:
(4)
⑤ 根據(jù)權(quán)重計算綜合得分:
(5)
2) TOPSIS綜合評價法[10].即“逼近理想解排序方法”,是系統(tǒng)工程中常用的決策技術(shù),主要用來解決有限方案多目標(biāo)決策問題,是一種運(yùn)用距離作為評價標(biāo)準(zhǔn)的綜合評價法.通過計算各研究對象與最優(yōu)方案、最劣方案的相對距離進(jìn)行排序[11],其基本算法步驟如下:
① 構(gòu)造原始數(shù)據(jù)矩陣A=(aij)10×16,其中aij表示某類作品在第i年獲取獎項j的數(shù)目;
② 對原始數(shù)據(jù)進(jìn)行預(yù)處理,為了消除單類作品獲獎總數(shù)對整個評價系統(tǒng)的影響,將數(shù)據(jù)進(jìn)行預(yù)處理,得到矩陣B=(bij)10×16,其中bij=aij/∑aik,k∈[1,2,…,j),bij為某類作品在當(dāng)年獲取某獎項的概率,ak為該領(lǐng)域在當(dāng)年的獲獎總數(shù);
③ 構(gòu)建加權(quán)矩陣C=(cij)10×16.利用權(quán)重W=[w1,w2,…,w16]T,進(jìn)一步得到最終加權(quán)數(shù)據(jù)cij=wjbij;
1.2.2 處理過程
對收集到的2017—2021年4屆比賽的獲獎數(shù)據(jù)進(jìn)行如下處理:
1) 統(tǒng)計各參賽單位歷屆獲得特等獎、1等獎、2等獎、3等獎的數(shù)量.
2) 基于表1的獲獎數(shù)據(jù)采用熵權(quán)法計算各獎項權(quán)重,如表2所示:
表2 2017—2021年各獎項權(quán)重
3) 根據(jù)計算得到的歷屆各獎項權(quán)重以及各參賽單位歷屆獲獎的數(shù)量,依據(jù)式(5)計算各參賽單位歷年的綜合得分及平均數(shù),以此為據(jù)進(jìn)行合理排名.例如,2021年北京航空航天大學(xué)獲特等獎1個、1等獎5個、2等獎4個、3等獎0個,結(jié)合表2所示2021年各獎項權(quán)重,由式(5)可得2021年北京航空航天大學(xué)綜合得分為2.672 8,對得分進(jìn)行歸一化處理后結(jié)果為0.90. 2017—2021年共87所高校和單位參加比賽,表3示出排名前5的參賽單位歷年得分及4年平均得分,完整的87所參賽高校和單位的歷年得分情況將通過郵箱聯(lián)系或GitHub的方式提供.
表3 2017—2021年得分排名前5院校
4) 歷年獲獎作品涉及范圍廣,類型繁多.通過計算并統(tǒng)計獲獎作品題目中出現(xiàn)關(guān)鍵字的頻率[11-13],并結(jié)合目前密碼學(xué)領(lǐng)域涉及的技術(shù)及應(yīng)用方向,將獲獎作品進(jìn)行更細(xì)粒度的劃分,共劃分為密碼分析、區(qū)塊鏈及應(yīng)用、商密算法應(yīng)用、身份認(rèn)證與訪問控制、數(shù)據(jù)簽名及應(yīng)用、算法優(yōu)化、物聯(lián)網(wǎng)、信息隱藏、隱私計算及應(yīng)用和云計算及應(yīng)用10個類型,如圖1所示:
圖1 獲獎作品分類
根據(jù)收集、處理后的獲獎數(shù)據(jù),本文選取北京航空航天大學(xué)、中國人民解放軍戰(zhàn)略支援部隊信息工程大學(xué)(以下簡稱信息工程大學(xué))、西安電子科技大學(xué)這3所加權(quán)排名最高的院校進(jìn)行獲獎情況分析及獲獎作品的整體分析.
2.1.1 北京航空航天大學(xué)
如圖2所示,北京航空航天大學(xué)在密碼技術(shù)競賽中獲獎數(shù)量從2017年的1個1等獎增長到2021年的1個特等獎、5個1等獎、4個2等獎.加權(quán)排名也從2017年的第5名提高到2021年的第1名,穩(wěn)中有進(jìn),參與團(tuán)隊和獲獎數(shù)量呈現(xiàn)明顯增長趨勢.北航在軟件設(shè)計和工程實(shí)踐這2類作品上占據(jù)較大優(yōu)勢,值得注意的是,在最近4屆比賽中,該校斬獲2次特等獎,均為軟件設(shè)計類.參賽作品主要集中在算法優(yōu)化和隱私計算應(yīng)用上.其中算法優(yōu)化類作品獲獎數(shù)量多,占獲獎總數(shù)的45%,且質(zhì)量高,2021年第6屆比賽“票據(jù)隱私保護(hù)的公平自統(tǒng)計電子投票系統(tǒng)”獲得特等獎.
圖2 北京航空航天大學(xué)獲獎情況
圖3 信息工程大學(xué)獲獎情況
2.1.2 信息工程大學(xué)
信息工程大學(xué)2017—2021年獲獎數(shù)量分別是10,10,8,8,獲獎的總體數(shù)量處于平穩(wěn)狀態(tài),保持較高的獲獎能力,加權(quán)排名始終位列全國排名前4.從圖3的歷年獲獎情況和歷年加權(quán)排名可以看出,該校在密碼技術(shù)競賽早期就嶄露頭角、屢創(chuàng)佳績.獲獎作品涵蓋密碼學(xué)各個領(lǐng)域,在參賽作品類型方面擅長軟件設(shè)計和工程實(shí)踐,這也是學(xué)校屢獲佳績的重要原因.
2.1.3 西安電子科技大學(xué)
西安電子科技大學(xué)在密碼技術(shù)競賽中加權(quán)排名一直穩(wěn)定在前5,在2017年和2018年中獲獎主要集中在2等獎和3等獎,2019年斬獲1個特等獎,2021年共獲10個獎項,均勻分布在1等、2等、3等獎項中,說明西電的參賽作品水平呈現(xiàn)穩(wěn)步上升趨勢.該校作品種類涵蓋豐富,軟件設(shè)計和工程實(shí)踐是其優(yōu)勢領(lǐng)域,云計算和密碼算法優(yōu)化占獲獎總數(shù)的55%,如圖4所示.但該校鮮有理論和程序編制方面的作品.
圖4 西安電子科技大學(xué)獲獎情況
2.2.1 官方大類獲獎分析
全國密碼技術(shù)競賽在復(fù)賽選題階段需將作品劃定為軟件設(shè)計、工程實(shí)踐、程序編制、硬件制作、理論課題和其他方面,因此本節(jié)對所有參賽作品按照上述6大類別進(jìn)行分類整理,并統(tǒng)計相關(guān)獲獎情況,結(jié)果如圖5所示.從總體來看,軟件設(shè)計在參賽作品中占比最高,工程實(shí)踐其次,軟件設(shè)計在獲獎方面具有明顯優(yōu)勢.理論課題和硬件制作數(shù)量相對較少,其原因主要是理論課題和硬件制作實(shí)現(xiàn)難度大、作品周期長.
圖5 作品類型統(tǒng)計
2.2.2 A,B類選題獲獎數(shù)據(jù)分析
全國密碼技術(shù)競賽復(fù)賽選題有2種方式:一是選擇由組委會提供的題目(以下稱為A類題);二是參賽團(tuán)隊自擬的題目(以下稱為B類題).A類題由組委會委托國內(nèi)商用密碼企業(yè)根據(jù)實(shí)際應(yīng)用需求出題,B類題需經(jīng)組委會審核通過.為研究A,B類選題對獲獎情況是否有影響,本文進(jìn)行以下分析.
表4展示了2017—2021年共4屆比賽A,B類作品復(fù)賽進(jìn)決賽的淘汰率.該數(shù)據(jù)表明A類淘汰率低,穩(wěn)定在20%以下,B類淘汰率相對較高,在50%左右.分析原因主要有2個:一是A類總數(shù)量較少,例如2021年復(fù)賽中A類總共27個,而B類有231個;二是A類為組委會出題,題目聚焦當(dāng)前形勢下密碼需求,解決工業(yè)界實(shí)際問題.
綜合4屆參賽總體數(shù)據(jù)來看,選取A或B類題目對于獲獎名次高低并沒有特別影響,表5列出了近4屆比賽中A,B類獲獎的比例,從表中可以看出無論是A類還是B類獲得1等獎的概率均在10%~15%之間,獲得2等獎的概率在25%左右,獲得3等獎的概率為60%.
表4 A,B類作品淘汰率 %
表5 A,B類獲獎情況 %
2.3 A,B類選題獲獎作品分析
2017—2021歷年獲獎作品中,A類題和B類題分布如圖6所示.由圖6可知,獲獎作品中算法優(yōu)化類別的作品占比最高,其次是密碼分析類.從圖6也可以得知組委會在A類題目設(shè)計時更傾向于算法優(yōu)化類和密碼分析類,其中A類題中算法優(yōu)化類占比高達(dá)44%,而在自選題中作品類型的整體分布更加均勻,各類型的作品均有涉及.
圖6 獲獎作品分布
為了提供更多參考,統(tǒng)計獲獎?wù)急茸罡叩?類作品,并將這些作品在B類自命題作品中的獲獎趨勢一并進(jìn)行繪制,如圖7所示.從圖7可以看出,密碼分析類作品的獲獎情況相對平穩(wěn),而算法優(yōu)化和隱私計算及應(yīng)用類整體呈現(xiàn)逐年遞增狀態(tài),且在2021年上升趨勢頗為明顯,反映出參賽者更加注重于算法本身的優(yōu)化,同時也與這2年隱私保護(hù)相關(guān)研究頗受密碼學(xué)界的關(guān)注有關(guān).
圖7 獲獎?wù)急茸罡叩?類作品
為探索不同領(lǐng)域作品在獲獎名次上的差異情況,研究是否存在某領(lǐng)域作品更容易獲取高名次獎項的可能,本文首次采取TOPSIS綜合評價法對所有獲獎作品進(jìn)行分析.根據(jù)TOPSIS最優(yōu)與最劣歐氏距離的大小得出不同作品的得分,結(jié)果如表6所示.從得分可以看出,數(shù)據(jù)簽名及應(yīng)用和物聯(lián)網(wǎng)這2類作品的綜合指標(biāo)指數(shù)較高,而云計算及應(yīng)用和商密算法應(yīng)用這2類作品的綜合指標(biāo)指數(shù)相對較低.以TOPSIS方法的標(biāo)準(zhǔn)進(jìn)行評判,前者獲獎作品中高名次獎項占總獎項的比例更大,即該領(lǐng)域作品有更大概率獲取高名次獎項.
通過分析產(chǎn)生上述差異的原因,發(fā)現(xiàn)綜合指標(biāo)指數(shù)最高的數(shù)據(jù)簽名及應(yīng)用類的參賽作品不多,僅占總參賽作品的4%,但是其獲得高名次的獎項占參賽作品的比例較大,導(dǎo)致通過TOPSIS方法計算出的綜合指標(biāo)指數(shù)偏高.而商密算法應(yīng)用類型作品在自命題類別的參賽作品占比最大,3等獎獲獎作品數(shù)目遠(yuǎn)高于其他領(lǐng)域,且其高名次的獲獎作品數(shù)目較少,導(dǎo)致綜合指標(biāo)指數(shù)墊底.因此作品選擇不同領(lǐng)域?qū)ψ髌帆@得的名次有一定的影響,選擇一個參賽作品較多的領(lǐng)域,想法創(chuàng)意容易重復(fù),競爭更加激烈,導(dǎo)致其獲得高名次的綜合指標(biāo)指數(shù)不高,而選擇參賽人數(shù)相對較少的領(lǐng)域更方便凸顯作品的創(chuàng)新性,更容易獲得高名次獎項.
表6 各領(lǐng)域作品綜合指標(biāo)指數(shù)
綜合總體數(shù)據(jù)來看,競賽參與度不斷提高,作品創(chuàng)新性不斷增強(qiáng),影響力不斷擴(kuò)大,獲獎作品的主題與當(dāng)前密碼學(xué)研究的熱點(diǎn)問題緊密聯(lián)系,主要呈現(xiàn)出如下的特點(diǎn):
1) 重視國產(chǎn)密碼應(yīng)用.國產(chǎn)密碼算法是保障我國網(wǎng)絡(luò)安全自主可控的重要基石,密碼的國產(chǎn)化改造和推廣引起了國內(nèi)的廣泛關(guān)注,根據(jù)對歷年參賽作品的統(tǒng)計,90%以上作品均采用國產(chǎn)密碼算法,推動了我國國產(chǎn)密碼的發(fā)展.
2) 更強(qiáng)調(diào)密碼技術(shù)本身.縱觀獲取高名次的作品,其不僅能夠結(jié)合實(shí)際場景形成較高的實(shí)用性和創(chuàng)新性,同時能夠?qū)γ艽a技術(shù)本身進(jìn)行完善精進(jìn),提出新理論、新方法、新技術(shù),能有效地解決問題并能產(chǎn)生積極效果.
3) 更廣的作品覆蓋領(lǐng)域.緊跟學(xué)科/技術(shù)發(fā)展潮流的作品不僅包含傳統(tǒng)的密碼算法、密碼芯片、密碼協(xié)議、密碼分析等技術(shù),還涵蓋區(qū)塊鏈、數(shù)字貨幣、量子密碼、物聯(lián)網(wǎng)輕量級密碼、云安全、個人隱私保護(hù)等當(dāng)今密碼學(xué)科前沿技術(shù),充分體現(xiàn)了密碼學(xué)科在網(wǎng)絡(luò)空間安全領(lǐng)域的新需求、新場景、新特點(diǎn)和新應(yīng)用.
1) 參賽單位的重視程度及專業(yè)基礎(chǔ).根據(jù)本文綜合排名前3的獲獎數(shù)據(jù)以及對排名前3的院校的調(diào)研信息可知,其對大賽認(rèn)可度高,前期對競賽宣傳力度大,學(xué)生參與度強(qiáng),報名參賽隊伍多,增加了其獲獎數(shù)目和獲獎質(zhì)量的概率,同時也與其密碼學(xué)研究基礎(chǔ)或在密碼學(xué)相關(guān)領(lǐng)域的研究投入有很大關(guān)系.
2) 作品的選題及所屬的研究領(lǐng)域.從綜合排名前3的單位來看,其參賽隊伍選題涵蓋了各種類型,且與當(dāng)前我國密碼領(lǐng)域研究熱點(diǎn)問題相關(guān),例如區(qū)塊鏈、隱私計算等.通過TOPSIS綜合評價法對獲獎作品領(lǐng)域的分析結(jié)果可以看出,選擇一個作品類型不多的小眾或尖端領(lǐng)域,可降低作品內(nèi)容和所用技術(shù)同質(zhì)化的概率,一定程度上增加作品的創(chuàng)新性分?jǐn)?shù),提高獲獎概率.
3) 作品內(nèi)容的完整性、實(shí)用性和創(chuàng)新性.從獲得較好名次和未獲得名次的作品對比分析中可知,獲獎作品不僅關(guān)注技術(shù)的應(yīng)用,也關(guān)注技術(shù)本身的完善,作品的綜合完成度高是其具備的普遍特點(diǎn);同時獲獎作品往往能夠有效解決題目設(shè)定的應(yīng)用問題,具備較高的實(shí)用性;獲獎作品一般采用了新技術(shù)、新方法等,即使是在前人工作的基礎(chǔ)上也會有較大改進(jìn)和突破,擁有獨(dú)到見解,創(chuàng)新性十足.
根據(jù)全國密碼技術(shù)競賽歷屆的參賽獲獎情況及本文的系統(tǒng)性分析結(jié)果,本文對今后的參賽單位和團(tuán)隊提供以下建議供其參考:
1) 參賽單位.參賽單位的組織者應(yīng)高度重視,前期積極組織宣傳,鼓勵學(xué)生參與比賽.一方面不僅可以鍛煉學(xué)生的創(chuàng)新能力和實(shí)踐能力,提高整體水平,同時大的參賽隊伍基數(shù)能有效增加整體及優(yōu)秀組織獎的獲獎概率,也為自身后續(xù)參加密碼技術(shù)競賽的發(fā)展進(jìn)行全方位的資源儲備.
2) 參賽隊伍.在組隊時應(yīng)考慮覆蓋全面,比賽涉及代碼編寫、文檔撰寫、PPT制作、匯報演講,在各階段要充分考慮隊員優(yōu)勢,做到分工明確、各盡其能.同時要注意和指導(dǎo)老師保持良好溝通,接受多方意見,在不斷地商討中完善作品.
3) 作品領(lǐng)域.選擇一個相對競爭壓力小的領(lǐng)域,更易于與其他作品形成差異化.同時也可以選擇以某一領(lǐng)域為研究核心,交叉其他領(lǐng)域的作品參賽,通過融合其他領(lǐng)域的技術(shù)特點(diǎn),提升作品的技術(shù)深度.
4) 作品選題.A類題框定了作品的研究領(lǐng)域和內(nèi)容、制定了研究方向,能夠節(jié)省參賽者的選題時間,但相對B類自命題的自由度不高,如無明確研究方向的隊伍可在選題第一時間關(guān)注官網(wǎng)發(fā)布的A類題,在對A類題目有基礎(chǔ)且能保證作品實(shí)現(xiàn)的前提下可率先選擇.
5) 作品內(nèi)容.參賽者需區(qū)分大賽與其他賽事的作品要求,作品內(nèi)容不僅要關(guān)注應(yīng)用領(lǐng)域的新穎性,還要更多地關(guān)注密碼技術(shù)本身,強(qiáng)調(diào)密碼技術(shù)的創(chuàng)新性和實(shí)用性.
6) 比賽過程.復(fù)賽注重作品文檔的打磨,決賽側(cè)重作品實(shí)現(xiàn)和講解.在比賽的不同階段有不同的側(cè)重點(diǎn),注意合理分配時間.
全國密碼技術(shù)競賽自舉辦以來得到了各方的積極響應(yīng),集聚了豐富的技術(shù)、人才、市場等各類創(chuàng)新創(chuàng)業(yè)資源,建立了人才與企業(yè)的對接平臺,展現(xiàn)了我國密碼教育事業(yè)的蓬勃發(fā)展,推動了我國網(wǎng)絡(luò)空間安全學(xué)科的健康發(fā)展.本文基于獲獎數(shù)據(jù)對全國密碼技術(shù)競賽的歷屆參賽情況和獲獎情況進(jìn)行數(shù)據(jù)處理和可視化分析,是對全國密碼技術(shù)競賽的首次系統(tǒng)性分析,以此期望對未來參加此類密碼技術(shù)競賽的團(tuán)隊提供理論借鑒和數(shù)據(jù)參考,這是本文數(shù)據(jù)分析的價值體現(xiàn).同時,在本文數(shù)據(jù)分析的基礎(chǔ)上,可以繼續(xù)利用自然語言處理技術(shù)對作品類型進(jìn)行更精準(zhǔn)的劃分,利用機(jī)器學(xué)習(xí)模型對院校未來的獲獎趨勢及作品類型分布進(jìn)行預(yù)測,這是本文未來可持續(xù)跟進(jìn)研究的內(nèi)在動因.