戴付晗 樸雪
摘要:隨著智能算法的發(fā)展,高考志愿的填報(bào)逐漸成為熱點(diǎn)話題,而智能算法在高考志愿平臺(tái)的應(yīng)用相關(guān)研究文獻(xiàn)缺少系統(tǒng)性整理。該研究以中國(guó)知網(wǎng)期刊數(shù)據(jù)平臺(tái)和 Web of science為數(shù)據(jù)來(lái)源,采用文獻(xiàn)計(jì)量學(xué)方法檢索2011~2021年該領(lǐng)域相關(guān)文獻(xiàn),通過對(duì)比分析與數(shù)據(jù)可視化,了解國(guó)內(nèi)外研究現(xiàn)狀、研究趨勢(shì)以及發(fā)展差距,從而為國(guó)內(nèi)研究者提供參考和借鑒。
關(guān)鍵詞:高考志愿;智能算法;推薦算法;推薦平臺(tái)
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)06-0049-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 概述
近些年,各省高考政策、考試內(nèi)容、考核方式、錄取制度等都在不斷調(diào)整,高校招生也在變革之中。與此同時(shí),市面上的高考志愿推薦平臺(tái)層出不窮,更多是通過對(duì)往年高考錄取分?jǐn)?shù)和排名分析來(lái)推薦高校,沒有考慮到考生需求、學(xué)科偏好等,很難切實(shí)進(jìn)行個(gè)性化“因材推薦”。智能算法近年來(lái)發(fā)展迅速,并已在眾多領(lǐng)域推廣應(yīng)用,而智能算法在高考志愿推薦平臺(tái)中的應(yīng)用研究又缺少系統(tǒng)性整理。故本文以中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)為數(shù)據(jù)來(lái)源[1],借助文獻(xiàn)計(jì)量方法,檢索2011 -2021年間該領(lǐng)域相關(guān)文獻(xiàn)[2],通過數(shù)據(jù)分析和數(shù)據(jù)可視化,為高考志愿填報(bào)服務(wù)平臺(tái)的開發(fā)者以及智能算法研究者們提供理論參考和借鑒。
2 對(duì)高考志愿的文獻(xiàn)研究與分析
2.1 對(duì)高考志愿的文獻(xiàn)研究與分析
筆者在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)中對(duì)高考志愿相關(guān)研究論文進(jìn)行高級(jí)檢索,時(shí)間跨度設(shè)置為 2011-2021 年,選取關(guān)鍵詞“高考志愿”進(jìn)行精確檢索,返回結(jié)果664條,其中主要來(lái)自教育和計(jì)算機(jī)科學(xué)領(lǐng)域。
從圖1分析得出:2011-2021年國(guó)內(nèi)高考志愿相關(guān)文獻(xiàn)總體上數(shù)量呈上升趨勢(shì),2011~2017年文獻(xiàn)數(shù)量增長(zhǎng)比較平緩,總體趨勢(shì)上升;2017年至2019年,相關(guān)文獻(xiàn)數(shù)量出現(xiàn)較大增長(zhǎng),其中2019年數(shù)量達(dá)到十年內(nèi)峰值86篇;2020~2021年有一定程度的下降。這說(shuō)明在高考志愿領(lǐng)域,國(guó)內(nèi)研究逐漸深入,2019年后高考改革,之前高考相關(guān)研究的文獻(xiàn)參考價(jià)值變?nèi)?,?dǎo)致此后論文發(fā)表量下降,但隨著各地區(qū)新高考模式的逐漸成熟,2021年相對(duì)2019年將會(huì)有所上升,加之人工智能和大數(shù)據(jù)技術(shù)在各領(lǐng)域的應(yīng)用,未來(lái)高考志愿推薦的研究將會(huì)更加深入。
在高考志愿主題下,在檢索結(jié)果提煉關(guān)鍵詞,通過分析可以發(fā)現(xiàn),占比較高的是新高考改革,占比高達(dá)81%,詳見圖2。由此說(shuō)明新高考政策出臺(tái)后,多個(gè)期刊都進(jìn)行了新高考改革后高考志愿的研究。綜合來(lái)說(shuō),國(guó)內(nèi)研究者主要是通過分析當(dāng)下的高考改革、高考志愿填報(bào)、高考志愿錄取形式、影響高考填報(bào)的因素等幾個(gè)方面展開論述。值得注意的是,高考志愿填報(bào)和志愿服務(wù)相關(guān)文獻(xiàn)較少,且不夠深入。而在為數(shù)不多的高考志愿填報(bào)相關(guān)文獻(xiàn)中幾乎都涉及智能算法,包括推薦算法、聚類模糊算法、協(xié)同過濾算法等。
2.2 推薦算法在高考志愿填報(bào)中應(yīng)用的文獻(xiàn)分析
因此,高考志愿填報(bào),可以通過計(jì)算機(jī)領(lǐng)域中的算法進(jìn)行優(yōu)化和改進(jìn)。數(shù)據(jù)挖掘、大數(shù)據(jù)、志愿填報(bào)等關(guān)鍵詞與推薦算法都有一定的聯(lián)系。那么推薦算法應(yīng)用于高考志愿服務(wù)平臺(tái)是可行的,于是在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)中采用高級(jí)檢索推薦算法并且模糊匹配高考志愿相關(guān)研究文獻(xiàn)進(jìn)行檢索,檢索時(shí)間跨度為 2011~2021年,返回檢索結(jié)果8條。
通過表1可以看出,國(guó)內(nèi)對(duì)于推薦算法和高考志愿的研究還是有很大的研究空間,近些年來(lái)研究相對(duì)較多,大多數(shù)還是基于協(xié)同過濾算法、遺傳算法、模糊聚類算法的研究。文獻(xiàn)中有6篇來(lái)源于計(jì)算機(jī)專項(xiàng)的期刊。與此同時(shí),可以發(fā)現(xiàn)推薦算法在高考志愿服務(wù)平臺(tái)的使用有著很大的前景。
3 對(duì)推薦算法相關(guān)文獻(xiàn)分析
由于推薦算法可以在高考志愿服務(wù)平臺(tái)的使用,在一定程度上可以加強(qiáng)志愿服務(wù)平臺(tái)的個(gè)性化和增強(qiáng)適配性,于是通過檢索中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)與Web of Science 數(shù)據(jù)庫(kù)相關(guān)文獻(xiàn),進(jìn)行國(guó)內(nèi)外推薦算法的對(duì)比研究與分析。通過分析國(guó)內(nèi)推薦算法相關(guān)文獻(xiàn)的出處,更清晰地體現(xiàn)其發(fā)展過程和今后的研究目標(biāo),為相關(guān)科研人員今后發(fā)表文獻(xiàn)給予了更加明確的指導(dǎo)。
3.1 國(guó)內(nèi)推薦算法相關(guān)文獻(xiàn)
在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)中采用高級(jí)檢索對(duì)推薦算法相關(guān)研究論文進(jìn)行檢索,檢索時(shí)間跨度為 2011-2021 年,選取檢索關(guān)鍵詞“推薦算法”進(jìn)行精確查找,返回檢索結(jié)果6059條。其中涉及學(xué)科最多的是信息科技、計(jì)算機(jī)科學(xué),電子信息、軟件工程也有涉及。
國(guó)內(nèi)研究者主要是通過個(gè)性化推薦、協(xié)同過濾推薦算法、模糊聚類算法的研究[3],并且進(jìn)行了協(xié)同過濾算法等的介紹、發(fā)展、基于各類應(yīng)用場(chǎng)景等方面的系列綜述,從而對(duì)研究和應(yīng)用前景進(jìn)行了展望。
從2011年至2021年國(guó)內(nèi)與推薦算法相關(guān)的文獻(xiàn)總數(shù)為上升趨勢(shì),2011年至2012年相關(guān)文獻(xiàn)數(shù)量平穩(wěn)發(fā)展(根據(jù)圖3)。2019年達(dá)到近十年最高,達(dá)到738篇,2020年有小幅度下降,2021年預(yù)計(jì)發(fā)表量達(dá)到771篇。體現(xiàn)在推薦算法領(lǐng)域,國(guó)內(nèi)的相關(guān)研究走向成熟,與此同時(shí)推薦算法已經(jīng)被應(yīng)用到了很多方面,如圖書、音樂、視頻、電子商務(wù)等[4],增強(qiáng)了用戶滿意度和用戶黏性,而在用戶滿意度方面目前高考志愿填報(bào)平臺(tái)較為薄弱,所以高考志愿填報(bào)在推薦算法方面的研究前景巨大。
通過分類和人工篩選,得出各“關(guān)鍵詞”的詳細(xì)占比統(tǒng)計(jì),詳見圖 4 。使用高級(jí)檢索以推薦算法為主題,推薦算法占據(jù)統(tǒng)計(jì)量的20%。協(xié)同過濾、推薦系統(tǒng)、協(xié)同過濾算法、協(xié)同過濾推薦算法占據(jù)48%,可以看出關(guān)于推薦算法的研究,大多數(shù)研究協(xié)同過濾算法較多、在研究推薦算法時(shí),可以重點(diǎn)關(guān)注協(xié)同過濾算法。除此以外,個(gè)性化推薦、數(shù)據(jù)庫(kù)、矩陣分解、基于用戶也占據(jù)不小的比例。
論文引用率是衡量一個(gè)國(guó)家科研文獻(xiàn)被其他國(guó)家或機(jī)構(gòu)的認(rèn)可度的標(biāo)志,有較大的研究?jī)r(jià)值,于是本文對(duì)文獻(xiàn)引用量前兩百進(jìn)行相關(guān)分析。從圖5可以看出對(duì)于推薦算法的研究計(jì)算機(jī)科學(xué)、計(jì)算機(jī)學(xué)報(bào)、計(jì)算機(jī)應(yīng)用研究、計(jì)算機(jī)研究與發(fā)展的期刊研究較多,占比總文獻(xiàn)的32%,綜合類期刊文獻(xiàn)引用量較少。由此可以發(fā)現(xiàn),推薦算法主要出現(xiàn)在計(jì)算機(jī)領(lǐng)域,因此推薦算法的研究建議相關(guān)理論和實(shí)踐研究者首先查閱計(jì)算機(jī)相關(guān)的期刊文獻(xiàn)。
1) 國(guó)內(nèi)推薦算法引用量前十文獻(xiàn)的研究
在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)平臺(tái)上以“推薦算法”為關(guān)鍵詞,選取 2011~2021年引用量前10的文獻(xiàn)(檢索結(jié)果見表2)[5]。其中被引次數(shù)排名第一的是個(gè)性化推薦系統(tǒng)綜述,其次是推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述,都有較高的引用量。從表2可以得出,引用量相對(duì)較高的大多數(shù)是綜述,10篇中有6篇是綜述類文獻(xiàn)。期刊大多數(shù)是計(jì)算機(jī)工程、電子信息、軟件工程的專項(xiàng)期刊,綜合類期刊占比不高。
3.2 國(guó)外推薦算法的文獻(xiàn)的分析與研究
為了解國(guó)外對(duì)于推薦算法的當(dāng)下研究情況,在Web of Science 數(shù)據(jù)庫(kù)中對(duì)推薦算法相關(guān)論文進(jìn)行檢索,檢索年限為 2011年至2021年,主題設(shè)置為Recommendation algorithm,Mesh為Algorithms返回檢索結(jié)果3319條。
1) 國(guó)外推薦算法的數(shù)量分析與研究
從圖6可以看出,2011-2019國(guó)外研究發(fā)表論文數(shù)量整體呈現(xiàn)波動(dòng)式上升趨勢(shì),發(fā)表量基本在300篇上下浮動(dòng)。2019~2021年出現(xiàn)較大的下滑,2019年達(dá)到發(fā)表量最高,超過400篇。由此可以發(fā)現(xiàn),國(guó)外推薦算法的研究較為平穩(wěn),近三年波動(dòng)較大,有下降的趨勢(shì)。
對(duì)近10年來(lái)推薦算法不同研究方向進(jìn)行統(tǒng)計(jì)(詳見圖7),發(fā)現(xiàn)數(shù)學(xué)占比最大,其次為醫(yī)療保健科學(xué)服務(wù),另外藥理學(xué)藥學(xué)、數(shù)學(xué)計(jì)算生物學(xué)、放射學(xué)核醫(yī)學(xué)醫(yī)學(xué)成像、計(jì)算機(jī)科學(xué)等,在大類學(xué)科上基本可以分為醫(yī)學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)。由此得出,國(guó)外推薦算法的研究有較大部分是在醫(yī)學(xué)上的應(yīng)用和研究,推薦算法在醫(yī)學(xué)領(lǐng)域的應(yīng)用上有著較大的前景。
2) 國(guó)外推薦算法文獻(xiàn)來(lái)源與研究
以Web of Science 為數(shù)據(jù)來(lái)源[5],對(duì) 2011~2021年推薦算法相關(guān)文獻(xiàn)按出版物來(lái)源進(jìn)行分類。其中,PLOS ONE發(fā)表的關(guān)于推薦算法的文獻(xiàn)最多,其次是MEDICAL PHYSICS、SENSORS、SENSORS BASEL SWITZERLAND。其中PLOS ONE相對(duì)其他期刊發(fā)表量較多(圖 8)。
國(guó)外引用量前10名的文獻(xiàn)分析在 Web of science 數(shù)據(jù)庫(kù)中,以策略(主題)設(shè)置為Recommendation algorithm,Mesh為Algorithms為檢索條件,檢索 2011年至2021年引用量前10的相關(guān)文獻(xiàn)(檢索結(jié)果見表3)。被引次數(shù)較多的仍是醫(yī)學(xué)領(lǐng)域的相關(guān)文獻(xiàn),可見國(guó)外在計(jì)算機(jī)領(lǐng)域的推薦算法研究較少,而醫(yī)學(xué)領(lǐng)域的推薦算法研究較為深入。
3.3 國(guó)內(nèi)外推薦算法研究情況對(duì)比分析
對(duì)以推薦算法并且高考志愿為主題檢索,可以發(fā)現(xiàn)國(guó)內(nèi)相關(guān)論文數(shù)量為個(gè)位數(shù),說(shuō)明在國(guó)內(nèi)對(duì)于推薦算法高考志愿服務(wù)平臺(tái)的研究較少。而國(guó)外由于升學(xué)機(jī)制與國(guó)內(nèi)存在差異,當(dāng)檢索高考、志愿等關(guān)鍵詞和主題時(shí),檢索結(jié)果為0,于是檢索內(nèi)容更改為推薦算法,探索國(guó)內(nèi)外對(duì)于推薦算法的研究差異。
我國(guó)對(duì)于推薦算法的研究的學(xué)科和期刊大多數(shù)還是計(jì)算機(jī)、軟件工程、電子信息,而國(guó)外推薦算法的研究的學(xué)科和期刊,種類相對(duì)豐富。值得注意的是,國(guó)外文獻(xiàn)對(duì)于推薦算法研究更傾向于醫(yī)學(xué)領(lǐng)域。推薦算法出現(xiàn)和研究的時(shí)間較短,國(guó)內(nèi)在各種領(lǐng)域的研究相對(duì)較窄,主要集中于研究模糊聚類算法、協(xié)同過濾算法的研究,對(duì)于算法實(shí)際應(yīng)用研究不夠深入。未來(lái)推薦算法的研究應(yīng)當(dāng)繼續(xù)深入,在多個(gè)領(lǐng)域進(jìn)行研究,將醫(yī)學(xué)、數(shù)學(xué)、物理、計(jì)算機(jī)科學(xué)等學(xué)科進(jìn)行交叉研究,提升研究的實(shí)用性和適用性。
綜合國(guó)內(nèi)外文獻(xiàn),推薦算法的研究發(fā)展時(shí)間不長(zhǎng),但是發(fā)展日益迅速,文獻(xiàn)發(fā)表量、應(yīng)用量總體逐年上升。與此同時(shí),國(guó)外研究開始時(shí)間早,發(fā)表相關(guān)文獻(xiàn)的總量多,并且研究方向更多的是與醫(yī)藥衛(wèi)生相關(guān),而國(guó)內(nèi)研究更偏重計(jì)算機(jī)科學(xué)、電子信息、軟件工程。從長(zhǎng)遠(yuǎn)來(lái)看,國(guó)內(nèi)對(duì)于推薦算法各種領(lǐng)域的研究有待發(fā)掘。
4 結(jié)束語(yǔ)
對(duì)推薦算法在高考志愿服務(wù)平臺(tái)的研究,國(guó)內(nèi)國(guó)外文獻(xiàn)總體呈現(xiàn)數(shù)量少、相關(guān)度低的態(tài)勢(shì)。目前市面上的相關(guān)志愿填報(bào)平臺(tái),一定程度上存在政策更新慢、院校介紹缺失、交互性差、缺少人工智能支持等弊端,在推薦院校上較為狹隘,無(wú)法體現(xiàn)出平臺(tái)志愿填報(bào)的優(yōu)勢(shì),缺失真正合適的推薦算法的體現(xiàn)和探究。近年來(lái),人工智能算法不斷創(chuàng)新和進(jìn)步,從簡(jiǎn)單的數(shù)理統(tǒng)計(jì)算法(如Logistic回歸算法和線性回歸算法)到復(fù)雜的智能算法(如CNN)。隨著算法復(fù)雜度的不斷提高,其應(yīng)用前景也越來(lái)越廣闊。許多算法已經(jīng)應(yīng)用于語(yǔ)音識(shí)別、金融、醫(yī)療等領(lǐng)域[6]。與此同時(shí),國(guó)內(nèi)研究者也嘗試、研究推薦算法在高考志愿填報(bào)上的應(yīng)用。隨著國(guó)內(nèi)的推薦算法在高考志愿推薦平臺(tái)的研究,相信在不久的將來(lái)將會(huì)有一個(gè)更加智能、詳細(xì)的平臺(tái),切實(shí)地幫助到使用者。
參考文獻(xiàn):
[1] 胡嘉豪,孫焱,程景民.基于CiteSpace的互聯(lián)網(wǎng)醫(yī)療研究文獻(xiàn)可視化分析[J].中國(guó)數(shù)字醫(yī)學(xué),2020,15(10):59-61.
[2] 李穎,石磊,張寧,等.針刺雙向調(diào)節(jié)效應(yīng)研究的文獻(xiàn)計(jì)量分析[J].遼寧中醫(yī)雜志,2017,44(11):2394-2397,2464.
[3] 李華,張宇,孫俊華.基于用戶模糊聚類的協(xié)同過濾推薦研究[J].計(jì)算機(jī)科學(xué),2012,39(12):83-86.
[4] 向邦盛,劉滌.試談推薦算法及應(yīng)用[J].電腦編程技巧與維護(hù),2020(7):43-45,54.
[5] 劉久煜,張?jiān)虑?,樸?腦機(jī)接口技術(shù)發(fā)展?fàn)顩r分析——基于文獻(xiàn)調(diào)研[J].衛(wèi)生職業(yè)教育,2019,37(19):133-135.
[6] 劉理,吳官權(quán),漆世鍇,等.同時(shí)測(cè)量曲率和溫度的高靈敏度光纖傳感器[J].傳感器與微系統(tǒng),2019,38(10):64-66,69.
【通聯(lián)編輯:謝媛媛】