范清清 唐毅
摘? 要:文章以CNKI數(shù)據(jù)庫收錄的2016—2020年國內(nèi)區(qū)塊鏈相關(guān)研究文獻作為研究對象,采用文獻計量方法對樣本文獻的年度發(fā)文量、期刊分布進行分析;并利用共詞分析法對樣本文獻的高頻關(guān)鍵詞進行處理,運用SPSS軟件對關(guān)鍵詞相關(guān)與相異矩陣進行因子分析、聚類分析以及多維尺度分析;研究發(fā)現(xiàn)目前國內(nèi)區(qū)塊鏈領(lǐng)域的研究熱點主要集中6個方面,其中信息安全是國內(nèi)區(qū)塊鏈領(lǐng)域研究的核心熱點與重點。
關(guān)鍵詞:區(qū)塊鏈;文獻計量;共詞分析;信息安全
中圖分類號:TP311;G353.1? ? ? ? ? ? ? ? ?文獻標(biāo)識碼:A文章編號:2096-4706(2021)16-0172-05
Analysis of Domestic Blockchain Research Hotspots Based on Bibliometrics and
Co-word Analysis
FAN Qingqing, TANG Yi
(School of Public Administration, Xiangtan University, Xiangtan? 411105, China)
Abstract: The paper takes the domestic blockchain related research literature from 2016 to 2020 included in CNKI database as the research object, the annual publication volume and journal distribution of the sample literature are analyzed by bibliometric method; the Co word analysis is used to process the high-frequency keywords of the sample literature, and SPSS software is used to carry out factor analysis, cluster analysis and multi-dimensional scale analysis on the keyword correlation and dissimilarity matrix; it is found that at present, the research hotspots in the domestic blockchain field mainly focus on six aspects, among which information security is the core hotspot and focus in the domestic blockchain field.
Keywords: blockchain; bibliometrics; co-word analysis; information security
0? 引? 言
2008年,中本聰提出比特幣概念,而區(qū)塊鏈作為比特幣的底層技術(shù)之一由此而生。區(qū)塊鏈?zhǔn)菍?shù)據(jù)區(qū)塊以時間順序的方式通過存儲前一數(shù)據(jù)區(qū)塊哈希值與前一數(shù)據(jù)區(qū)塊相連接而成。區(qū)塊鏈一直擁有頗高的關(guān)注度,學(xué)者們也在不斷地對區(qū)塊鏈技術(shù)進行探索與創(chuàng)新。為了把握當(dāng)前國內(nèi)區(qū)塊鏈研究的前沿?zé)狳c,本文采用文獻計量和共詞分析法對國內(nèi)區(qū)塊鏈相關(guān)研究文獻進行梳理分析,揭示國內(nèi)區(qū)塊鏈研究現(xiàn)狀與熱點話題,為區(qū)塊鏈領(lǐng)域的相關(guān)研究提供參考。
本文選取CNKI數(shù)據(jù)庫為數(shù)據(jù)源,以“區(qū)塊鏈”為檢索詞進行篇名檢索,由于檢索出2015年有關(guān)區(qū)塊鏈的文獻只有9篇,所以選用了2016—2020年區(qū)塊鏈相關(guān)研究文獻進行分析,共檢索出相關(guān)文獻11 872篇,除去會議通知、報刊訊息等噪音文獻,共篩選出9 199篇有效文獻。
1? 文獻計量分析
1.1? 年度發(fā)文量分析
發(fā)文量在一定程度上反映出該領(lǐng)域相關(guān)研究在某段時間的研究水平與發(fā)展趨勢[1]。對樣本文獻按照時間順序進行梳理,發(fā)文量趨勢圖,如圖1所示。2015年之前區(qū)塊鏈研究文獻非常少,區(qū)塊鏈研究處于萌芽階段。而在2016—2017年,區(qū)塊鏈研究文獻數(shù)量實現(xiàn)大跨度的飛躍進展,這兩年區(qū)塊鏈研究處于迅速發(fā)展階段。在2018—2020年區(qū)塊鏈的研究處于突破爆發(fā)階段。越來越多的領(lǐng)域引用了區(qū)塊鏈技術(shù),區(qū)塊鏈的研究發(fā)展也越來越成熟。
1.2? 期刊分布情況分析
據(jù)統(tǒng)計,樣本文獻共分布在1 889種期刊,平均期刊載文量為4.87篇。根據(jù)布拉德福定律,按照每個區(qū)域文獻數(shù)量大體一致的原則,將期刊分為3個區(qū)域:第一個區(qū)域為核心區(qū),共有83種期刊,約占期刊總數(shù)的4.39%,文獻數(shù)量約占總文獻量的32.71%;第二個區(qū)域為相關(guān)區(qū),共有282種期刊,約占期刊總數(shù)的14.93%,文獻數(shù)量約占總文獻量的34.5%;第三個區(qū)域為非相關(guān)區(qū)域,共有1 524 種期刊,約占期刊總數(shù)的80.68%,文獻數(shù)量約占總文獻量的32.79%。這3個區(qū)域的期刊數(shù)量比為83:282:1 524,與布拉德福定律公式1:n:n2相擬合,其中n約為4,可以推斷出該樣本文獻的期刊分布基本符合布拉德福定律,說明區(qū)塊鏈研究已經(jīng)形成核心期刊群,載文量前5位的核心期刊為金融電子化(82篇)、金融科技時代(82篇)、時代金融(80篇)、網(wǎng)絡(luò)空間安全(73篇)、金卡工程(70篇)。
2? 共詞分析
2.1? 關(guān)鍵詞詞頻統(tǒng)計
采用SATI3.2對樣本文獻的關(guān)鍵詞進行頻次統(tǒng)計。去除一些無意義的關(guān)鍵詞,如“應(yīng)用”等;合并同義詞,如將“超級賬本”和“hyperledger”合并為“超級賬本”等;將檢索詞“區(qū)塊鏈”去除,因其出現(xiàn)的頻次為7 445次,對研究熱點分析無太大的意義[2]。
將關(guān)鍵詞詞頻從高到低排序,最終確定前50個高頻關(guān)鍵詞為研究對象。這50個高頻關(guān)鍵詞在較大程度上可以反映出2016—2020年間我國區(qū)塊鏈領(lǐng)域研究的熱點。高頻關(guān)鍵詞統(tǒng)計表,如表1所示。
2.2? 構(gòu)建共詞矩陣
利用SATI3.2構(gòu)建50×50的關(guān)鍵詞共詞矩陣,如表2所示。共詞矩陣主對角線上的數(shù)值表示對應(yīng)的關(guān)鍵詞在樣本文獻中出現(xiàn)的總次數(shù),共對角線之外的數(shù)值表示行和列所對應(yīng)的關(guān)鍵詞同時出現(xiàn)的頻次。如“智能合約”和“去中心化”對應(yīng)的數(shù)值是154,則說明這兩個關(guān)鍵詞在同一篇文章中出現(xiàn)的次數(shù)為154次。兩個關(guān)鍵詞出現(xiàn)在同一篇文章的頻次越多,代表著這兩個關(guān)鍵詞的聯(lián)系程度越強[3]。
為了消除共詞矩陣數(shù)值差別較大帶來的影響[4],將共詞矩陣導(dǎo)入到SPSS22中進行相關(guān)分析,生成關(guān)鍵詞相關(guān)矩陣,用來做因子分析。再用1減去關(guān)鍵詞相關(guān)矩陣的每個數(shù)值,得到關(guān)鍵詞相異矩陣,用來做聚類分析和多維尺度分析。
2.3? 多元統(tǒng)計分析
2.3.1? 因子分析
因子分析是將多個變量轉(zhuǎn)變成為若干個不相關(guān)綜合指標(biāo)的一種多元統(tǒng)計方法。將關(guān)鍵詞相關(guān)矩陣導(dǎo)入到SPSS22中進行因子分析,提取方法為主成分分析法,得到總方差解釋表,如表3所示,得到碎石圖,如圖2所示。
從表3中可知,有16個公共因子被提取,累積方差貢獻率為67.301%,代表著這50個高頻關(guān)鍵詞可以解釋2016—2020年國內(nèi)區(qū)塊鏈領(lǐng)域67.301%的研究現(xiàn)狀。從碎石圖中可知,在第6個因子之前曲線的陡峭度比較高,為了優(yōu)化聚類效果,選擇從高頻關(guān)鍵詞中提取6個公共因子,為下面的聚類分析提供依據(jù)[5]。
2.3.2? 聚類分析
聚類分析可以將某一領(lǐng)域眾多關(guān)鍵詞進行分類,使得聯(lián)系度較高的關(guān)鍵詞分為一類,進而來表明該研究領(lǐng)域的不同研究方向組成[2]。將關(guān)鍵詞相異矩陣導(dǎo)入SPSS22中,采用系統(tǒng)聚類,使用組之間的鏈接方法和平方Euclidean距離進行聚類分析,得到高頻關(guān)鍵詞聚類譜系圖,如圖3所示。
在參照因子分析結(jié)果的基礎(chǔ)上,依據(jù)聚類分析譜系圖,可以將這50個高頻關(guān)鍵詞大致分為6類:第一類包括以太坊、精準(zhǔn)扶貧、智能合約、非對稱加密、分布式存儲、超級賬本、共識機制、工作量證明、去中心化、比特幣、時間戳、數(shù)據(jù)庫;第二類包括數(shù)字經(jīng)濟、云計算、檔案管理、電子證據(jù)、大數(shù)據(jù)、共享經(jīng)濟、人工智能;第三類包括版權(quán)保護、圖書館、審計、會計、財務(wù)管理、高校、跨境電商;第四類包括金融科技、商業(yè)銀行、供應(yīng)鏈金融、信息不對稱、互聯(lián)網(wǎng)金融、金融監(jiān)管、區(qū)塊鏈金融、數(shù)字資產(chǎn)、信任機制;第五類包括溯源、農(nóng)產(chǎn)品、供應(yīng)鏈、物流、食品安全;第六類包括隱私保護、零知識證明、數(shù)據(jù)共享、物聯(lián)網(wǎng)、訪問控制、信息安全、身份認證、聯(lián)盟鏈、區(qū)塊鏈平臺、能源互聯(lián)網(wǎng)。
2.3.3? 多維尺度分析
多維尺度法將多維空間的研究對象簡化到低維空間進行定位、分析和歸類,并利用距離的遠近來展現(xiàn)研究對象之間的相關(guān)性。將關(guān)鍵詞相異矩陣導(dǎo)入SPSS22中進行多維尺度分析,得到Stress=0.174<0.2,RSQ=0.892>0.8,模型的擬合度較好。高頻關(guān)鍵詞多維尺度圖,如圖4所示。在多維尺度圖中各個關(guān)鍵詞的位置用小圓圈來表示,圓圈間的距離越近,關(guān)鍵詞的聯(lián)系度越高[4]。多維尺度圖中越靠近原點并且分布較為集中的關(guān)鍵詞,說明該研究方向得到的關(guān)注度較高,為核心熱點[6]。
由圖4可知,關(guān)鍵詞大致可劃分為6個區(qū)域,第一個區(qū)域關(guān)鍵詞有大數(shù)據(jù)、人工智能、檔案管理、數(shù)字經(jīng)濟、電子證據(jù)、云計算;第二個區(qū)域關(guān)鍵詞有智能合約、精準(zhǔn)扶貧、非對稱加密、以太坊、共識機制、去中心化、比特幣、分布式存儲、超級賬本、時間戳;第三個區(qū)域關(guān)鍵詞有高校、會計、財務(wù)管理、圖書館、審計、跨境電商;第四個區(qū)域關(guān)鍵詞有金融科技、互聯(lián)網(wǎng)金融、食品安全、商業(yè)銀行、信息不對稱、物流、農(nóng)產(chǎn)品、供應(yīng)鏈金融、能源互聯(lián)網(wǎng)、金融監(jiān)管、版權(quán)保護、信任機制、區(qū)塊鏈平臺、區(qū)塊鏈金融;第五個區(qū)域關(guān)鍵詞有共享經(jīng)濟、溯源、身份認證、供應(yīng)鏈、數(shù)字資產(chǎn)、訪問控制、工作量證明;第六個區(qū)域關(guān)鍵詞有信息安全、數(shù)據(jù)庫、零知識證明、數(shù)據(jù)共享、聯(lián)盟鏈、物聯(lián)網(wǎng)、隱私保護。
2.4? 結(jié)果分析
在多元統(tǒng)計分析中,聚類分析得到的6大類所屬關(guān)鍵詞,與多維尺度分析得到的6個區(qū)域所屬關(guān)鍵詞基本一致,總結(jié)得出我國區(qū)塊鏈研究熱點主要集中在以下6個方面:
(1)區(qū)塊鏈在人工智能領(lǐng)域的應(yīng)用?!癕atrix鏈”作為新一代區(qū)塊鏈,成功引入人工智能,欲定義“區(qū)塊鏈3.0”。
(2)區(qū)塊鏈的基礎(chǔ)理論研究。區(qū)塊鏈本質(zhì)上是一個分布式賬本數(shù)據(jù)庫,依靠智能合約等邏輯控制功能演變?yōu)橥暾拇鎯ο到y(tǒng)[7],具有去中心化、非對稱加密等特點。
(3)區(qū)塊鏈在圖書館領(lǐng)域的應(yīng)用。區(qū)塊鏈的P2P技術(shù)可以減少圖書流轉(zhuǎn)的中間環(huán)節(jié),提高圖書流轉(zhuǎn)的效率以及擴大知識傳播范圍[8]。
(4)區(qū)塊鏈在金融領(lǐng)域的應(yīng)用。區(qū)塊鏈技術(shù)有助于打破金融壟斷的格局,緩解信息不對稱問題,促進網(wǎng)絡(luò)借貸規(guī)范化,降低金融行業(yè)的交易成本[8]。
(5)區(qū)塊鏈在供應(yīng)鏈領(lǐng)域的應(yīng)用。傳統(tǒng)的供應(yīng)鏈管理存在追溯能力低下,信息透明度低,信息流動不通暢等問題。區(qū)塊鏈技術(shù)具有信息公開透明、安全可靠等特點可以有效解決傳統(tǒng)物流供應(yīng)鏈系統(tǒng)存在的問題。
區(qū)塊鏈在信息安全領(lǐng)域的應(yīng)用。區(qū)塊鏈采用的是分布式存儲,鏈中的每一個節(jié)點都保存了區(qū)塊鏈全部的數(shù)據(jù),如果篡改數(shù)據(jù),需對超過51%的節(jié)點進行改動,保證了信息的安全性和準(zhǔn)確性。
在多維尺度分析圖中,信息安全幾乎位于原點中心位置,說明信息安全是目前國內(nèi)區(qū)塊鏈研究的核心熱點與重點。其次是金融領(lǐng)域,離中心位置很近,并且類別內(nèi)主題詞分布很集中,說明金融領(lǐng)域也是目前區(qū)塊鏈領(lǐng)域的研究熱點,尤其側(cè)重于在供應(yīng)鏈金融和金融監(jiān)管等方向。其次是供應(yīng)鏈領(lǐng)域,離原點位置較近,也是區(qū)塊鏈研究熱點之一。其次是區(qū)塊鏈的基礎(chǔ)理論研究,由于當(dāng)前將區(qū)塊鏈技術(shù)與實際應(yīng)用相結(jié)合以解決實際問題的研究較多,對區(qū)塊鏈的基礎(chǔ)理論研究的關(guān)注度較低。其次是圖書館領(lǐng)域,處于邊緣位置,受到的關(guān)注度較低,尚未引起更多的重視。最后是人工智能領(lǐng)域,受到的關(guān)注度最低,并且類別內(nèi)部主題詞分布很分散,聯(lián)系緊密度很低,有待更進一步的發(fā)展研究。
3? 結(jié)? 論
本文以區(qū)塊鏈研究文獻為基礎(chǔ),以文獻計量和共詞分析為分析視角探討了國內(nèi)區(qū)塊鏈領(lǐng)域的研究現(xiàn)狀以及研究熱點。分析結(jié)果表明,我國區(qū)塊鏈研究的熱點主要集中在區(qū)塊鏈的基礎(chǔ)理論研究、在信息安全領(lǐng)域、金融領(lǐng)域、供應(yīng)鏈領(lǐng)域、圖書館領(lǐng)域以及人工智能領(lǐng)域的應(yīng)用。其中,信息安全領(lǐng)域是當(dāng)前區(qū)塊鏈研究的核心熱點與重點,信息安全領(lǐng)域?qū)^(qū)塊鏈技術(shù)有很強依賴性,在未來時期區(qū)塊鏈在信息安全領(lǐng)域的應(yīng)用和影響會進一步加深。
參考文獻:
[1] 張姣姣,劉云,程旖婕.基于文獻計量學(xué)定律的大數(shù)據(jù)應(yīng)用領(lǐng)域發(fā)展規(guī)律研究 [J].知識管理論壇,2016,1(5):384-392.
[2] 李睿.基于文獻計量和共詞分析的國內(nèi)開放獲取研究熱點探析 [J].圖書館學(xué)刊,2020,42(1):99-105.
[3] 陳寶國,應(yīng)秋陽.基于Citespace的國內(nèi)區(qū)塊鏈研究現(xiàn)狀及熱點分析 [J].經(jīng)濟界,2020(4):14-22.
[4] 韓征征,羅靜.基于共詞分析的國內(nèi)替代計量學(xué)研究 [J].情報探索,2020(9):131-134.
[5] 郭婷,鄭穎.數(shù)據(jù)挖掘在國內(nèi)圖書情報領(lǐng)域的應(yīng)用現(xiàn)狀分析——基于文獻計量分析和共詞分析 [J].情報科學(xué),2015,33(10):91-98.
[6] 黃麗霞,歐燕.我國圖書館讀者薦購領(lǐng)域研究熱點與作者團體研究——基于共詞分析和社會網(wǎng)絡(luò)分析 [J].情報探索,2021(1):120-128.
[7] 張玉,郭會雨,陳建青.我國數(shù)據(jù)挖掘研究現(xiàn)狀分析——基于共詞分析視角 [J].情報科學(xué),2011,29(10):1589-1593.
[8] 潘吉飛,黃德才.區(qū)塊鏈技術(shù)對人工智能的影響 [J].計算機科學(xué),2018,45(11A):53-57+70.
作者簡介:范清清(1995—),女,漢族,河南開封人,碩士研究生在讀,研究方向:情報學(xué);唐毅(1970—),男,漢族,湖南邵陽人,副教授,博士,研究方向:供應(yīng)鏈信息管理。