• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于學(xué)術(shù)博客綜合指數(shù)的用戶識別方法及其實證研究*

      2020-03-09 02:29:22
      圖書情報研究 2020年1期
      關(guān)鍵詞:博文博客權(quán)重

      袁 潤 王 琦

      (江蘇大學(xué)科技信息研究所 鎮(zhèn)江 212013)

      0 引言

      學(xué)術(shù)博客(Academic Blog)是一種非正式的學(xué)術(shù)交流形式,不僅可以幫助科研工作者推廣學(xué)術(shù)成果,提升自身的學(xué)術(shù)影響力,還可以拓寬學(xué)術(shù)社交關(guān)系以促進(jìn)更廣泛的科研合作。呂鑫等[1]根據(jù)“學(xué)術(shù)”和“博客”的定義,認(rèn)為“學(xué)術(shù)博客”是指用于發(fā)布和交流教學(xué)科研和科學(xué)信息的博客。

      在學(xué)術(shù)社交網(wǎng)絡(luò)環(huán)境下,博客利用平臺功能滿足其自身需求,尤其是學(xué)術(shù)需求所表現(xiàn)出的一系列行為統(tǒng)稱為“用戶行為”[2]。用戶行為數(shù)據(jù)是可以獲取的,通過用戶行為數(shù)據(jù)分析,可以研究博客用戶的行為特征和規(guī)律[3-5],對博客用戶進(jìn)行分類、識別和評價[6-8]。

      國內(nèi)外已有不少學(xué)者從不同角度對學(xué)術(shù)博客開展了較為深入的研究。例如,Lim等[9]將那些創(chuàng)作的內(nèi)容能夠?qū)ζ渌脩魩磔^大影響的用戶定義為博客內(nèi)容核心用戶(Content Power Users,CPUs);Akritidis[10]等認(rèn)為博文數(shù)量和質(zhì)量是博客用戶具有高影響力的兩個關(guān)鍵指標(biāo);王曰芬等[11]將學(xué)術(shù)博客核心用戶定義為:學(xué)術(shù)博客環(huán)境下,創(chuàng)作的內(nèi)容對其他用戶具有高影響力并因此能夠為學(xué)術(shù)博客的發(fā)展帶來巨大幫助的用戶;Kiriakopoulos[12]利用網(wǎng)頁排序策略來發(fā)掘重要的博客站點,利用主題的相似性增加隱含邊,使博客空間社會網(wǎng)絡(luò)變得更加稠密,在此基礎(chǔ)上利用HITS和PageRank算法來評估用戶影響力;張曉陽等[13]運(yùn)用文獻(xiàn)計量理論,基于博文及其點擊量構(gòu)建了學(xué)術(shù)博客h指數(shù);盧露等[14]利用博客在某一主題下發(fā)布博文的數(shù)量和質(zhì)量建立了博客影響力評估模型;周春雷[15]提出了鏈接內(nèi)容分析法,建立了衡量一個用戶被其他用戶加為好友或添加“友情鏈接”次數(shù)的“被好友”指標(biāo),以評估用戶影響力;鄭超等[16]將博文的評論次數(shù)納入博客影響力評估模型;曹沖[17]選取博客用戶的發(fā)文數(shù)量、精選博文數(shù)量、好友數(shù)量等指標(biāo)評價用戶影響力;王琛[18]基于用戶行為數(shù)據(jù),利用Delphi法和層次分析法確定指標(biāo)權(quán)重,構(gòu)建了學(xué)術(shù)博客影響力評價模型。概括而言,這類研究的共同特點是構(gòu)建指標(biāo)體系,運(yùn)用主題相似性分析、內(nèi)容分析、用戶行為分析、網(wǎng)絡(luò)分析、計量分析和多指標(biāo)綜合分析等方法對學(xué)術(shù)博客進(jìn)行評估或者評價,尚未發(fā)現(xiàn)利用評價結(jié)果進(jìn)一步識別用戶,尤其是識別網(wǎng)站核心用戶的研究。

      本文以用戶行為數(shù)據(jù)為指標(biāo),采用熵權(quán)法計算其指標(biāo)權(quán)重,并定義這些指標(biāo)的加權(quán)值為博客綜合指數(shù),按照博客綜合指數(shù)的值從大到小倒序排列,在人為給定閾值的基礎(chǔ)上可以識別核心用戶,并以具有代表性的中文類學(xué)術(shù)社交網(wǎng)絡(luò)平臺(科學(xué)網(wǎng)博客)進(jìn)行了實證研究,結(jié)果表明該方法簡單、有效且可靠。

      1 用戶行為數(shù)據(jù)指標(biāo)體系

      博客行為數(shù)據(jù)能直接反應(yīng)博客與博文之間的關(guān)系。博客既可以發(fā)布、轉(zhuǎn)載、分享博文到網(wǎng)絡(luò)上,也可以閱讀、推薦和評論自己感興趣的博文,博客的諸如發(fā)布、閱讀、搜索、發(fā)帖、回帖、推薦、評論、留言、求助、訪問主頁、添加好友等行為,都被網(wǎng)絡(luò)平臺記錄下來形成用戶行為數(shù)據(jù)。平臺利用這些行為數(shù)據(jù)對用戶行為和內(nèi)容進(jìn)行管理,例如審核、精選和推送,為用戶提供開放的、公正的、互動的網(wǎng)絡(luò)社交環(huán)境。為開展本文的研究工作,筆者從科學(xué)網(wǎng)博客獲取了表1所示的用戶行為數(shù)據(jù)。

      表1 科學(xué)網(wǎng)博客用戶行為數(shù)據(jù)項

      按照行為特征,可以將用戶行為分為主動行為和被動行為兩大類,如圖1。在此基礎(chǔ)上,本文從主動行為與被動行為兩個方面構(gòu)建用戶行為數(shù)據(jù)指標(biāo)體系,指標(biāo)體系涵蓋16個數(shù)值型指標(biāo)項。a1~a11為主動行為指標(biāo),可量化用戶主動使用平臺的活躍程度;a12~a16為被動行為數(shù)據(jù)指標(biāo),可量化評價用戶的受關(guān)注度、影響力等。其中,a1屬于用戶基本屬性特征,包含用戶學(xué)歷和職稱兩項屬性數(shù)據(jù),需轉(zhuǎn)化成數(shù)值變量;a2、a10和a11為時間變量,a2指標(biāo)用于描述用戶資歷;a10用于描述用戶時隔多久依在使用博客;a11用于描述用戶時隔多久依為平臺貢獻(xiàn)內(nèi)容,指標(biāo)a2、a10與a11同樣需要轉(zhuǎn)化成數(shù)值變量(天數(shù))。需要說明的是,由于科學(xué)網(wǎng)博客功能設(shè)置原因,部分行為數(shù)據(jù),例如留言、評論內(nèi)容等不易獲取,且設(shè)置了隱私保護(hù)的用戶數(shù)據(jù)無法獲取,上述指標(biāo)且均為正向指標(biāo)。

      圖1 學(xué)術(shù)博客行為數(shù)據(jù)指標(biāo)體系

      2 博客綜合指數(shù)

      本文提出的用戶識別模型的基本思路是按照用戶行為數(shù)據(jù)構(gòu)建若干指標(biāo),再根據(jù)這些指標(biāo)的信息熵計算其權(quán)重,并定義其加權(quán)值為“博客綜合指數(shù)”(Blog Composite Index,簡稱BCSI),最后根據(jù)計算的BCSI值將用戶信息序列倒序排列,將排在前r位的用戶定義為核心用戶[19-20]。

      一般地,用戶信息序列U當(dāng)中有n條記錄和m項指標(biāo),則定義:

      為博客綜合指數(shù),其中αk表示第k項指標(biāo)的歸一化值,ωk為其權(quán)重系數(shù)。將BCSI倒序排列之后,按照公式(2)可以計算得到核心用戶序列的閾值r。

      其中 ,τ=0.618,t=1,2,3,i=1~n。由 t=1 得到的用戶集稱為一區(qū)核心用戶,t=2得到的用戶集稱為二區(qū)核心用戶,t=3時得到的用戶集稱為三區(qū)核心用戶。

      考慮到每項指標(biāo)值域范圍相差很大,所以需要對其作歸一化處理:

      熵權(quán)法計算指標(biāo)權(quán)重系數(shù)的方法如公式(4):

      其中,為第k項指標(biāo)的信息熵,計算方法如公式(5)。

      3 實證研究

      本文應(yīng)用R語言編程技術(shù)開展了實證研究。第一步獲取數(shù)據(jù),生成“博客”和“博文”兩個數(shù)據(jù)集(BlogUsers, BlogContents);第二步統(tǒng)計計算各項指標(biāo)并做歸一化處理;第三步計算各個指標(biāo)的信息熵及其權(quán)重系數(shù)并按學(xué)科分類開展對比研究;第四步計算博客綜合指數(shù)(BCSI)并排序;第五步計算核心用戶序列閾值。

      3.1 數(shù)據(jù)的采集與處理

      在注重用戶隱私保護(hù)的前提下,本文通過Python語言編寫程序采集學(xué)術(shù)博客用戶行為數(shù)據(jù)。采集對象選擇那些擁有精選博文的用戶,采集時間為2018年12月12日,共采集到3 799條不重復(fù)用戶url。在采集博文數(shù)據(jù)之前,對原始url數(shù)據(jù)進(jìn)行簡單的人工處理,剔除146條因設(shè)置隱私權(quán)限等因素造成數(shù)據(jù)缺失的url,博文數(shù)據(jù)項獲取時間為2018年12月19日。

      爬取數(shù)據(jù)過程中構(gòu)建了BlogUsers和BlogContents兩個原始數(shù)據(jù)集。采集完成后對采集到的數(shù)據(jù)進(jìn)行必要的處理:BlogUsers中與博文有關(guān)的數(shù)據(jù)以BlogContents實際獲取數(shù)據(jù)為準(zhǔn),集中統(tǒng)計閱讀總數(shù)、被推薦總數(shù)和被評論總數(shù)等數(shù)據(jù)項;博文數(shù)據(jù)中極端異?;虼罅繑?shù)據(jù)缺失的用戶予以剔除,最終得到2 339位有效用戶數(shù)據(jù)和401 472條博文數(shù)據(jù)。采集到的40萬條博文記錄當(dāng)中,有效評論次數(shù)累計達(dá)到127萬次,有效推薦次數(shù)累計達(dá)到107萬次,總閱讀次數(shù)超過14.29億次,可見科學(xué)網(wǎng)博客具有較大的影響力,對學(xué)術(shù)交流和傳播具有一定意義。

      用戶基本屬性和時間變量需作數(shù)值化處理。①用戶基本屬性(頭銜數(shù)據(jù))需轉(zhuǎn)化成數(shù)值型數(shù)據(jù),未標(biāo)注學(xué)歷或者職稱為最低等級,“院士”“教授” “研究員” “編審”為最高等級,其他用戶依據(jù)實際標(biāo)注情況作等級量化處理;②時間變量轉(zhuǎn)化成數(shù)值型變量,指標(biāo)a2按注冊時長轉(zhuǎn)換成對應(yīng)天數(shù),指標(biāo)a10和a11以最近登錄/發(fā)表時間與注冊時間的間隔將該指標(biāo)轉(zhuǎn)換成對應(yīng)天數(shù)。

      3.2 計算權(quán)重系數(shù)

      根據(jù)公式(3)(4)(5)計算得到的各項指標(biāo)的信息熵和權(quán)重系數(shù)如表2所示。

      表2 各指標(biāo)的信息熵及其權(quán)重系數(shù)

      主動行為指標(biāo)中,a5、a4、a6和a3是反映用戶生成內(nèi)容活躍程度的指標(biāo),權(quán)重系數(shù)排序靠前??茖W(xué)網(wǎng)博客屬于內(nèi)容生成型平臺,作為管理方的科學(xué)網(wǎng)一直鼓勵用戶生成各類內(nèi)容,上述指標(biāo)權(quán)重系數(shù)最大意味著此類指標(biāo)可以更好地將持續(xù)生成內(nèi)容的活躍用戶識別出來。有關(guān)時間維度(a2、a10和a11)權(quán)重最小,且權(quán)重系數(shù)整體小于0.01,對評價結(jié)果貢獻(xiàn)最低。被動行為指標(biāo)中,a12、a16、a15和a14作為量化用戶博文影響力的重要指標(biāo),權(quán)重系數(shù)較大,排序靠前,對評價結(jié)果的貢獻(xiàn)較大。博文是學(xué)術(shù)博客的核心內(nèi)容,對學(xué)術(shù)博客的評估本質(zhì)上是對博客內(nèi)容的評估,上述指標(biāo)增加了評估指標(biāo)體系的合理性。

      為了開展分組比較研究,本文按研究領(lǐng)域分別計算了各項指標(biāo)的權(quán)重系數(shù),結(jié)果如表3所示??茖W(xué)網(wǎng)博客匯集了多個學(xué)科領(lǐng)域的大量科研人員,不同學(xué)科屬性用戶的行為偏好是否存在差異,為討論這些差異的影響,本文在計算全部用戶指標(biāo)權(quán)重系數(shù)的基礎(chǔ)上,按照科學(xué)網(wǎng)博客平臺給定的化學(xué)科學(xué)、工程材料、地球科學(xué)、生命科學(xué)、管理綜合、數(shù)理科學(xué)、醫(yī)學(xué)科學(xué)和信息科學(xué)等8個研究領(lǐng)域分別計算了各個領(lǐng)域的各項指標(biāo)的權(quán)重系數(shù),91個無分類用戶暫不考慮,結(jié)果如表3所示。

      表3 不同研究領(lǐng)域的權(quán)重系數(shù)

      依據(jù)信息熵理論,數(shù)據(jù)離散性越大則權(quán)重越大,某一學(xué)科領(lǐng)域內(nèi),指標(biāo)權(quán)重系數(shù)越大,用戶行為數(shù)據(jù)差異越大,該現(xiàn)象可歸結(jié)為某學(xué)科用戶整體行為偏好特征。在不同研究領(lǐng)域中,同一指標(biāo)不同研究領(lǐng)域權(quán)重系數(shù)不同,則不同研究領(lǐng)域用戶的該項行為偏好特征存在差異。從表2和表3發(fā)現(xiàn),全部用戶指標(biāo)權(quán)重系數(shù)與各個學(xué)科權(quán)重系數(shù)總體趨勢一致,但各個學(xué)科指標(biāo)實際權(quán)重值存在明顯差異。對比各研究領(lǐng)域指標(biāo)權(quán)重系數(shù)TOP3,除了化學(xué)科學(xué)(a5〉a16〉a15),其他學(xué)科指標(biāo)區(qū)分度TOP3均為a4、a5和a6(主動指標(biāo))。各研究領(lǐng)域指標(biāo)權(quán)重系數(shù)TOP3的綜合占比均超過30%,最高達(dá)到40.9%。主動行為指標(biāo)是量化用戶主動使用平臺的積極性指標(biāo),a4、a5和a6項權(quán)重系數(shù)最大,說明大部分學(xué)科用戶這三項指標(biāo)對應(yīng)的行為表現(xiàn)存在較大差異。統(tǒng)計主動行為所有指標(biāo)的權(quán)重系數(shù)和,發(fā)現(xiàn)除化學(xué)科學(xué)(0.57)以外,其他學(xué)科主動行為指標(biāo)項的權(quán)重系數(shù)和均超過了0.6,醫(yī)學(xué)學(xué)科主動行為權(quán)重系數(shù)之和最大與化學(xué)學(xué)科相差0.099。該結(jié)果表明,醫(yī)學(xué)學(xué)科用戶主動行為的偏好特征與其他學(xué)科(尤其是化學(xué)學(xué)科)用戶主動行為的偏好特征存在顯著的差異,其他學(xué)科相比,醫(yī)學(xué)學(xué)科用戶的主動行為數(shù)據(jù)更具離散性。

      3.3 計算博客綜合指數(shù)

      運(yùn)用R語言data.table()包可以方便地實現(xiàn)各項計算。為了驗證用戶識別模型,本文將TOPSIS方法計算結(jié)果整合在同一表中,按BCSI值從大到小排序,結(jié)果如表4所示,其中BP為博客相對接近度(Blog Proximity,簡稱BP)。

      表4 博客綜合指數(shù)TOP30及其排序

      為了進(jìn)一步觀察BCSI值總體分布特征,本文繪制如圖2的小提琴圖,該圖將箱線圖與核密度圖整合在一起,展示分位數(shù)位置的同時也可以展示任意位置的密度,可以較為直觀地呈現(xiàn)BCSI取值分布情況。結(jié)合表4和圖2可以看出,BCSI值存在明顯的區(qū)分度,可以有效區(qū)分用戶。BCSI的值域為[0,1],但最大值小于0.5,只有6位用戶BCSI取值在[0.3,0.5]之間,89.14%用戶的BCSI值分布在[0, 0.0500 1]之間,BCSI存在整體取值水平較低的情況。

      圖2 BCSI取值分布

      經(jīng)過分析,上述現(xiàn)象的出現(xiàn)可主要歸結(jié)為以下三個原因:①依據(jù)熵權(quán)法的特征,如果權(quán)重系數(shù)較大的指標(biāo)(如主題、分享和回帖等指標(biāo)),用戶行為數(shù)據(jù)整體表現(xiàn)不佳可能會造成取值水平偏低。②作為非正式學(xué)術(shù)社交平臺,學(xué)術(shù)博客用戶行為具有較強(qiáng)的隨意性和不確定性。受到用戶偏好和平臺功能設(shè)置的影響,少部分用戶單項指標(biāo)缺失或表現(xiàn)突出,會造成BCSI整體取值水平偏低的情況。③平臺上只有少部分用戶主動行為和被動行為指標(biāo)均表現(xiàn)較好,該類用戶是我們希望識別出來的核心用戶群體,這也意味著大部分用戶主動或被動行為表現(xiàn)一般。上述結(jié)果表明,雖然BCSI總體取值水平偏低,但仍有少部分用戶取值相對較大,因此BCSI可以用來識別博客用戶。

      3.4 計算核心用戶序列閾值

      核心用戶序列閾值r利用R語言編寫代碼計算,結(jié)果是:t=1,r=329; t=2,r=63; t=3,r=15。表示一區(qū)核心用戶329位,二區(qū)核心用戶63位,三區(qū)核心用戶15位。一區(qū)核心用戶中:化學(xué)科學(xué)23位、工程材料34位、地球科學(xué)40位、信息科學(xué)32位、生命科學(xué)57位、管理綜合67位、醫(yī)學(xué)科學(xué)20位、數(shù)理科學(xué)50位、無學(xué)科分類6位,其中地球?qū)W科入選核心用戶占本學(xué)科總?cè)藬?shù)比例最高為22.35%,無學(xué)科分類用戶比例最低為2.97%,入選核心用戶的比例與該學(xué)科人數(shù)無關(guān),但未設(shè)置學(xué)科分類的用戶很少能貢獻(xiàn)較高的BCSI值。閾值的確定可以依據(jù)網(wǎng)站實際需求調(diào)整,BCSI曲線如圖3所示。

      圖3 核心用戶分布圖

      3.5 用戶分組識別

      為了進(jìn)一步分析不同學(xué)科領(lǐng)域用戶主動行為偏好的特征差異對BCSI值和用戶識別結(jié)果的影響,本文依據(jù)各學(xué)科的指標(biāo)權(quán)重系數(shù)分別計算了各學(xué)科的BCSI值,并識別各自領(lǐng)域的核心用戶。各研究領(lǐng)域計算結(jié)果如表5所示,按BCSI值從大到小排序。為了進(jìn)一步觀察BCSI值總體分布特征,繪制各研究領(lǐng)域BCSI值的小提琴圖,如圖4所示。

      圖4 各學(xué)科BCSI分布圖

      從BCSI值的分布情況看,各學(xué)科BCSI值域分布顯著變化,整體取值水平較分類前有所提升,核心用戶與非核心用戶間的區(qū)分度更加明顯。平臺上只有少部分用戶主動行為和被動行為指標(biāo)均表現(xiàn)較好,積累出高BCSI值,但大部分用戶的取值范圍仍在[0,0.05001]之間。這一現(xiàn)象表明分學(xué)科評估與識別用戶能夠取得更好的效果,但整體取值水平仍然偏低。識別出的一區(qū)核心用戶248位,二區(qū)核心用戶54位,三區(qū)核心用戶為19位,識別結(jié)果較分組前有明顯變化。分組識別后入選本領(lǐng)域核心用戶的人數(shù)明顯減少,各個學(xué)科識別出的一區(qū)核心用戶情況:化學(xué)科學(xué)16位、工程材料27位、地球科學(xué)36位、信息科學(xué)27位、生命科學(xué)54位、管理綜合40位、醫(yī)學(xué)科學(xué)18位、數(shù)理科學(xué)30位。地球科學(xué)入選核心用戶的比例最高,達(dá)20.11%,化學(xué)科學(xué)入選比例最低為9.09%。由此可見,各研究領(lǐng)域用戶主動行為偏好的特征差異對BCSI的取值范圍和用戶識別的結(jié)果均產(chǎn)生了顯著的影響。

      表5 不同研究領(lǐng)域TOP5博客綜合指數(shù)及其排序

      4 討論

      對評估和識別結(jié)果的合理性和可靠性驗證一直是相關(guān)研究的難題之一。本文應(yīng)用TOPSIS方法對博客核心用戶識別模型作了驗證,結(jié)果參見表4。兩種方法的排序結(jié)果顯示,Rank(BP)與Rank(BCSI)呈高度正相關(guān)關(guān)系(r=0.891 7),其中一區(qū)重合度為76.9%,二區(qū)核心用戶重合度為84.13%,三區(qū)核心用戶重合度達(dá)到86.7%,具有較為一致的重合度。表明博客綜合指數(shù)能夠反映博客用戶行為特征,可以據(jù)此識別核心用戶。此處重合度只考慮用戶所屬區(qū)間,不考慮排名順序,即不同評價結(jié)果中,同一用戶同屬于一個核心區(qū)域則重合,重合度越高,表明兩種方法識別核心用戶效果越接近。

      為了進(jìn)一步驗證評價結(jié)果的合理性,還需證明被識別出的核心用戶(或創(chuàng)作內(nèi)容)曾經(jīng)得到博客平臺其他用戶的廣泛認(rèn)可??茖W(xué)網(wǎng)博客熱門博文是由讀者推薦產(chǎn)生,受到了其他用戶的廣泛認(rèn)可,熱門博文可以在科學(xué)網(wǎng)博客首頁獲得。全部熱門博文共4 502條,涉及585位用戶。本文以識別出的核心用戶是否有博文是熱門博文為標(biāo)準(zhǔn)進(jìn)一步驗證結(jié)果的合理性。對比發(fā)現(xiàn),上述識別的一區(qū)核心用戶中有63.83%的核心用戶擁有1篇以上的熱門博文;二區(qū)核心用戶中87.3%以上的核心用戶擁熱門博文,其中35人至少擁有10篇以上的熱門博文;三區(qū)核心用戶中93.3%的用戶擁有共計894篇的熱門博文,有8位用戶擁有84篇以上的熱門博文。對比結(jié)果表明,依靠BCSI識別出的核心用戶,大部分曾經(jīng)得到博客平臺其他用戶的廣泛認(rèn)可。

      進(jìn)一步分析三區(qū)核心用戶發(fā)現(xiàn),他們中的大部分人接受過碩士及以上的高等教育,目前在大學(xué)任教。以圖情領(lǐng)域為例,武夷山、趙美娣等用戶更是所在領(lǐng)域的知名學(xué)者。他們在科學(xué)網(wǎng)博客長期活躍,貢獻(xiàn)了許多高質(zhì)量的博文,借助平臺與其他用戶建立好友關(guān)系,有的還進(jìn)一步建立了科研合作關(guān)系,發(fā)表了多篇高質(zhì)量的學(xué)術(shù)論文。部分用戶發(fā)表的博文更是被其他學(xué)者引用到正式的文獻(xiàn)交流中,獲得了廣泛認(rèn)可。筆者利用知網(wǎng)的引文檢索功能,檢索被引文獻(xiàn)來源為“sciencenet”的文獻(xiàn),發(fā)現(xiàn)武夷山、黃安年和陳儒軍等人有多篇博文被引。值得注明的是,部分學(xué)界知名學(xué)者(如施一公,排名267位,為一區(qū)核心用戶)并未進(jìn)入三區(qū)核心,出現(xiàn)這樣的結(jié)果并不影響評估和識別的合理性與可靠性。學(xué)術(shù)博客核心用戶是平臺的活躍用戶,是在一定時期內(nèi)通過創(chuàng)作內(nèi)容對其他用戶具有高影響力且獲得了廣泛的認(rèn)可的用戶。通過觀察施一公博客主頁,該博客自2016年12月10日便停止更新內(nèi)容,這一點已經(jīng)“有?!焙诵挠脩舳x,但是其在使用博客期間貢獻(xiàn)了29篇高影響力博文,至今仍吸引著大量用戶的閱讀、推薦和分享。所以即使停止更新博客兩年,其博客仍然具有較高的影響力。綜上所述,基于BCSI的核心用戶識別的合理性、可靠性得到有效驗證。

      5 結(jié)論

      研究表明,基于學(xué)術(shù)博客行為數(shù)據(jù)構(gòu)建的指標(biāo)體系能夠準(zhǔn)確地表征博客的主要特征,其加權(quán)值定義的博客綜合指數(shù)具有較好的區(qū)分度,據(jù)此可以識別出學(xué)術(shù)博客平臺上的核心用戶。博客綜合指數(shù)概念的理論基礎(chǔ)是多指標(biāo)序列的排序理論。本文運(yùn)用熵權(quán)法計算得到的BCSI序列與理想評價法得到的結(jié)果對比,發(fā)現(xiàn)兩者具有很好的重合度。實證研究表明,科學(xué)網(wǎng)博客BCSI值總體上偏小,反映了學(xué)術(shù)博客行為差異性較大,規(guī)范性不好。分組研究表明,不同學(xué)科用戶行為具有不同的偏好特征。由于本文選取的學(xué)術(shù)博客行為數(shù)據(jù)構(gòu)建的指標(biāo)體系都是正向性指標(biāo),所以依據(jù)BCSI值的大小也可以間接地作為學(xué)術(shù)博客影響力的評價指標(biāo)。

      本文尚存在以下局限。第一,本文只考慮了學(xué)術(shù)博客中具有精選博文這一特征的少數(shù)用戶的使用行為,還有大量用戶沒有精選博文,他們的使用行為未被考慮在內(nèi)。第二,對權(quán)重的賦值只選取了客觀賦值法,缺乏與主觀賦值法的比較分析。第三,具有不同特征的用戶行為可能存在較大的差異,本文僅探討了不同研究領(lǐng)域的用戶行為具有不同的偏好特征,還需從更多視角對用戶進(jìn)行分組研究來證實。以科學(xué)網(wǎng)博客為例,除了可以按學(xué)科領(lǐng)域?qū)τ脩舴纸M,還可以按照性別、工作類型、職稱、學(xué)歷、博文系統(tǒng)分類等條件對用戶進(jìn)行分類研究。

      猜你喜歡
      博文博客權(quán)重
      第一次掙錢
      權(quán)重常思“浮名輕”
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      誰和誰好
      基于公約式權(quán)重的截短線性分組碼盲識別方法
      Review on Tang Wenzhi’s The Gist of Chinese Writing Gamut
      博客天下
      博客天下(2015年2期)2015-09-15 14:12:57
      打電話2
      層次分析法權(quán)重的計算:基于Lingo的數(shù)學(xué)模型
      河南科技(2014年15期)2014-02-27 14:12:51
      博客相冊
      博客天下(2009年12期)2009-08-21 07:35:10
      扬州市| 泊头市| 西吉县| 惠安县| 盐津县| 谷城县| 开鲁县| 五常市| 闵行区| 新和县| 灵丘县| 永泰县| 浏阳市| 余干县| 巫溪县| 花莲县| 新泰市| 屏边| 沙坪坝区| 永定县| 巍山| 四子王旗| 哈巴河县| 洱源县| 吉首市| 宣恩县| 两当县| 肇东市| 上蔡县| 枣强县| 巴南区| 游戏| 惠东县| 江西省| 乌鲁木齐县| 珲春市| 祥云县| 齐河县| 腾冲县| 万宁市| 灵川县|