• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      時(shí)間加權(quán)的h指數(shù)研究

      2018-11-14 03:24:36鄭州大學(xué)信息管理學(xué)院中國(guó)人民解放軍炮兵學(xué)院軍事運(yùn)籌教研室
      圖書館理論與實(shí)踐 2018年10期
      關(guān)鍵詞:情形時(shí)段影響力

      郭 強(qiáng),趙 瑾(.鄭州大學(xué)信息管理學(xué)院;.中國(guó)人民解放軍炮兵學(xué)院軍事運(yùn)籌教研室)

      1 直觀認(rèn)識(shí)

      h指數(shù)與作者的影響力具有較好的相關(guān)性,所以能夠利用h指數(shù)來(lái)對(duì)作者的影響力進(jìn)行衡量。[1]需要指出的是,由于傳統(tǒng)的h指數(shù)是一個(gè)累積量,某一領(lǐng)域過(guò)去的高影響力作者和現(xiàn)在的高影響力作者會(huì)具有相同的h指數(shù),這樣需要將這兩種情形區(qū)分開來(lái),特別是能否只通過(guò)h指數(shù)來(lái)對(duì)這兩種類型的作者進(jìn)行識(shí)別。在這里構(gòu)造這樣的h指數(shù),使其具有對(duì)距離考察時(shí)間越近的作者影響力越注重的性質(zhì),或者說(shuō)對(duì)作者越近期的影響力越注重,而對(duì)于遠(yuǎn)期的作者影響力的重視程度相對(duì)較弱,那么該指數(shù)從直觀上應(yīng)當(dāng)具有以下性質(zhì)。① 當(dāng)作者較近期的影響力較高、中遠(yuǎn)期的影響力較低時(shí),作者影響力的衡量值會(huì)較高,或者構(gòu)造的h指數(shù)應(yīng)當(dāng)較高。② 當(dāng)作者相對(duì)中遠(yuǎn)期的影響力較高、相對(duì)近期的影響力較低時(shí),那么構(gòu)造的h指數(shù)應(yīng)當(dāng)不會(huì)較高。③ 在對(duì)作者越近期的影響力越注重的h指數(shù)中,注重的程度應(yīng)當(dāng)可以變化,由于該h指數(shù)對(duì)作者越近期的影響力越注重,所以對(duì)作者近期的影響力的重視程度比對(duì)作者中遠(yuǎn)期的影響力的重視程度要高,同時(shí)注重程度越大,這種重視程度上的差異也越大,當(dāng)注重程度逐漸減小時(shí),對(duì)近期和中遠(yuǎn)期的重視程度的差異會(huì)逐漸減小。特別是隨著注重程度的逐漸減小,如果把對(duì)各個(gè)時(shí)期的作者影響力的重視程度進(jìn)行加總,那么對(duì)中遠(yuǎn)期作者影響力的重視程度在總的重視程度中所占的比例會(huì)逐漸增加,所以作者在中遠(yuǎn)期的影響力的作用與作者在近期的影響力相比,會(huì)逐漸增加,進(jìn)一步地,如果使總的重視程度保持不變,那么該h指數(shù)對(duì)中遠(yuǎn)期作者影響力的重視程度會(huì)逐漸增加。④ 當(dāng)注重程度等于0時(shí),對(duì)各個(gè)時(shí)期作者影響力的重視程度相同,這是指對(duì)應(yīng)于傳統(tǒng)h指數(shù)的性質(zhì)。

      在具體構(gòu)造對(duì)作者越近期的影響力越注重的h指數(shù)時(shí),將使得不同的時(shí)段具有不同的權(quán)重,同時(shí)權(quán)重之和保持不變,并且權(quán)重是注重近期的。其中,注重近期不是指注重距離考察時(shí)間較近的某個(gè)時(shí)間點(diǎn),而是距離考察時(shí)間越近越重視,因此,距離考察時(shí)間越近的時(shí)刻或時(shí)間段被賦予更高的權(quán)重。由于權(quán)重對(duì)作者越近期的時(shí)段越注重,對(duì)近期時(shí)段的重視程度比對(duì)中遠(yuǎn)期時(shí)段的重視程度要高,同時(shí)注重程度越大,這種重視程度上的差異也越大,當(dāng)注重程度減小時(shí),對(duì)近期和中遠(yuǎn)期的重視程度上的差異也減小,將權(quán)重對(duì)近期的注重程度記為a。進(jìn)一步地,將作者論文的被引次數(shù)按照各個(gè)時(shí)段的權(quán)重加權(quán)求和并降序排列,按照傳統(tǒng)h指數(shù)的方法可以構(gòu)造相應(yīng)的h指數(shù),將該指數(shù)定義為注重作者近期影響力的h指數(shù)。從直觀上考察,由此構(gòu)造的注重作者近期影響力的h指數(shù),具有上述對(duì)作者越近期的影響力越注重的h指數(shù)應(yīng)當(dāng)具有的四個(gè)性質(zhì)。

      (1)當(dāng)作者比較近期的影響力較高、中遠(yuǎn)期的影響力較低時(shí),假設(shè)作者較近期的論文數(shù)較多,同時(shí)每篇論文的被引次數(shù)也較高,那么作者在近期的影響力較高。由于文章的被引次數(shù)會(huì)處于不同的時(shí)間段,這樣對(duì)于該作者而言,將其每篇文章的被引次數(shù)分別進(jìn)行加權(quán)求和后,按照得到的和值降序排列,那么發(fā)表時(shí)間和考察時(shí)間相對(duì)較近的文章,其被引次數(shù)也處于距離考察時(shí)間較近的時(shí)段,所以具有較高的權(quán)重,那么這些文章對(duì)應(yīng)的和值會(huì)較高。因此,在求h指數(shù)時(shí),由于作者在比較近期發(fā)表的文章數(shù)量較多,同時(shí)這些文章的被引次數(shù)較高,那么得到的h指數(shù)也會(huì)較高。

      (2)當(dāng)作者相對(duì)遠(yuǎn)期的影響力較高、相對(duì)近期的影響力較低時(shí),假設(shè)作者較遠(yuǎn)期的時(shí)候發(fā)表的文章數(shù)量較多,在假設(shè)被引半衰期為5年的情況下,每篇文章獲得的被引次數(shù)會(huì)處于距離考察時(shí)間較遠(yuǎn)的時(shí)段,所以都具有較小的權(quán)重,那么這些文章對(duì)應(yīng)的被引次數(shù)的加權(quán)和值會(huì)較小。因此,盡管作者較遠(yuǎn)期的文章數(shù)量以及每篇文章的被引次數(shù)均較多,得到的h指數(shù)也是偏低的。對(duì)于作者較中期時(shí)段的影響力較高、在其余時(shí)段的影響力較低的情形,仍然假設(shè)作者發(fā)表的文章數(shù)量較多,并且作者較中期時(shí)段得到的被引次數(shù)較多,或者說(shuō)作者的論文較中期的時(shí)段得到的被引次數(shù)會(huì)較多,對(duì)于每篇論文而言,如果中期的被引次數(shù)較多,其余時(shí)段的被引次數(shù)較少,那么論文的被引次數(shù)的加權(quán)和值不會(huì)偏高。如果中期的被引次數(shù)與其余時(shí)段的被引次數(shù)均不多,那么被引次數(shù)的加權(quán)和值也不會(huì)偏高。此外,也存在中期被引次數(shù)較少,近期被引次數(shù)較高的情形,但是這種情形會(huì)相對(duì)較少,否則作者在近期的被引次數(shù)會(huì)相對(duì)較高,這樣盡管該篇論文的被引次數(shù)的加權(quán)和值會(huì)相對(duì)較高,但是由于這類論文的數(shù)量相對(duì)較少,對(duì)于h指數(shù)的影響或者決定作用并不高,這樣得到的h指數(shù)仍然是中等的。只有當(dāng)作者發(fā)表的文章數(shù)量較多,并且作者在近期的被引次數(shù)較高時(shí),得到的h指數(shù)才是較高的。上述在第一種性質(zhì)中所討論的情形符合這種要求。同樣,對(duì)于作者發(fā)表的文章數(shù)量較多且作者在遠(yuǎn)期的被引次數(shù)較多時(shí),得到的h指數(shù)是偏低的,在對(duì)第二種性質(zhì)的考察中,當(dāng)作者遠(yuǎn)期的影響力較高且近期的影響力較低時(shí),所討論的情形也符合這種要求。

      (3)可以通過(guò)改變權(quán)重對(duì)近期時(shí)段的注重程度a來(lái)改變得到的h指數(shù)對(duì)近期的注重程度。如,當(dāng)a減小時(shí),盡管中遠(yuǎn)期時(shí)段的權(quán)重低于近期時(shí)段的權(quán)重,但是兩者的差異會(huì)減小。如果對(duì)各個(gè)時(shí)段的權(quán)重進(jìn)行求和,那么中遠(yuǎn)期時(shí)段的權(quán)重占權(quán)重之和的比例會(huì)增加,與近期時(shí)段的權(quán)重相比,中遠(yuǎn)期時(shí)段的權(quán)重的作用會(huì)增加。如果使權(quán)重之和保持不變,那么中遠(yuǎn)期時(shí)段的權(quán)重會(huì)增加,當(dāng)作者中遠(yuǎn)期的影響力較高、近期的影響力較低時(shí),假設(shè)作者發(fā)表的文章數(shù)量較多,并且作者中遠(yuǎn)期得到的被引次數(shù)較高,近期的被引次數(shù)較低,對(duì)于每篇論文而言,由于當(dāng)中遠(yuǎn)期時(shí)段的權(quán)重增加時(shí),近期時(shí)段的權(quán)重會(huì)減小。由此,每篇論文的被引次數(shù)的加權(quán)和值會(huì)增加,由于論文的數(shù)量是較多的,得到的h指數(shù)也會(huì)增加。作者中遠(yuǎn)期的影響力較高、近期的影響力較低,說(shuō)明此時(shí)h指數(shù)對(duì)中遠(yuǎn)期影響力的重視程度增加,對(duì)近期影響力的重視程度減小,所以h指數(shù)對(duì)近期影響力與中遠(yuǎn)期影響力的重視程度的差異會(huì)減小,這樣h指數(shù)對(duì)近期影響力的注重程度會(huì)減小。同理當(dāng)a增加時(shí),如果使權(quán)重之和保持不變,那么中遠(yuǎn)期時(shí)段的權(quán)重會(huì)減小,仍然考察作者中遠(yuǎn)期的影響力較高、近期影響力較低的情形,當(dāng)中遠(yuǎn)期時(shí)段的權(quán)重減小時(shí),每篇論文的被引次數(shù)的加權(quán)和值在總體上會(huì)減小,得到的h指數(shù)也會(huì)減小,說(shuō)明此時(shí)h指數(shù)對(duì)中遠(yuǎn)期影響力的重視程度減小,對(duì)近期影響力的重視程度增加,所以h指數(shù)對(duì)近期影響力與中遠(yuǎn)期影響力的重視程度的差異會(huì)增加,這樣h指數(shù)對(duì)近期影響力的注重程度會(huì)增加。由此,可以利用權(quán)重對(duì)近期的注重程度a,來(lái)對(duì)構(gòu)造的h指數(shù)對(duì)近期的注重程度進(jìn)行表征。

      (4)當(dāng)a=0時(shí),各個(gè)時(shí)段的權(quán)重相等,由此得到的h指數(shù)對(duì)應(yīng)于傳統(tǒng)的h指數(shù),對(duì)各個(gè)時(shí)段的作者影響力具有相同的重視程度。如,對(duì)于作者中遠(yuǎn)期的影響力較高、近期影響力較低的情形,仍然假設(shè)作者的文章數(shù)量較多,并且作者中遠(yuǎn)期得到的被引次數(shù)也較多;對(duì)于作者近期的影響力較高、中遠(yuǎn)期影響力較低的情形,相類似地,也假設(shè)作者近期得到的被引次數(shù)較多,那么兩種情形下得到的h指數(shù)會(huì)是近似相等的,說(shuō)明得到的h指數(shù)對(duì)中遠(yuǎn)期以及近期的作者影響力的重視程度是相同的。這樣從直觀上,構(gòu)造得到的h指數(shù)能夠具有注重作者近期影響力的h指數(shù)應(yīng)當(dāng)具有的性質(zhì),如果這些性質(zhì)對(duì)于注重作者近期影響力的h指數(shù)的描述是全面的,那么可以認(rèn)為得到的h指數(shù)是一種注重作者近期影響力的h指數(shù),并且可以利用在確定各個(gè)時(shí)段的權(quán)重時(shí)對(duì)近期的注重程度a來(lái)調(diào)節(jié)得到的h指數(shù)對(duì)近期影響力的注重程度。

      需要指出,在上述的直觀認(rèn)識(shí)中只是選取了某些特例來(lái)進(jìn)行說(shuō)明,需要對(duì)該指數(shù)的合理性與有效性進(jìn)行進(jìn)一步檢驗(yàn);在上述討論中均假設(shè)作者的文章數(shù)較多,這和傳統(tǒng)h指數(shù)的性質(zhì)是一樣的,否則如果作者的文章數(shù)量較少,盡管作者的影響力較高,但是利用h指數(shù)來(lái)對(duì)作者的影響力進(jìn)行表征時(shí),h指數(shù)是偏低的;另外,在上述討論中,得到的h指數(shù)的取值是相對(duì)意義上的高或者低,是在得到的所有h指數(shù)的取值范圍中的相對(duì)大小,這和傳統(tǒng)h指數(shù)的取值大小相一致,也是在所有傳統(tǒng)h指數(shù)取值中的相對(duì)大小。

      對(duì)于作者在中期時(shí)段的影響力較高、在其余時(shí)段影響力較低的情形,從根本上是由于對(duì)中期時(shí)段賦予的權(quán)重是中等的,這樣得到的h指數(shù)會(huì)是中等的。另外,當(dāng)a減小時(shí),中遠(yuǎn)期時(shí)段與近期時(shí)段的權(quán)重差異會(huì)減小,中遠(yuǎn)期時(shí)段權(quán)重占權(quán)重總和的比例會(huì)增加,當(dāng)權(quán)重總和保持不變時(shí),中遠(yuǎn)期時(shí)段的權(quán)重會(huì)增加,而近期時(shí)段的權(quán)重會(huì)減小,以至于當(dāng)a=0時(shí),近期時(shí)段的權(quán)重與中遠(yuǎn)期時(shí)段的權(quán)重會(huì)相等。在這個(gè)過(guò)程中,如果在權(quán)重的構(gòu)造方式中,在保持權(quán)重總和不變的同時(shí),使得中期時(shí)段的權(quán)重近似保持不變,那么當(dāng)a=0時(shí),由于近期時(shí)段的權(quán)重與中期時(shí)段的權(quán)重相同,此時(shí)近期時(shí)段的權(quán)重也會(huì)是中等的。其中,權(quán)重取值為中等時(shí),仍然是相對(duì)意義上的中等,當(dāng)a任意取值時(shí),在各個(gè)時(shí)段權(quán)重的所有取值中的相對(duì)大小,這樣對(duì)于作者在近期的影響力較高、在中遠(yuǎn)期影響力較低的情形,由于此時(shí)對(duì)各個(gè)時(shí)段的重視程度相同,并且近期時(shí)段的權(quán)重是中等的,那么得到的h指數(shù)也會(huì)是中等的,而這時(shí)的h指數(shù)對(duì)應(yīng)于傳統(tǒng)的h指數(shù)。但是,如果能夠認(rèn)為當(dāng)a=0時(shí),這里構(gòu)造得到的h指數(shù)會(huì)轉(zhuǎn)化成為傳統(tǒng)的h指數(shù),那么對(duì)于作者在近期影響力較高、在中遠(yuǎn)期影響力較低的情形,傳統(tǒng)的h指數(shù)的取值應(yīng)當(dāng)是較高的,而此時(shí)得到的h指數(shù)卻是中等的。由此,從直觀上需要指出這是文中構(gòu)造得到的h指數(shù)的缺陷,從根本上是由于對(duì)各個(gè)時(shí)段進(jìn)行加權(quán)的方式造成的,如,使得各個(gè)時(shí)段的權(quán)重之和保持不變,但是從直觀上,使得各個(gè)時(shí)段的權(quán)重之和保持不變應(yīng)當(dāng)具有必要性,目的是為了保證當(dāng)a變化時(shí)得到的h指數(shù)仍然具有可比性。

      2 權(quán)重的確定

      在對(duì)各個(gè)時(shí)段的權(quán)重進(jìn)行具體確定時(shí),可以對(duì)各個(gè)時(shí)段的重要性分別進(jìn)行比較,由此建立關(guān)于重視程度的判斷矩陣。[2]在通過(guò)一致性檢驗(yàn)的基礎(chǔ)上,各個(gè)時(shí)段的權(quán)重為判斷矩陣的最大特征值所對(duì)應(yīng)的特征向量,為了滿足對(duì)作者近期影響力注重的要求,越近的時(shí)段應(yīng)當(dāng)被賦予更高的權(quán)重。同時(shí)如果提高對(duì)近期的注重程度,那么近期時(shí)段的權(quán)重與中遠(yuǎn)期時(shí)段的權(quán)重的差異應(yīng)當(dāng)增加,反之權(quán)重的差異應(yīng)當(dāng)減小,這些均可以通過(guò)在判斷矩陣中對(duì)相鄰時(shí)段賦予不同的重要性以及調(diào)整重要性之間的差異來(lái)體現(xiàn)。假設(shè)將考察的時(shí)間范圍劃分為5個(gè)時(shí)段,其中劃分的時(shí)段數(shù)可以任意選取,當(dāng)對(duì)近期的注重程度較低時(shí),使得判斷矩陣右上部的元素均小于1,對(duì)于矩陣右上部的同一行中的任意兩個(gè)相鄰元素,使得左側(cè)元素大于等于右側(cè)元素;對(duì)于同一列中的相鄰元素,使得上方元素小于等于下方元素,從而判斷矩陣具有較好的一致性,這樣得到的權(quán)重也能夠更好地體現(xiàn)上述對(duì)作者近期影響力的注重要求,在此基礎(chǔ)上使得矩陣元素在整體上取1/2到1/9之間較大的數(shù)值(見圖1)。

      圖1 判斷矩陣的建立

      在圖1中,左邊矩陣的最大特征值所對(duì)應(yīng)的特征向量為(0.3058,0.5149,0.8168,1.2799,2.0826),最大特征值為5.3906,并且一致性比率為0.0872,能夠通過(guò)一致性檢驗(yàn),取該特征向量的分量為各個(gè)時(shí)段的權(quán)重。需要指出,只按照上述對(duì)元素取值的要求來(lái)建立判斷矩陣時(shí),未必能夠通過(guò)一致性檢驗(yàn),如果不能通過(guò),還需要對(duì)元素的取值進(jìn)行調(diào)整,而同時(shí)滿足上述對(duì)元素取值的要求,以及使得判斷矩陣能夠通過(guò)一致性檢驗(yàn)的取值調(diào)整空間從直觀上是存在的。另外,正是因?yàn)闈M足這種重視程度之間的一致性,對(duì)元素取值的上述要求或者是對(duì)作者近期影響力注重的要求才能實(shí)現(xiàn),否則得到的權(quán)重未必能夠具有越近期越重視的性質(zhì)。如,為了體現(xiàn)權(quán)重對(duì)近期時(shí)段的注重,必須要使判斷矩陣右上部分的元素都小于1,但是按照上述的取值要求,矩陣中a21×a15有可能大于1,這樣與a25<1就不一致。那么,由該判斷矩陣得到的權(quán)重既體現(xiàn)了這種不一致也體現(xiàn)了a25<1這兩種性質(zhì),甚至如果這種不一致程度較高,那么就未必能夠有效地體現(xiàn)a25<1,所以滿足一致性檢驗(yàn)時(shí)得到的權(quán)重才是滿足對(duì)作者近期影響力注重的要求的權(quán)重。相類似地,當(dāng)對(duì)近期的注重程度較高時(shí),使矩陣元素在整體上取1/2到1/9之間較小的數(shù)值,如圖1中右邊的判斷矩陣,此時(shí)矩陣最大的特征值所對(duì)應(yīng)的特征向量為(0.1727,0.4262,0.7764,1.3103,2.3144),最大的特征值為5.3290,并且一致性比率為0.0734,能夠通過(guò)一致性檢驗(yàn),在建立判斷矩陣時(shí)也需要在滿足上述取值要求的同時(shí)對(duì)判斷矩陣的元素進(jìn)行調(diào)整,以使判斷矩陣能夠通過(guò)一致性檢驗(yàn),否則由該判斷矩陣得到的權(quán)重未必能夠滿足對(duì)近期時(shí)段作者影響力注重程度增加的要求。而在實(shí)際取值時(shí),滿足上述取值要求并使判斷矩陣能夠通過(guò)假設(shè)檢驗(yàn)的調(diào)整空間也是存在的。可以對(duì)圖1中右邊矩陣的第一行進(jìn)行取值,使得最遠(yuǎn)時(shí)段與其余各個(gè)時(shí)段的相對(duì)重要性能夠滿足注重近期時(shí)段且注重程度較高的要求,對(duì)其余行進(jìn)行取值時(shí),使取值與第一行取值所表示的相對(duì)重要性不相沖突,從而使判斷矩陣能夠滿足一致性要求。經(jīng)過(guò)初步檢驗(yàn),這種取值是存在且不唯一的,由此得到的權(quán)重才是滿足注重要求的權(quán)重。

      能夠注意到,由圖1右邊矩陣得到的權(quán)重對(duì)近期時(shí)段會(huì)更為注重,如,對(duì)于任意兩個(gè)時(shí)段而言,較近時(shí)段與較遠(yuǎn)時(shí)段之間的權(quán)重差異均會(huì)更高。需要指出,為了保證得到的h指數(shù)之間具有可比性,需要使考察的時(shí)間范圍相同,同時(shí)還需要將考察的時(shí)間范圍劃分為相同的時(shí)段,這樣得到的權(quán)重也才會(huì)具有可比性。

      另外,當(dāng)注重程度等于零時(shí),各個(gè)時(shí)段具有相同的權(quán)重,由于要使構(gòu)造得到的h指數(shù)能夠轉(zhuǎn)化為傳統(tǒng)的h指數(shù),要求各個(gè)時(shí)段的權(quán)重相等且等于1。同時(shí),為了保證得到的h指數(shù)具有可比性,需要使各個(gè)時(shí)段的權(quán)重之和保持不變,這樣當(dāng)分段數(shù)為5時(shí),各個(gè)時(shí)段的權(quán)重之和均應(yīng)等于5,這也是圖1中兩個(gè)判斷矩陣的特征向量沒有取為分量之和等于1的原因。

      由此,可以利用判斷矩陣來(lái)對(duì)權(quán)重進(jìn)行確定,其優(yōu)點(diǎn)是在賦予各個(gè)時(shí)段的權(quán)重時(shí)可以較為靈活,但是由于當(dāng)對(duì)象較多時(shí)會(huì)對(duì)相互之間的相對(duì)重要性判斷帶來(lái)影響,采取這種方法時(shí)對(duì)時(shí)段數(shù)量的要求較高。同時(shí),由于在賦予各時(shí)段權(quán)重后,如需要調(diào)整注重程度,需重新建立判斷矩陣,由此來(lái)重新賦予各個(gè)時(shí)段的權(quán)重,除了計(jì)算量可能較大之外,也不一定能夠保證注重程度能夠連續(xù)變化。因此,在確定權(quán)重時(shí)還可以嘗試建立某類關(guān)于注重程度的函數(shù),使注重程度作為某種響應(yīng)變量,當(dāng)該函數(shù)的參量以及函數(shù)自身連續(xù)變化時(shí),注重程度也能夠連續(xù)變化,這樣不僅在確定權(quán)重時(shí)計(jì)算量會(huì)減小,而且能夠使注重程度連續(xù)變化。特別地,在建立函數(shù)時(shí)可以使注重程度在-1到1這個(gè)區(qū)間內(nèi)連續(xù)變化,取值越大,注重程度越高,而當(dāng)注重程度的取值為負(fù)數(shù)時(shí),表示對(duì)遠(yuǎn)期的作者影響力更為重視,當(dāng)取值為零時(shí),表示對(duì)各個(gè)時(shí)段的注重程度相同。除此之外,在利用判斷矩陣來(lái)確定權(quán)重時(shí),能夠按照注重要求來(lái)大致調(diào)節(jié)對(duì)近期的注重程度,如在圖1中左側(cè)矩陣對(duì)近期的注重程度會(huì)弱于右側(cè)矩陣,但是如果需要準(zhǔn)確知道此時(shí)注重程度的大小與差異,還需要給出相應(yīng)的衡量方式。由此,確定權(quán)重時(shí)使注重程度能夠連續(xù)變化會(huì)具有一定的優(yōu)勢(shì),能夠建立相應(yīng)的權(quán)函數(shù)(見圖2)。

      圖2 注重程度連續(xù)變化時(shí)的權(quán)重確定

      在圖2中,橫軸為劃分的各個(gè)時(shí)間段的序號(hào),分別為第0時(shí)段至第n時(shí)段,縱軸為各個(gè)時(shí)段的權(quán)重,權(quán)函數(shù)為y=2ax/n+1-a,其中a的取值范圍為-1到1,圖中斜率為負(fù)數(shù)的直線段對(duì)應(yīng)于a=-1時(shí)的情形。這時(shí)近期時(shí)段的權(quán)重小于遠(yuǎn)期時(shí)段的權(quán)重,并且遠(yuǎn)期時(shí)段與近期時(shí)段的權(quán)重差異也是最大的,說(shuō)明此時(shí)對(duì)遠(yuǎn)期的重視程度是要高于對(duì)近期的重視程度,并且對(duì)遠(yuǎn)期的注重程度也是最高的,其中的注重遠(yuǎn)期意味著對(duì)距離考察時(shí)間或者第n時(shí)段越遠(yuǎn)的時(shí)段會(huì)越重視。隨著斜率絕對(duì)值的減小,由于遠(yuǎn)期時(shí)段的權(quán)重仍然高于近期時(shí)段的權(quán)重,并且遠(yuǎn)期時(shí)段與近期時(shí)段的權(quán)重差異會(huì)減小,因此對(duì)遠(yuǎn)期的注重程度會(huì)逐漸減小。當(dāng)斜率等于零時(shí),a=0,此時(shí)各個(gè)時(shí)段具有相同的權(quán)重且等于1;當(dāng)斜率為正數(shù)時(shí),a>0,這時(shí)近期時(shí)段的權(quán)重大于遠(yuǎn)期時(shí)段的權(quán)重,說(shuō)明此時(shí)的權(quán)重是注重近期的,并且隨著斜率的增加,近期與遠(yuǎn)期時(shí)段的權(quán)重差異也會(huì)增加,由此,權(quán)重對(duì)近期的注重程度也會(huì)增加。圖中斜率為正數(shù)的直線段為a=1時(shí)的情形,這時(shí)對(duì)近期的注重程度達(dá)到最大。在圖2中,當(dāng)直線段的斜率或者a連續(xù)變化時(shí),權(quán)重對(duì)近期的注重程度也會(huì)連續(xù)變化,可以利用a來(lái)表征對(duì)作者近期影響力的注重程度:當(dāng)a>0時(shí),權(quán)重是注重近期的,并且a越大,對(duì)近期的注重程度越高;當(dāng)a<0時(shí),權(quán)重對(duì)遠(yuǎn)期注重,并且a的絕對(duì)值越大,注重程度越高;而當(dāng)a=0時(shí),權(quán)重對(duì)近期或遠(yuǎn)期的注重程度均等于零。

      另外,需要使各個(gè)時(shí)段的權(quán)重之和保持不變,這樣當(dāng)a固定時(shí),每篇論文的被引次數(shù)的加權(quán)和值是建立在相同的權(quán)重基礎(chǔ)上。由此,對(duì)于同一作者以及不同作者而言,得到的h指數(shù)會(huì)具有可比性。同時(shí),當(dāng)a變化時(shí),由于權(quán)重之和維持不變,只是各個(gè)時(shí)段的相對(duì)重視程度會(huì)發(fā)生改變,這樣每篇論文的被引次數(shù)的加權(quán)和值以及得到的h指數(shù)在數(shù)量上仍然會(huì)有可比性。在圖2中,各個(gè)時(shí)段的權(quán)重之和為2a(1+2+...+n) /n+(n+1)-a(n+1)=n+1,因此,權(quán)重之和與 a無(wú)關(guān)。同樣地,為了使a=0時(shí)得到的h指數(shù)能夠轉(zhuǎn)化為傳統(tǒng)的h指數(shù),當(dāng)a=0時(shí)需要使各個(gè)時(shí)段的權(quán)重相等且等于1,因此,文中將權(quán)重之和取為n+1。

      3 合理性檢驗(yàn)

      在確定各個(gè)時(shí)段的權(quán)重之后,利用傳統(tǒng)h指數(shù)的定義可以構(gòu)造出對(duì)作者近期影響力注重的h指數(shù),并進(jìn)行合理性檢驗(yàn)以及實(shí)證分析。如,當(dāng)注重程度較高時(shí),某一領(lǐng)域近期的代表作者的h指數(shù)的排序會(huì)相對(duì)靠前;當(dāng)注重程度較低時(shí),該領(lǐng)域的奠基性作者的h指數(shù)的排序會(huì)相對(duì)靠前,這樣只利用h指數(shù)就可以對(duì)兩類作者進(jìn)行識(shí)別。

      在知網(wǎng)中可以得到每位作者的每篇論文的被引次數(shù)以及這些被引次數(shù)的施引年份,由此可以得到每位作者總的被引次數(shù)以及這些被引次數(shù)的年代分布,利用每篇論文的發(fā)表時(shí)間,也可以得到每位作者發(fā)表的總的論文數(shù)以及這些論文的年代分布。同時(shí),由于為了明確不同時(shí)期的代表作者,文中只是選取了被引次數(shù)相對(duì)較高的作者作為考察對(duì)象,其中數(shù)據(jù)的獲取時(shí)間為2018年1月,考察的領(lǐng)域?yàn)橹袊?guó)知網(wǎng)中的圖書館學(xué)及圖書館事業(yè)這個(gè)分類。

      在作者被引次數(shù)的年代分布中,由于選取的對(duì)象為被引次數(shù)相對(duì)較高的作者,這些作者的影響力也會(huì)相對(duì)較高,當(dāng)被引次數(shù)的年代分布在足夠長(zhǎng)的考察時(shí)間范圍內(nèi)可以近似為單峰的情形下,能夠假設(shè)被引次數(shù)最高的年份是作者具有較高影響力的年份,由此能夠近似得到每位作者影響力較高的年份(見圖3)。當(dāng)被引次數(shù)較高時(shí),作者在該年度的影響力也會(huì)較高,而文中只是選取了最大年度被引次數(shù)來(lái)大致確定作者影響力較高的時(shí)間范圍。對(duì)于在近期時(shí)段影響力較高的作者,由于作者在近期時(shí)段得到被引次數(shù)較多,被引次數(shù)的年代分布未必能夠近似為單峰,但是在該情形下最大年度被引次數(shù)通常會(huì)出現(xiàn)在近期時(shí)段,所以在這里仍然利用最大年度被引次數(shù)來(lái)對(duì)作者影響力較高的時(shí)間范圍進(jìn)行大致確定。另外,在此過(guò)程中,如果作者在多個(gè)年度的被引次數(shù)均為最大年度被引次數(shù),可以任意選取其中某個(gè)年份來(lái)近似確定作者具有高影響力的時(shí)間范圍。

      圖3 每位作者被引次數(shù)最高的年份

      在圖3中,縱軸為在某個(gè)年度被引次數(shù)取為最大年度被引次數(shù)的作者的數(shù)量,在此基礎(chǔ)上可以對(duì)考察的時(shí)間范圍進(jìn)行分區(qū),分區(qū)的數(shù)量以及每個(gè)區(qū)間的長(zhǎng)度可以任意選取。文中將橫軸劃分為圖中的5個(gè)時(shí)段,其中最遠(yuǎn)的時(shí)段為2001年及其之前的時(shí)間范圍,這樣的劃分能夠使得在求每篇論文的被引次數(shù)的加權(quán)求和時(shí),所需的權(quán)重均能夠構(gòu)造得到。在這里得到的h指數(shù)是截至2017年的作者的h指數(shù),這和截止到某年度的傳統(tǒng)的h指數(shù)也是相同的。同時(shí),在這種分區(qū)的基礎(chǔ)上也可以探討當(dāng)對(duì)作者近期影響力的注重程度發(fā)生變化時(shí)的每位作者的排序情況,由此來(lái)檢驗(yàn)得到的h指數(shù)的合理性,另外考察的時(shí)間范圍以及相應(yīng)的分區(qū)需要保持不變,這樣當(dāng)對(duì)近期的注重程度發(fā)生變化時(shí),確定的權(quán)重以及得到的h指數(shù)在數(shù)量上會(huì)具有可比性。

      取權(quán)重對(duì)近期的注重程度a=0.8,由于可以利用權(quán)重對(duì)作者近期影響力的注重程度來(lái)對(duì)得到的h指數(shù)對(duì)其進(jìn)行表征,此時(shí)得到的h指數(shù)對(duì)近期的注重程度應(yīng)當(dāng)是相對(duì)較高的。如果利用注重程度連續(xù)變化時(shí)的情形來(lái)對(duì)權(quán)重進(jìn)行確定,那么各個(gè)時(shí)段的權(quán)重分別為0.2,0.6,1,1.4,1.8,其中n等于4,那么在此基礎(chǔ)上根據(jù)作者每篇論文的被引次數(shù)及其年代分布可以得到h指數(shù)(見圖4)。

      圖4 構(gòu)造得到的每位作者的h指數(shù)

      在圖4左邊的情形中能夠注意到,當(dāng)對(duì)近期的注重程度較高時(shí),越是在近期具有高影響力的作者的h指數(shù)會(huì)具有越高的趨勢(shì),所以能夠在一定程度上體現(xiàn)出構(gòu)造得到的h指數(shù)具有對(duì)作者越近期的影響力會(huì)越重視的傾向。但是也能夠注意到,如,第4時(shí)段的作者與第3時(shí)段的作者相比,h指數(shù)在整體上會(huì)相對(duì)偏低,而這和上述直觀認(rèn)識(shí)中的討論是不相符合的。從直觀上,由于得到的h指數(shù)對(duì)作者越近期的影響力越重視,盡管某位作者較近期的影響力較高,其余時(shí)段的影響力較低,同時(shí)另外一位作者近期的影響力較高,那么后者的h指數(shù)應(yīng)當(dāng)高于前者才能與得到的h指數(shù)的注重近期的性質(zhì)相符合。因此,第4時(shí)段的作者的排序應(yīng)當(dāng)高于第3時(shí)段的作者,并且其排序在所有時(shí)段中應(yīng)當(dāng)是最為靠前的。但是需要指出,在直觀認(rèn)識(shí)中所討論的每位作者在不同時(shí)期具有的較高影響力,是這些影響力均較高、并且對(duì)這些影響力之間的相對(duì)高低不進(jìn)行區(qū)分的意義上的較高影響力,這樣才會(huì)有相應(yīng)的認(rèn)識(shí)結(jié)果,而實(shí)際上盡管每位作者的影響力均較高,但是在程度上仍然可以有較大的差異。盡管得到的h指數(shù)注重作者近期的影響力,但是如果某位作者較近期的影響力較高,并且顯著高于近期影響力也較高的另一位作者的影響力,那么會(huì)存在前者的h指數(shù)高于后者的情形,而這與得到的h指數(shù)對(duì)作者越近期的影響力越重視的直觀認(rèn)識(shí)是不相矛盾的。但是對(duì)于影響力均較高的這些作者而言,如果對(duì)這些作者進(jìn)行選取時(shí)具有一般性,得到的h指數(shù)至少應(yīng)當(dāng)具有在近期影響力較高的作者的h指數(shù)會(huì)高于在遠(yuǎn)期影響力較高的作者的h指數(shù)的趨勢(shì),其中的近遠(yuǎn)期是相對(duì)意義上的,所以在整體上隨著時(shí)段的由遠(yuǎn)而近,得到的h指數(shù)應(yīng)當(dāng)有逐漸增加的趨勢(shì)。

      由于只考慮注重近期不一定能使在不同時(shí)期分別具有較高影響力的作者完全按照其高影響力所在的時(shí)段進(jìn)行排序,文中需要利用某種方式來(lái)衡量得到的h指數(shù)是否滿足對(duì)于越在近期具有較高影響力的作者,其得到的h指數(shù)的排序會(huì)越靠前的要求,以及對(duì)滿足的程度進(jìn)行衡量,由此來(lái)衡量構(gòu)造方法的合理性與有效性。由于每位作者均有所屬的具有較高影響力時(shí)段的序號(hào)以及得到的h指數(shù)與該作者相對(duì)應(yīng),在這里利用兩者之間的等級(jí)相關(guān)系數(shù)作為標(biāo)準(zhǔn)來(lái)衡量構(gòu)造的方法對(duì)在不同時(shí)期分別具有較高影響力的作者的識(shí)別程度。如,對(duì)近期的注重程度較高時(shí),越在近期時(shí)段具有較高影響力的作者會(huì)越靠前,這樣在某一領(lǐng)域中最近期的代表性作者的h指數(shù)的排序會(huì)最為靠前,從而能夠嘗試對(duì)該類作者進(jìn)行區(qū)分。在求兩變量的等級(jí)相關(guān)系數(shù)時(shí),沒有將作者所屬的高影響力時(shí)段相同的情形計(jì)入在內(nèi),目的是只考察作者具有高影響力的時(shí)段與得到的h指數(shù)之間的等級(jí)關(guān)系,所以文中等級(jí)相關(guān)系數(shù)為r=s/t。其中,s為作者具有高影響力時(shí)段的序號(hào)與作者的得到的h指數(shù)形成的同序?qū)Φ膫€(gè)數(shù),對(duì)于時(shí)段序號(hào)差值為零的情形以及作者得到的h指數(shù)的差值為零的情形均不計(jì)入在內(nèi)。如果將任意兩個(gè)數(shù)對(duì)作為一組,并將這些組的個(gè)數(shù)稱為總組數(shù),那么t等于總組數(shù)減去時(shí)段序號(hào)差值為零的情形的個(gè)數(shù),這樣t實(shí)際上也等于形成的同序?qū)εc異序?qū)σ约暗玫降膆指數(shù)差值為零的情形的總數(shù),這樣時(shí)段序號(hào)的差值以及得到的h指數(shù)的差值同時(shí)為零的情形也是不計(jì)入在內(nèi)的。由此,該等級(jí)相關(guān)系數(shù)是只對(duì)在不同時(shí)段具有高影響力的作者的高影響力時(shí)段與其得到的h指數(shù)之間的相關(guān)性進(jìn)行衡量,當(dāng)兩位作者屬于同一高影響力時(shí)段時(shí)不對(duì)其進(jìn)行比較,該系數(shù)的取值范圍為0到1,該系數(shù)越高說(shuō)明同序?qū)Φ膫€(gè)數(shù)越多,這樣作者所屬時(shí)段與得到的h指數(shù)的正相關(guān)性會(huì)越高,當(dāng)系數(shù)等于1時(shí),說(shuō)明近期時(shí)段具有高影響力的作者的h指數(shù)均會(huì)高于遠(yuǎn)期時(shí)段的作者的h指數(shù)。其中,遠(yuǎn)近均為相對(duì)意義上的遠(yuǎn)近,對(duì)于圖4左邊的情形,該等級(jí)相關(guān)系數(shù)為0.629。

      影響該等級(jí)相關(guān)系數(shù)的因素包括上述每位作者的影響力均較高,但是在程度上仍然存在較大差異時(shí),可以對(duì)該因素進(jìn)行剔除,從而減少由作者在較遠(yuǎn)時(shí)段的影響力較高,且顯著高于在較近時(shí)段具有較高影響力的作者其h指數(shù)排序靠前的情形出現(xiàn)。由此,能夠提高作者高影響力所屬時(shí)段與得到的h指數(shù)之間的一致性,或者能夠使相關(guān)系數(shù)有所提高。在圖4右邊的情形中,當(dāng)權(quán)重對(duì)近期的注重程度a=0.8時(shí),可以得到每位作者此時(shí)的h指數(shù),當(dāng)權(quán)重對(duì)近期的注重程度等于零時(shí),各個(gè)時(shí)段的權(quán)重相等且等于1,可以得到作者此時(shí)的h指數(shù),且為傳統(tǒng)的h指數(shù)。將前者除以后者作為縱軸并記為h’,在這里利用前者除以后者來(lái)減少上述由作者自身影響力的高低所帶來(lái)的對(duì)作者排序的影響,從而會(huì)更注重得到的h指數(shù)的構(gòu)造方式對(duì)于作者排序的影響。在圖4中能夠注意到,與左圖相比,對(duì)于越在近期具有較高影響力的作者,其排序會(huì)越靠前的要求,右圖滿足的程度會(huì)更高,并且可以得到此時(shí)的等級(jí)相關(guān)系數(shù)為0.759,其中需要將數(shù)對(duì)中得到的h指數(shù)更換為h’。在圖5中權(quán)重對(duì)近期的注重程度a=-0.8,得到的h指數(shù)對(duì)遠(yuǎn)期的注重程度相對(duì)較高。仍然利用注重程度連續(xù)變化時(shí)的情形來(lái)對(duì)權(quán)重進(jìn)行確定,得到的結(jié)果與a=0.8時(shí)的情形相類似,可以得到左圖與右圖的等級(jí)相關(guān)系數(shù)分別為0.535與0.788,其中需要將s中的同序?qū)Φ膫€(gè)數(shù)更換為異序?qū)Φ膫€(gè)數(shù)。

      圖5 構(gòu)造得到的每位作者的h指數(shù)

      除了由作者影響力的差異所帶來(lái)的影響外,對(duì)作者具有高影響力時(shí)段的確定方式也會(huì)影響作者的排序情況。文中采用最大年度被引次數(shù)來(lái)對(duì)作者影響力較高的時(shí)間范圍進(jìn)行確定的方式是粗糙的,如,會(huì)存在這樣的情形,從最大年度被引次數(shù)所在時(shí)段開始向近期或者向遠(yuǎn)期的較長(zhǎng)時(shí)間范圍內(nèi),作者都會(huì)具有較高的影響力,這樣在確定作者具有高影響力的時(shí)段時(shí)僅由最大年度被引次數(shù)來(lái)進(jìn)行確定存在偏差。由此會(huì)出現(xiàn)這樣的結(jié)果,如,本應(yīng)屬于在較近時(shí)間范圍內(nèi)具有較高影響力的作者會(huì)被當(dāng)作在中期時(shí)段具有較高影響力的作者進(jìn)行處理,而此時(shí)作者得到的h指數(shù)以及標(biāo)準(zhǔn)化后的h指數(shù)均可能是較高的,其中標(biāo)準(zhǔn)化后的h指數(shù)是上述得到的h指數(shù)與傳統(tǒng)h指數(shù)的比值,從而會(huì)造成作者所屬的具有較高影響力的時(shí)段與得到的h指數(shù)以及標(biāo)準(zhǔn)化后的h指數(shù)之間的排序不一致的情形出現(xiàn),或者說(shuō)等級(jí)相關(guān)系數(shù)的取值還會(huì)受到高影響力時(shí)段的確定方式的影響,這也是在圖4與圖5的右圖中等級(jí)相關(guān)系數(shù)仍然沒有等于1的原因之一。

      另外,對(duì)各個(gè)時(shí)段的加權(quán)方式也會(huì)對(duì)等級(jí)相關(guān)系數(shù)產(chǎn)生影響,文中利用在時(shí)段上的線性加權(quán),會(huì)造成盡管權(quán)重對(duì)作者近期影響力的注重程度很高,但是比較近期與近期兩個(gè)時(shí)段的權(quán)重差異并不會(huì)偏低的情形出現(xiàn)。由此,對(duì)于在比較近期影響力較高的作者,且其影響力顯著高于近期影響力較高的作者的情況,盡管可以利用標(biāo)準(zhǔn)化后的h指數(shù)在一定程度上消除作者影響力自身的影響,但是由于這種線性加權(quán)以及h指數(shù)自身取值的相對(duì)穩(wěn)定性,在比較近期影響力較高的作者得到的h指數(shù)與其傳統(tǒng)h指數(shù)之間的差異可能會(huì)具有高于在近期影響力較高的作者的兩種h指數(shù)之間的差異的傾向。如,在圖4右圖中的兩位作者,具有高影響力的時(shí)段分別為2014年與2010年,得到的h指數(shù)與傳統(tǒng)的h指數(shù)分別為9與8以及16與14,假設(shè)作者的某篇論文的被引次數(shù)為c,由于作者是在較近期與近期的影響力較高,在求被引次數(shù)的加權(quán)和值時(shí)是將每單位被引次數(shù)均乘以相同的某個(gè)大于1的系數(shù)d,這樣這篇文章的加權(quán)和值為cd,并且與這篇文章的被引次數(shù)的差值為c(d-1)。由于與后者的影響力相比,前者的影響力會(huì)顯著偏低,可以認(rèn)為后者每篇論文的被引次數(shù)在總體上會(huì)高于前者,所以每篇論文的加權(quán)和值與其被引次數(shù)的差值在總體上也會(huì)高于前者,這樣對(duì)于后者而言,其得到的h指數(shù)與傳統(tǒng)h指數(shù)的差異也會(huì)大于前者兩種h指數(shù)之間的差異。因此,可能仍然會(huì)使得在較近期影響力較高的作者其標(biāo)準(zhǔn)化后的h指數(shù)高于在近期影響力較高的作者,從而對(duì)等級(jí)相關(guān)系數(shù)會(huì)具有抑制作用。

      文中對(duì)h指數(shù)進(jìn)行構(gòu)造的最終目的是使當(dāng)對(duì)近期的注重程度較高時(shí),近期代表性作者的h指數(shù)的排序會(huì)靠前,當(dāng)對(duì)遠(yuǎn)期的注重程度較高時(shí),奠基性作者的排序會(huì)靠前。同時(shí)注重程度可以連續(xù)變化,由此來(lái)對(duì)每位作者在不同注重程度時(shí)的影響力分別進(jìn)行衡量,其中的注重程度是指h指數(shù)對(duì)作者近期影響力的注重程度,同時(shí)這種衡量方法應(yīng)當(dāng)適用于影響力的不同情況,而不只限于作者影響力均較高的情形。另外,當(dāng)作者的影響力均較高時(shí),需要在這些影響力可能存在較大差異的情況下,仍然可以將不同時(shí)段的代表性作者識(shí)別出來(lái),可以考慮利用上述等級(jí)相關(guān)系數(shù)來(lái)衡量構(gòu)造方式的有效性,以及需要在以上影響因素的基礎(chǔ)上進(jìn)行構(gòu)造方式的改進(jìn),使得等級(jí)相關(guān)系數(shù)能夠有所提高。

      猜你喜歡
      情形時(shí)段影響力
      避免房地產(chǎn)繼承糾紛的十二種情形
      四種情形拖欠勞動(dòng)報(bào)酬構(gòu)成“拒不支付”犯罪
      公民與法治(2020年4期)2020-05-30 12:31:34
      四個(gè)養(yǎng)生黃金時(shí)段,你抓住了嗎
      天才影響力
      NBA特刊(2018年14期)2018-08-13 08:51:40
      黃艷:最深遠(yuǎn)的影響力
      出借車輛,五種情形下須擔(dān)責(zé)
      公民與法治(2016年9期)2016-05-17 04:12:18
      3.15消協(xié)三十年十大影響力事件
      傳媒不可估量的影響力
      人間(2015年21期)2015-03-11 15:24:39
      傍晚是交通事故高發(fā)時(shí)段
      分時(shí)段預(yù)約在PICC門診維護(hù)中的應(yīng)用與探討
      泰宁县| 靖西县| 五河县| 松阳县| 宁阳县| 法库县| 郑州市| 绵竹市| 厦门市| 扬中市| 筠连县| 万载县| 阿克苏市| 新宁县| 饶平县| 永和县| 溆浦县| 曲靖市| 霞浦县| 龙门县| 屏东市| 海兴县| 颍上县| 新干县| 宁陵县| 湛江市| 晋城| 朝阳县| 乐平市| 武宣县| 磴口县| 宝清县| 海晏县| 安国市| 广昌县| 雷波县| 肇州县| 财经| 绵阳市| 宜兰市| 久治县|