徐芳
〔摘 要〕以我國20個省級教育信息綜合網站為樣本,運用Google搜索引擎和網絡鏈接分析方法獲取樣本網站的總鏈接數、內部鏈接數、外部鏈接數和網頁總數等鏈接分析指標數據,并對網絡影響因子進行計算。然后使用灰關聯(lián)排序的方法對其中八項指標數值進行測度,在此基礎上對我國省級教育信息綜合網站的建設狀況、利用狀況和影響力情況進行分析研究。
〔關鍵詞〕教育信息網站;鏈接分析法;評價
〔中圖分類號〕G250.2 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)09-0168-04
隨著信息技術和互聯(lián)網的日益普及,網絡成為人們獲取和交流教育信息的重要平臺。教育信息網站為社會提供教育信息政策,宣傳地區(qū)的教育成果和經驗,囊括了教學、招生、學校宣傳等方面的信息,它的建設、利用和影響力情況直接關系到教育信息傳播的廣泛性、及時性和公眾易獲取性。
網站影響力是指網站的信息資源與服務通過網絡實現(xiàn)傳遞、交流和利用,從而改變他人的思想和行動的能力[1]。評價網站影響力的方法主要可分為兩種:一種是主觀定性評價,該方法主要是從用戶的角度出發(fā),通過用戶直接評價、用戶獲取信息后行為改變等方面進行評價。它主要包括問卷調查法、社會效益評價等。而另外一種方法是客觀定量評價,定量評價是以實際數據為主要評價依據,其評價結果更為客觀、科學,因此定量評價是目前最為常用的評價方法[2]。鏈接分析法是客觀定量評價中比較重要的方法之一。網站的不同鏈接體現(xiàn)的是不同的信息功能,具有不同的特征和規(guī)律,對網站的鏈接特征進行分析是了解網站建設情況和影響力的一個重要途徑。鏈接分析法是運用網絡數據庫、數學分析軟件等工具,利用數學(主要是統(tǒng)計學和拓撲學)和情報學的方法,對網絡鏈接自身屬性、鏈接對象、鏈接網絡等各種對象進行分析,以便揭示其數量特征和內在規(guī)律,并用以解決各方面問題的一種研究方法[3]。本文運用網絡鏈接分析的方法對我國20個省級教育信息綜合網站進行定量評價,并結合評價結果對其影響力、利用和建設現(xiàn)狀進行研究,以期對教育信息網站的建設起到推進作用。
1 研究方法
1.1 研究對象的選取
研究對象源自《中國教育信息化》的2011年第12期上所刊登的的中國省級教育信息綜合網站排行榜。上榜的20個省級教育網站的具體信息見表1。
1.2 研究指標的選取
在研究指標的選取方面,本文根據研究性質和需求,選取以下9個指標:
1.2.1 總鏈接數
鏈接總數是衡量網站鏈接數量特征最重要的指標之一,反映了網站被鏈接的總數,體現(xiàn)了該網站的影響力和網絡輻射力。通常,網站中的鏈接數量越多,信息的揭示程度就越高,組織體系越完備[4],用戶通過訪問此類型的網站所能獲取的信息資源會越豐富。
1.2.2 外部鏈接數
網站的外部鏈接數是評價網站影響力和價值的重要尺度。外部鏈接數是指運用搜索引擎,針對某網站范圍外搜索到的與該網站存在鏈接的網頁數。該指標能夠更好地反映網站的質量。
1.2.3 內部鏈接數
內鏈接數是來自網站自身內部鏈接情況的指標,集中反映了該網站內部層次結構的完備性。
1.2.4 網頁總數
網頁總數是指一個網站所包含的所有網頁的數量,主要反映網站的規(guī)模和內容豐富程度。
1.2.5 鏈接效率
鏈接效率是指外部鏈接數占總鏈接數的比例。鏈接效率能夠客觀地表明網站鏈接來源的組成結構。外部鏈接所占的比例越高,其鏈接效率就越高,即間接網站的相對影響力就越大。
1.2.6 網絡影響因子
網站規(guī)模大,被其他網站鏈接的次數就多,而規(guī)模小的網站則會處于劣勢。為了準確地評價網站影響力,需要消除網站因為規(guī)模不同造成的影響,網絡影響因子的出現(xiàn)在一定程度上可以實現(xiàn)此要求。網絡影響因子可以反應網站網頁被鏈接的總平均水平,其值為總鏈接數和網頁數之比。
1.2.7 內部網絡影響因子
網站內鏈接數和網頁數的比值即為內部網絡影響因子,它反映的是網站網頁的自鏈接的總平均水平。
1.2.8 外部網絡影響因子
網站外鏈接數和網頁數的比值被稱為外部網絡影響因子,它反映了網站網頁被外部鏈接的總平均水平。
1.2.9 PR值
PR值是Google特有的衡量網頁重要程度的指標,用來標識網頁的等級和重要性。級別從1級到10級,10級為滿分。由于PR值最直接的影響因素是來自鏈接,所以網站所得到的高質量導入鏈接越多,網站PR值就可能越高,PR值越高則說明該網站網頁在搜索排名中的地位越重要[5]。
1.3 研究工具的選擇
搜索引擎作為網絡計量學研究中最基本的研究工具之一,被廣泛應用于對網站鏈接特征進行數據收集和分析?,F(xiàn)階段,可用于鏈接分析的搜索引擎的種類很多,其中被選用最多的依次是AllTheWeb、AltaVista、Google[6]。三者中更新速度快且搜索精度高而受到廣泛關注的AllTheWeb于2011年4月4日被雅虎關閉。另外由于AltaVista對于中文數據查詢的支持不是很好且不夠穩(wěn)定[7],所以本文選用檢索功能強且對中文數據查詢支持較好的Google作為數據搜集工具。
對于PR值,利用“站長工具”網站(http:∥tool.chinaz.com/)中的PR查詢功能,逐一查詢獲取樣本網站的相關信息。
1.4 數據檢索指令
使用Google對各網站的總鏈接數、內部鏈接數、外部鏈接數和網頁總數進行數據收集時,檢索指令如表2:
2 數據獲取及測度
本文的數據獲取時間為2012年2月17日21∶00~23∶00。各網站的各項指標具體情況如表3所示。
網站的建設、影響力和輻射力情況受表3中各指標數值大小的影響。各項指標的數值越大,其網站的結構、內容、影響力、搜索排名等情況越好,但是表3中的各項指標數值不夠統(tǒng)一,難以對20個樣本網站進行綜合的分析評價,所以本文借用灰關聯(lián)排序的方法來對各網站進行綜合排名。灰關聯(lián)排序分析的目的是對信息不完全的系統(tǒng)作因子間的量化、序化。它的實質是整體比較,是有參考系的、有測度的比較[8]。按照關聯(lián)度進行排序,綜合各個指標的優(yōu)點和特性,所獲得的排序結果將更為科學、客觀、可靠。其具體方法是:首先選取各個指標中最大數值作為參考數值,記作x0。然后分別計算各行其他數據x1,x2…xn與其參考數值之間的絕對差值,從每項指標的差值中,分別選出一個最大值和一個最小值,記作maxx0(k)-xi(k)和minx0(k)-xi(k)。然后再從maxx0(k)-xi(k)和minx0(k)-xi(k)的數值中選出一個最大值和一個最小值,分別記作maxmaxx0(k)-xi(k)和minminx0(k)-xi(k)。ζ∈[0,1]為分辨系數,一般按最少信息原理取為0.5,即ζ=0.5[5]。
借用灰關聯(lián)排序的方法對這20個教育信息網站進行8項指標(總鏈接數、內部鏈接數、外部鏈接數、網頁總數、網絡影響因子、內部網絡影響因子、外部網絡影響因子和PR值)的綜合排名,計算過程中剔除異常數據,最終結果如表4所示。
3 數據分析與結論
3.1 數據獲取分析
在各指標數據的搜索獲取過程中,由于受所運用搜索引擎的穩(wěn)定性、網站服務器穩(wěn)定性和病毒、網頁制作技術等各方面因素的影響,存在著一些異常數據。
(1)部分網站的總鏈接數與站外鏈接數數值過于接近。如海南省教育網、河南省基礎教育信息網、山西基礎教育網等。
(2)河南省基礎教育信息網的網頁總數過少。
(3)數據檢索結果不穩(wěn)定。
3.2 數據結果分析
從表3和表5的數據中可以看出我國省級教育信息綜合網站建設整體水平較好,但是網站影響力有待提高,其中部分網站內部建設和網絡關注度方面需要得到重視。
表3的數據顯示,80%的網站的鏈接效率達到90%以上,在網站鏈接的組成中,外部鏈接所占比例高,表明教育信息網站具有一定的相對影響力,但是其中只有15%的網站的總鏈接數和外部鏈接數超過100 000,這說明具有較大影響力和輻射力的教育信息綜合網站所占比例不高,85%的網站需要注重加強自身的影響力,提升其被關注的程度。在網站的內部鏈接方面,數據整體顯示出省級教育信息綜合網站的資源匱乏,內部結構建設水平不高。其中除安徽教育資源中心和寧夏教育網之外,90%的網站的內部網絡影響因子不到0.1,這說明90%的網站的內部層次結構不夠完備,網站網頁的易獲性差,這些缺點直接影響到網站的影響力和網絡輻射力。在網站的網頁總數方面,有55%的網站的網頁總數達到10 000以上,說明半數以上的網站具有較大的規(guī)模且完備性較好。在網站的PR值方面,35%的網站PR值為5,50%的網站PR值為6,網站PR值為7的僅占10%,說明我國省級教育信息綜合網站的搜索關注度一般,這需要提高網站整體的質量水平,從而提高自身的搜索關注度。從表5的灰關聯(lián)度數據值中可以看出,大多數省級教育信息綜合網站的關聯(lián)度相差層次不大,關聯(lián)度值在0.7和0.8之間。這表明從網站影響力的綜合評價角度來看,我國省級教育信息綜合網站的影響力整體有待提高。
針對鏈接分析數據所反映的情況,我國省級教育信息綜合網站的網站建設和網絡影響力的提升,一方面需要注重豐富網站內容,強化網站的服務功能,提升信息發(fā)布的質量,及時、真實、有效地傳播教育信息;另一方面可以從優(yōu)化網站內部鏈接和網站友情鏈接以及加大宣傳力度等方面進行加強和提升。網站內部鏈接的優(yōu)化使網絡內部層次架構的合理化得以提升,便于用戶的訪問和瀏覽。友情鏈接可以為網站帶來相對穩(wěn)定的用戶訪問量,并且有助于提升網站在Google等搜索引擎中的排名。加大網站的宣傳力度,能夠提升網站的網絡知名度和普及力度,從而吸引更多網絡用戶的關注和使用。
參考文獻
[1]曾荷.電子政務信息資源的網絡影響力評價研究[D].上海:華東師范大學,2007:6-7.
[2]陳太洋,任全娥.中外企業(yè)網站的鏈接分析與網站影響力評價[J].情報理論與實踐,2008,(4):614-615.
[3]唐高芳.基于鏈接分析的網絡信息資源評價研究[J].新世紀圖書館,2011,(5):62-64.
[4]邱均平,陳敬全.網絡信息計量學及其應用研究[J].情報理論與實踐,2001,24(3):161-163.
[5]張倩,滕紅,袁小珊.基于鏈接分析法的我國主要商業(yè)網站影響力評價研究[J].情報科學,2011,(6):833-837.
[6]楊木容.搜索引擎在網絡鏈接分析中的應用研究[J].圖書情報工作,2006,50(11):90-94.
[7]張向先,袁小珊.基于鏈接分析法的我國省級科技信息研究所網站影響力評價研究[J].情報理論與實踐,2011,34(3):91-94.
[8]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中科技大學出版社,2005:74-103.
(本文責任編輯:王 涓)