趙妍
摘要:云計算在目前的發(fā)展中,已經(jīng)成為了網(wǎng)絡(luò)時代的新寵兒,其在很多方面都推動了網(wǎng)絡(luò)時代的進(jìn)步和發(fā)展。相對而言,云計算在具體的操作中,會利用諸多的算法來完成計算和整理工作。在云計算當(dāng)中,PageRank算法是比較常用的一種算法,該算法結(jié)合了以往算法的一些優(yōu)勢和研究成果,并且在運(yùn)用過程中,表現(xiàn)出了較多的便利性,是云計算不可或缺的組成部分。目前,關(guān)于PageRank算法的研究不斷的深入,更多的是對其進(jìn)行優(yōu)化處理,以此來確保云計算的發(fā)展是不斷前進(jìn)的。日后,應(yīng)將PageRank算法與其他算法共同研究,聯(lián)合優(yōu)化,促使云計算在各方面的表現(xiàn)更加突出。
關(guān)鍵詞:云計算;PageRank算法;研究
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)15-0210-02
隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,用戶可以便捷的獲得各種信息,但是也面臨著如何從大量的網(wǎng)絡(luò)信息中獲得有用信息的問題。目前,用戶數(shù)量的激增,給網(wǎng)絡(luò)信息技術(shù)提出的新的挑戰(zhàn),雖然云計算在該方面適當(dāng)?shù)木徑饬诵畔⒎矫娴膲毫?,但終究沒有從根本上解決問題。我們在具體的工作中,還是要從算法方面著手。PageRank算法作為云計算的重要組成部分,其產(chǎn)生的影響是絕對性的,而且在很多方面都表現(xiàn)出了較大的積極意義。隨著時間的推移,PageRank算法的固有成果已經(jīng)不能滿足用戶的需求,必須在固有成果的基礎(chǔ)上,對其進(jìn)行一定的優(yōu)化,并加深研究,才能推動云計算的更大發(fā)展。在此,本文主要就基于云計算的PageRank算法展開研究。
1 算與PageRank算法
云計算是在近幾年才興起的一種技術(shù),雖然總體上表現(xiàn)出了非常突出的成績,但仍有很多方面是有待考究的,優(yōu)化空間非常大,未來的拓展范圍也不小。網(wǎng)絡(luò)技術(shù)的發(fā)展永遠(yuǎn)是以速度著稱的,當(dāng)下的網(wǎng)絡(luò)基本上已經(jīng)很健全了,可仍然無法滿足廣大用戶的需求,證明用戶的需求速度遠(yuǎn)遠(yuǎn)比云計算的發(fā)展速度更快。為此,如果想在將來取得更大的成果,就必須對云計算的核心開展研究——算法。從概念上來分析,算法是一個比較廣義的詞匯,其既包括了各種技術(shù),也包括了計算方法,還包括了各種模式和公式等等。在此,本文對云計算與PageRank算法進(jìn)行論述。
1.1計算
作為網(wǎng)絡(luò)信息技術(shù)的一種集中體現(xiàn),云計算的含義是非常廣泛的。簡單來講,我們所指的云計算,是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源。云計算能夠給用戶帶來更多的體驗和幫助,相比一般的網(wǎng)絡(luò)技術(shù)而言,云計算的“人性化”更加突出。目前,云計算被簡稱為“云”,“云”是網(wǎng)絡(luò)、互聯(lián)網(wǎng)的一種比喻性質(zhì)的說法。從特點上來分析,云計算在使用的過程中,能夠促使用戶體驗每秒10萬億次的運(yùn)算能力,該能力的使用領(lǐng)域非常廣泛,甚至可以模擬核爆炸、預(yù)測氣候變化、預(yù)測市場發(fā)展趨勢等等。例如,現(xiàn)階段的天氣預(yù)報軟件,相對過去而言,能夠在不同時間段預(yù)測出不同的天氣情況和溫度,并且提供的指示也在增多,這些都是云計算的功勞。
1.2 PageRank算法
云計算在使用過程中,算法的決定性作用是不容忽視的。PageRank算法是目前云計算的主流算法之一,該算法是谷歌專有的一種算法。PageRank算法的主要作用在于,衡量特定網(wǎng)頁相對于搜索引擎中的其他網(wǎng)頁而言的重要程度,并且在客觀上實現(xiàn)了將鏈接價值概念作為排名因素。PageRank算法在使用過程中,非常的簡便、快捷,其在很多方面都具有較大的積極意義。PageRank算法在使用過程中,比較突出的一項成績在于,該算法能夠讓鏈接來進(jìn)行相應(yīng)的“投票”。簡單來講,一個頁面的“具體得票數(shù)”,主要是由所有鏈向它的頁面的重要性所決定的。在日常的用戶瀏覽過程中,到一個頁面的超鏈接以后,就相當(dāng)是投了該頁面的一票。在實際的工作中,一個頁面的PageRank,主要是由所有鏈向它的頁面的重要性來決定的,并且會經(jīng)過算法來得到。所以,我們在運(yùn)用PageRank算法后,無論是云計算的數(shù)據(jù)方面,還是云計算的信息方面,都能夠得到更高的工作水平,在很大程度上解決了計算復(fù)雜和信息量大帶來的影響。
2 傳統(tǒng)PageRank算法的問題
PageRank算法在云計算的使用過程中,的確表現(xiàn)出了較大的積極意義,但并不意味著該算法就是完美無缺的。相反的,長久的應(yīng)用后,發(fā)現(xiàn)PageRank算法還是存在一定問題的,一方面是因為用戶需求的提升,另一方面是因為算法本身沒有優(yōu)化處理,所以才出現(xiàn)了一定的問題。傳統(tǒng)的PageRank算法服務(wù)了相當(dāng)長的一段時間,以現(xiàn)代的觀點來看,傳統(tǒng)的PageRank算法,主要是表現(xiàn)出以下幾點問題:第一,對于海量的網(wǎng)頁而言,傳統(tǒng)的PageRank算法會花費大量的時間,這就導(dǎo)致云計算的速度在減慢,并且得到的結(jié)果并不是特別的權(quán)威,長此以往將會失去用戶的信任和支持。第二,計算PageRank的過程中,只要求在合理的誤差范圍內(nèi)即可。但傳統(tǒng)的PageRank算法并沒有考慮到這一點,具體的數(shù)值計算是不斷的精確化,即便是已經(jīng)達(dá)到了精度較高的標(biāo)準(zhǔn),依然會持續(xù)的精確計算,導(dǎo)致云計算陷入了一種惡性循環(huán),這對用戶而言,并不是最好的選擇。
3 基于云計算的PageRank算法改進(jìn)
云計算與PageRank算法是密不可分的關(guān)系,二者在很多時候都是相互促進(jìn)的,并且表現(xiàn)出了相互依偎的特點?;谠朴嬎愕腜ageRank算法,與傳統(tǒng)PageRank算法有很大的不同,其在日常的使用當(dāng)中,一方面充分發(fā)揮出算法的積極作用,另一方面會照顧到云計算的各項條件和要求,以此來確保日常的使用符合用戶的需求。值得注意的是,我們在對基于云計算的PageRank算法實施改進(jìn)時,必須考慮到多方面的因素,不能單純的在理論上有所改進(jìn),還要考慮到實際情況以及后續(xù)的發(fā)展。在此,本文主要對基于云計算的PageRank算法改進(jìn)進(jìn)行論述。
3.1改進(jìn)算法的基本思想
為了能夠更好的改進(jìn)PageRank算法,通過對計算跨度為2的公式進(jìn)行遞推,最終得到了以下公式:PRk+2=(1-d)I+dATPRk+1=(1-d)I+d(1-d)AT+(dAT)2PRk。對PageRank算法實施改進(jìn),并不是一件容易的事情,其要考慮到的影響因素較多,結(jié)合以往的工作經(jīng)驗和當(dāng)下的工作標(biāo)準(zhǔn),我們在PageRank算法的改進(jìn)思想上,主要是從以下幾點出發(fā)的:第一,利用Mapreduce框架得到 AT。第二,通過AT計算( AT)2。第三,計算Pagerank值。此步驟中,把公式分為兩個部分。如果Map函數(shù)輸入的是AT,計算( 1-d) I+ d( 1-d) AT,那么每個目標(biāo)節(jié)點key所對應(yīng)的value為( 1-d) I + d( 1-d) AT;如果Map函數(shù)輸入的是( AT)2,計算( dAT)2PRk,那么每個目標(biāo)節(jié)點key所對應(yīng)的value為( dAT)2PRk。框架對Map函數(shù)的輸出結(jié)果進(jìn)行處理,是每個目標(biāo)節(jié)點key對應(yīng)的所有value形成一個list,作為reduce函數(shù)的輸入。Reduce函數(shù)對每個目標(biāo)節(jié)點key所對應(yīng)的value list進(jìn)行相加就可以得到新的 Pagerank向量 PRk+2。由此可見,按照以上思想來改進(jìn)PageRank算法,基本上還是可行的,并且在部分工作中,已經(jīng)得到了結(jié)果。
3.2性能分析
基于云計算的PageRank算法在得到改進(jìn)后,并不能直接的應(yīng)用,即便是思想正確、成果穩(wěn)定,也不能投入,而是要對性能展開分析,了解其是否能夠滿足用戶和云計算的需求。經(jīng)過大量的討論和分析,認(rèn)為PageRank算法在改進(jìn)后,性能分析主要是集中在以下幾項工作。第一,對于PageRank算法改進(jìn)后,應(yīng)經(jīng)過三個階段的Mapreduce過程分析。一般而言,在第一階段的時候需經(jīng)過1次的分析;在第二階段的時候,需經(jīng)過1次的分析;在第三階段的時候,需經(jīng)過50次的分析,一共是52次。第二,對具體的執(zhí)行時間進(jìn)行分析。從得到的結(jié)果來看,傳統(tǒng)的PageRank算法僅僅是計算AT,但是在對PageRank算法改進(jìn)后,還會計算(AT)2,這樣一來,在具體的執(zhí)行時間上,就節(jié)省了大概50%的時間。這是我們非常想要看到的結(jié)果。第三,通過運(yùn)用改進(jìn)后的PageRank算法,云計算在速度和效果上更加突出,滿足了更多用戶的實際需求,并且在客觀上和主觀上都有所改變。
4 總結(jié)
本文就基于云計算的PageRank算法展開研究,從現(xiàn)階段得到的結(jié)果來看,運(yùn)用改進(jìn)后的PageRank算法,是比較適合云計算研究和拓展的,并且改進(jìn)后的PageRank算法,也將云計算作為一個跳板,獲得了更大的成功,在很多方面實現(xiàn)了健全和發(fā)展,告別了傳統(tǒng)PageRank算法的很多問題,未來的研究空間還是很大的。
參考文獻(xiàn):
[1]甘櫪元.基于云計算的數(shù)據(jù)挖掘算法的研究[J].電子技術(shù)與軟件工程,2015(7):195.
[2]陳建峽,李志鵬.基于移動終端的博客搜索引擎系統(tǒng)研究與應(yīng)用[J].湖北工業(yè)大學(xué)學(xué)報,2015(2):89-94.
[3]張愷.一種改進(jìn)的基于云計算的PageRank算法[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(自然科學(xué)版),2015(2):66-70.
[4]萬年紅.基于云模型的協(xié)同過濾推薦算法[J].計算機(jī)系統(tǒng)應(yīng)用,2015(5):140-146.
[5]賀元香,史寶明,楊生舉,吳萬琴.基于用戶行為模型的網(wǎng)頁排序算法[J].蘭州文理學(xué)院學(xué)報(自然科學(xué)版),2015(3):63-67+111.
[6]譚鶴毅.基于云計算環(huán)境下的密文搜索算法研究[J].計算機(jī)光盤軟件與應(yīng)用,2015(2):21-22.
[7]孫艷秋,王甜宇,曹文聰.基于云計算的醫(yī)療大數(shù)據(jù)的挖掘研究[J].計算機(jī)光盤軟件與應(yīng)用,2015(2):11,13.
[8]穆瑞輝.基于云計算的虛擬機(jī)在線遷移算法[J].安陽工學(xué)院學(xué)報,2015(2):49-51.