• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      搜索引擎怎樣對網(wǎng)頁排序

      2017-05-16 19:40胡光能
      中學科技 2016年7期
      關(guān)鍵詞:訪問量搜索引擎指向

      胡光能

      2016年5月,魏則西事件將百度的網(wǎng)頁競價排序模式推向了風口浪尖。排除網(wǎng)頁排序背后的商業(yè)因素,搜索引擎是怎樣在紛繁復雜的信息中快速搜得所需的呢?

      從現(xiàn)實生活到虛擬網(wǎng)絡(luò)

      去圖書館查找書籍時,書是按文學、數(shù)學、計算機等科目分類放置的;去超市購物時,物品也是按生鮮、日用品、糕點等門類分區(qū)放置的。這樣的安排“合情合理”,能夠幫助我們迅速找到自己所需的書或物品。

      從真實世界到虛擬世界,互聯(lián)網(wǎng)猶如一張巨大的虛擬網(wǎng),匯聚各類網(wǎng)頁?;ヂ?lián)網(wǎng)中的網(wǎng)頁就好比是圖書館里的書或超市中的物品,如果不對其進行排序,要想從數(shù)量驚人的網(wǎng)頁中“海選”出所需的信息,那就如同天方夜譚。在這樣的背景下,搜索引擎應(yīng)運而生。

      搜索引擎的“工作”是將用戶需要的網(wǎng)頁“搜索”出來,并展現(xiàn)給用戶。例如在百度搜索框中輸入“科學不倒問”后,可能會得到如右下圖所示的搜索結(jié)果(搜索結(jié)果一般會隨著時間而變化)。觀察搜索引擎給出的搜索結(jié)果,確實與“科學不倒問”這個“主題”相關(guān),而且相關(guān)性越高,它就會被排在越靠前的位置。

      排序的奧秘

      要探究搜索引擎背后的奧秘,那就需要了解搜索結(jié)果的網(wǎng)頁排序方法。觀察“科學不倒問”的搜索結(jié)果,直觀上說,將“《中學科技》雜志科學不倒問欄目”排在第一的排序應(yīng)是合理的,因為相比于其他網(wǎng)頁,此網(wǎng)頁與“科學不倒問”這個主題的相關(guān)程度更高,而網(wǎng)頁的排序也在一定程度上反映出在此關(guān)鍵詞下此網(wǎng)頁的“受歡迎程度”。

      網(wǎng)頁的“受歡迎程度”通??梢杂镁W(wǎng)頁的訪問量來衡量,它和網(wǎng)頁的訪問量成正比。但依據(jù)訪問量對網(wǎng)頁進行排序也會存在一些現(xiàn)實的問題。訪問量雖能體現(xiàn)網(wǎng)頁的“受歡迎程度”,但卻并不能體現(xiàn)網(wǎng)頁的“權(quán)威性”,例如許多低俗網(wǎng)頁便有較高的訪問量。此外,依據(jù)訪問量排序還易受到“刷流量”的惡意誤導。更為重要的是,網(wǎng)頁的訪問量是動態(tài)變化的,如要及時更新排序,代價也非常巨大。因此,要解決網(wǎng)頁排序中所遇到的問題就要充分挖掘網(wǎng)頁的特征,確定評價網(wǎng)頁“權(quán)威性”和“受歡迎程度”的綜合指標。

      網(wǎng)頁特征包含網(wǎng)頁的內(nèi)容(圖片及文字等)以及其中指向其他網(wǎng)頁地址的超鏈接。一個網(wǎng)頁越“重要”,理論上就應(yīng)該會有越多的用戶瀏覽。網(wǎng)頁間的超鏈接結(jié)構(gòu)能夠影響用戶的瀏覽行為,因此,可以依據(jù)各網(wǎng)頁之間的超鏈接關(guān)系來確定各網(wǎng)頁的綜合瀏覽量,并由此對網(wǎng)頁進行排序。

      巧妙的循環(huán)分配

      如右上圖,假定一個用戶U正在瀏覽網(wǎng)頁A,A含有兩個超鏈接(藍色橫線表示),分別指向網(wǎng)頁B和C,那么U在瀏覽完A后,可能會沿著超鏈接繼續(xù)瀏覽B或C,由此B或C的“重要性”便可以由A的“重要性”來體現(xiàn)。依據(jù)同樣的原理,B的“重要性”便可由指向B的所有網(wǎng)頁的“重要性”之和來表示。

      與此同時,處于整個網(wǎng)絡(luò)之中的B對其他網(wǎng)頁也是有影響的,例如網(wǎng)頁B中包含指向網(wǎng)頁C的鏈接,即C也影響指向B的網(wǎng)頁A的“重要性”,由此便會陷入一個兩難的境地:要想知道網(wǎng)頁B的“重要性”,就必須知道指向它的所有的網(wǎng)頁(A和C)的“重要性”之和;而要想知道所有這些網(wǎng)頁的“重要性”之和,又需要先知道對其有影響的網(wǎng)頁B的“重要性”。這便讓人困惑了,猶如陷入了“先有雞還是先有蛋”的怪圈。

      為了打破這個循環(huán),谷歌的創(chuàng)始人佩奇和布林提出了PageRank算法來衡量網(wǎng)頁的重要性程度。他們首先給所有的網(wǎng)頁設(shè)置了相同的“初始得分”,然后依據(jù)網(wǎng)頁間的超鏈接結(jié)構(gòu)不斷運行,經(jīng)過一系列的迭代計算之后,得到終止狀態(tài)下的“網(wǎng)頁得分”,由此便可依據(jù)“得分”確定網(wǎng)頁的排列順序。得益于在網(wǎng)頁排序算法上的創(chuàng)新,谷歌在短短數(shù)年間橫掃整個互聯(lián)網(wǎng),成為搜索引擎業(yè)的一代霸主。

      依據(jù)網(wǎng)頁排序算法,我們可以確定網(wǎng)頁A和C的得分較B高。仔細分析三者的關(guān)系,這樣的結(jié)果的確也是合理的。網(wǎng)頁A和B中都包含指向網(wǎng)頁C的超鏈接,這說明網(wǎng)頁C的“重要性”較高;與此同時,網(wǎng)頁C中也包含指向網(wǎng)頁A的超鏈接,網(wǎng)頁C從側(cè)面反映了網(wǎng)頁A的“重要性”,因此網(wǎng)頁A的得分也較高。

      谷歌的網(wǎng)頁排序算法對網(wǎng)頁排序的過程僅僅是對簡單思維的巧妙運用,它將網(wǎng)頁排序變成了一個簡單的數(shù)學問題,也使互聯(lián)網(wǎng)擺脫了依據(jù)網(wǎng)頁訪問量進行排序的種種弊端。

      猜你喜歡
      訪問量搜索引擎指向
      科學備考新指向——不等式選講篇
      把準方向盤 握緊指向燈 走好創(chuàng)新路
      高職院校圖書館電子資源中數(shù)據(jù)庫的使用情況分析
      如何做好搜索引擎優(yōu)化(SEO)提高新聞網(wǎng)站訪問量
      如何做好搜索引擎優(yōu)化(SEO)提高新聞網(wǎng)站訪問量
      一所大學有40人被確診為抑郁癥
      網(wǎng)絡(luò)搜索引擎亟待規(guī)范
      Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
      基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
      廣告主與搜索引擎的雙向博弈分析
      清涧县| 孟连| 山东省| 社旗县| 密云县| 嘉义县| 松阳县| 武安市| 南阳市| 达州市| 东宁县| 土默特右旗| 加查县| 周至县| 云南省| 广南县| 分宜县| 武强县| 吴川市| 大田县| 鄯善县| 沛县| 江城| 乌海市| 博爱县| 连城县| 曲麻莱县| 科技| 南昌市| 普格县| 泰顺县| 崇明县| 广昌县| 安西县| 塔城市| 高雄市| 沁阳市| 石嘴山市| 东辽县| 邵东县| 离岛区|