胡祖奎
21世紀(jì)是一個(gè)網(wǎng)絡(luò)時(shí)代,網(wǎng)絡(luò)已經(jīng)無可爭議地成為大家生活的一部分。查資料,看新聞,發(fā)微信……幾乎衣食住行等等列一不用到和依賴網(wǎng)絡(luò)。因此,本文不妨結(jié)合個(gè)人的體會談?wù)劸W(wǎng)絡(luò)資源的下載的一些方法和策略。
一、什么是網(wǎng)絡(luò)資源
辦公電腦作為辦公室的標(biāo)準(zhǔn)配置,可以讓我們打字、聽歌、看電影、玩游戲等;實(shí)現(xiàn)對文本、圖片、音視頻、動畫等多種媒體的處理,極大地提升了我們的工作效率。這些不同的媒體數(shù)據(jù),都是以計(jì)算機(jī)可理解和接受的二進(jìn)制的數(shù)字化的形式,并以文件的形態(tài)存儲于計(jì)算機(jī)的硬盤、U盤、光盤等存儲介質(zhì)。網(wǎng)頁是一種特殊的文件,它本質(zhì)上是一個(gè)包含了各種HTML標(biāo)簽的純文本文件。正是這些不同的標(biāo)簽,使得網(wǎng)頁的內(nèi)容不但有普通的文本內(nèi)容,還能描述出網(wǎng)頁所包含的圖片、音頻、視頻、動畫等其它媒體文件的信息,甚至以超鏈接的形式,與其它的文件起來。為區(qū)別于傳統(tǒng)的文本文件,稱網(wǎng)頁為超文本文件(Htm)。網(wǎng)頁里的圖片、音頻、視頻、動畫等媒體內(nèi)容都是以文件的形式單獨(dú)存放。通過網(wǎng)頁中的超鏈接,可以將一臺或者多臺計(jì)算機(jī)主機(jī)(服務(wù)器)的不同文件內(nèi)容組織起來,形成一個(gè)蜘蛛網(wǎng)一樣的網(wǎng)頁文件的鏈接——網(wǎng)站(Web)。要能讓自己的網(wǎng)站內(nèi)容能夠通過Internet被其他人訪問,還必須進(jìn)行網(wǎng)站的發(fā)布。
從硬件的角度看,網(wǎng)絡(luò)就是多臺計(jì)算機(jī)通過網(wǎng)線、交換機(jī)等各種網(wǎng)絡(luò)設(shè)備聯(lián)接在一起的集合。不同范圍的、不同功能的計(jì)算機(jī)的集合構(gòu)成不同的或公用或私用的計(jì)算機(jī)網(wǎng)絡(luò),而Internet則是目前大家用得最多的一種公眾計(jì)算機(jī)網(wǎng)絡(luò)。Internet中計(jì)算機(jī)上的Web資源就形成龐大的遍布全球的網(wǎng)絡(luò)資源(WWW:World Wide Web),一個(gè)海量的信息集合。因此,網(wǎng)絡(luò)資源就是存儲于Internet中計(jì)算機(jī)服務(wù)器(Web Server)上的多媒體文件。從軟件的構(gòu)成來看,WWW分為Web客戶端程序(瀏覽器)和Web服務(wù)器程序。制作好Web網(wǎng)站后,在計(jì)算機(jī)上的Web服務(wù)器程序進(jìn)行設(shè)置,就完成了網(wǎng)站的發(fā)布,這就是網(wǎng)絡(luò)的WWW服務(wù)。我們上網(wǎng),訪問最多的就是WWW服務(wù)中的Web信息資源,所以網(wǎng)址里總有WWW。
當(dāng)然,Internet呈現(xiàn)給我們的功能除了WWW,還有遠(yuǎn)程登錄服務(wù)Telnet(Remote Login)、文件傳送服務(wù)FTP(File Transfer Protocol)、電子郵件服務(wù)E-mail(Electronic Mail)、電子公告板系統(tǒng)BBS(Bulletin Board System)。但它把Internet上所有的超文本媒體資源統(tǒng)統(tǒng)連接起來,只要網(wǎng)絡(luò)暢通,全球的信息就可方便獲取,使得WWW幾乎成了Internet的代名詞。
二、下載方法
根據(jù)原理的不同,現(xiàn)在網(wǎng)上流行的下載方式主要有WEB、BT兩種下載方式。根據(jù)數(shù)據(jù)傳輸規(guī)則的不同,WEB下載方式分為HTTP與FTP兩種類型,也是兩種最經(jīng)典的下載方式。HTTP下載就是通過瀏覽器進(jìn)行下載:這是大家最熟悉的日常上網(wǎng)的情況,在瀏覽器中輸入某個(gè)網(wǎng)址,打開相應(yīng)網(wǎng)頁,通過簡單的鼠標(biāo)操作就可保存網(wǎng)頁及其中的文字、圖片等資源。毫無疑問,使用瀏覽器進(jìn)行下載是最為簡便的方法。FTP下載可以通過瀏覽器進(jìn)行下載,也可以通過專門的FTP軟件進(jìn)行下載。在這種方式下,使用已知的FTP帳號登錄FTP服務(wù)器,然后操作FTP上的文件就和操作“我的電腦”中的文件一樣,通過簡單的“復(fù)制”、“粘貼”就可完成從遠(yuǎn)程FTP服務(wù)器到本地的數(shù)據(jù)下載。因?yàn)閃WW依循的是客戶端/服務(wù)器端模式,基于Web下載的工作原理,都是通過所使用的本地終端(客戶端)程序發(fā)出申請,訪問相應(yīng)網(wǎng)絡(luò)地址的服務(wù)器(Server)資源,并將遠(yuǎn)程服務(wù)器資源存放于本地終端的過程,客戶端與服務(wù)器之間存在著一對多的關(guān)系(P2S:Peer to Server),若同時(shí)下載的人數(shù)過多,也由于服務(wù)器的帶寬問題,下載速度會減慢許多。具體的星形拓?fù)浣Y(jié)構(gòu)如圖1所示。
BT(BitTorrent)就是比特流,是基于P2P傳輸協(xié)議的一種下載方法,BT下載也稱為P2P下載。與Web下載不同,它要通過一個(gè)專門的P2P下載軟件來實(shí)現(xiàn),可以克服了傳統(tǒng)Web下載方式中下載客戶端較多時(shí),單一的服務(wù)器端負(fù)荷重的局限性。P2P下載不需要專門的服務(wù)器,而是在各個(gè)用戶的終端設(shè)備之間同時(shí)進(jìn)行數(shù)據(jù)上傳和下載。每個(gè)人使用的終端既是提供資源的服務(wù)器端,也是下載資源的客戶端,是一種對等的關(guān)系(P2P:peer-to-peer)。每個(gè)客戶在將其它客戶端上的資源下載到自己終端設(shè)備的同時(shí),還起著被其它客戶端下載的作用。所以使用該種下載方式的用戶越多,其可提供下載資源的端點(diǎn)數(shù)就越多,下載速度就越快。當(dāng)然,缺點(diǎn)就是硬盤長期處于讀寫狀態(tài),可能更容易損壞。所以,BT下載是一種多對多的網(wǎng)狀拓?fù)潢P(guān)系,其拓?fù)浣Y(jié)構(gòu)如圖2所示。
P2SP(Peer to Server&Peer)下載方式實(shí)際上是對P2P技術(shù)的拓展,它不但支持P2P技術(shù),同時(shí)還通過多媒體檢索數(shù)據(jù)庫這個(gè)橋梁把原本孤立的服務(wù)器資源和P2P資源整合到了一起,用戶下載某一個(gè)文件的時(shí)候,會自動搜索其他資源,選擇合適的資源進(jìn)行加速,這樣下載速度更快,同時(shí)下載資源更豐富,下載穩(wěn)定性更強(qiáng)。
三、下載策略
瀏覽器是獲取網(wǎng)絡(luò)資源的門戶,大多的網(wǎng)絡(luò)訪問都是在瀏覽器里面完成的,瀏覽器也是大家使用最頻繁最熟悉的軟件之一。因此,一般的網(wǎng)絡(luò)資源下載大家更習(xí)慣通過瀏覽器進(jìn)行HTTP下載。本文將基于瀏覽器的網(wǎng)絡(luò)資源下載作進(jìn)一步的策略闡述。由于瀏覽器的功能不同,具體下載時(shí)可采取不同的下載策略。
1. 直接下載