隨著信息科技的發(fā)展,信息過載的問題也越來越嚴(yán)峻。比如,Blog雖然通過大量的鏈接和RSS訂閱功能,聚合了大量的信息,形成了信息流動(dòng)鏈條,但RSS聚合器是將全部信息毫無遺漏地推送到我們的桌面上,讓我們訂閱的Feed中每天都充滿了海量的重復(fù)、冗余的信息,給閱讀訂閱信息帶來了麻煩,更給挑選有價(jià)值的信息造成了困難。如何解決信息過載呢?有人提出從削減RSS源數(shù)量上入手,有人認(rèn)為可以通過設(shè)置RSS聚合器來提高閱讀效率……雅虎公司推出的Yahoo Pipes(管道或通道)服務(wù)給我們提供了解決信息過載的新思路。
什么是Yahoo Pipes
依據(jù)雅虎的說法,Yahoo Pipes是“一項(xiàng)主機(jī)服務(wù),可以讓你在一個(gè)可視化的編程環(huán)境中,重新組合Feeds并且創(chuàng)建出新的數(shù)據(jù)混搭(Mashups-基于網(wǎng)絡(luò)的數(shù)據(jù)集成程序)”。通俗點(diǎn)說就是將不同網(wǎng)站的Xml格式的輸出內(nèi)容(Feed)作為數(shù)據(jù)源,用戶無需專業(yè)編程知識,利用Pipes提供的模塊(Module)對這些數(shù)據(jù)進(jìn)行一系列的加工,最終獲得用戶想要的結(jié)果。
Pipes是一個(gè)開發(fā)級的RSS構(gòu)建工具包,提供了可視化的接口,借助其強(qiáng)大的邏輯流控制,把整個(gè)網(wǎng)絡(luò)當(dāng)成了一個(gè)大數(shù)據(jù)庫,讓使用者宛如繪圖般可以拉出各種信息整合來源與整合的路徑,制作出信息流程。模塊的作用就是對數(shù)據(jù)庫進(jìn)行檢索、查詢、過濾、排序,把最終結(jié)果輸出成RSS或JSON格式給用戶。越是經(jīng)過整合的信息越具有價(jià)值。這種不用寫程序即可開發(fā)Mash Up的程序,為信息再造與流通降低了門坎。在當(dāng)今各種Web API越來越普遍之際,Yahoo Pipes為整合多種來源信息提供海納百川的一種解決方式。教師可以用Pipes構(gòu)建自己的資訊平臺,把經(jīng)過精選的學(xué)習(xí)資源提供給學(xué)生學(xué)習(xí)。
應(yīng)用實(shí)例
要?jiǎng)?chuàng)建一個(gè)自己的Pipes,需要先用雅虎ID 登錄(如果沒有ID,需先注冊),然后,點(diǎn)擊“Create a New Pipe”(如圖1)。這里,我們以我國航天史上劃時(shí)代的“嫦娥一bac0a18ec40b83b14b474888d25ff670號”月球探測計(jì)劃為例,說明如何“混搭”自己的教育時(shí)事資訊平臺(如圖2)。
設(shè)計(jì)思路:從筆者訂閱的一些地理Blog、網(wǎng)站中篩選出標(biāo)題或內(nèi)容包括“嫦娥一號”或“奔月計(jì)劃”的所有信息。
(1)抓取。從左邊的Sources組中拖一個(gè) Fetch Feed(抓取) 組件到右邊的編輯器上,在URL地址中填入所訂閱的RSS地址,要增加地址點(diǎn)擊URL的“+”號。技巧:Pipes支持RSS2.0、Atom格式,有的網(wǎng)站的RSS格式可能不兼容,這個(gè)時(shí)候可以用feedsky.com或feedburner.com等對RSS地址重新燒制一下,即可解決問題。如果有多個(gè)網(wǎng)站,建議用多個(gè)Fetch區(qū)分開來,再用Operators中的Union(組合)組件將不同的數(shù)據(jù)源連接起來,以方便以后刪除或新增地址。
(2)過濾。展開Operators組,拖一個(gè)Fliter(過濾)組件到編輯器,以挑選出符合需求的信息。設(shè)置選項(xiàng)為“Permit”,即允許匹配任何標(biāo)題包含“嫦娥一號”和描述包括“奔月計(jì)劃”的信息。反之,選“Block”則是排除任何標(biāo)題和描述包括“嫦娥一號”和“奔月計(jì)劃”的信息。
(3)篩選。從Operator組中拖一個(gè)Unique組件來做篩選,Unique 可以依照我們的設(shè)定,刪除重復(fù)的資料,只留下其中的一條。這里,筆者是用Unique對比所有信息的原始網(wǎng)址,去除重復(fù)的網(wǎng)址。技巧:為什么不用標(biāo)題來做比對,刪除重復(fù)標(biāo)題的文章呢?因?yàn)樵S多人收集信息時(shí),都會(huì)依照自己的喜好來更動(dòng)標(biāo)題,所以,如果依照標(biāo)題來篩選數(shù)據(jù),會(huì)有很多重復(fù)文章篩選不到。另外,相同標(biāo)題也有可能是不同的文章,如果利用標(biāo)題刪除重復(fù)文章,就有可能發(fā)生誤刪的情況。
(4)排序。對Unique篩選后的結(jié)果利用Sort(排序)組件,依照文章發(fā)表的先后順序進(jìn)行排列,如把最新發(fā)表的文章排在最上方。如果符合要求的信息太多而導(dǎo)致列表太長的話,還可用Truncate(截?cái)啵┙M件截取其中的一部分。
(5)輸出。把各個(gè)組件的輸出點(diǎn)和輸入點(diǎn)先用“管道”連接起來,再將結(jié)果輸出 (Output)。這樣,地理資訊平臺就搭建成功了。
(6)發(fā)布與使用。單擊“Save”,再單擊“Publish”,輸入你認(rèn)為可取的選項(xiàng),這樣,你的“管道”在全世界范圍內(nèi)就都可用了。右擊“Get as RSS”或“Get as JSON”鏈接以保存鏈接位置,并在任何可能經(jīng)常使用提要的應(yīng)用程序中設(shè)置使用這個(gè)URL(如圖3)。
Yahoo Pipes這項(xiàng)服務(wù)為我們提供了直覺的使用方式與彈性的架構(gòu),為任何有創(chuàng)意或有特殊需求的使用者提供了一個(gè)簡單的混搭工具,而不再受不熟悉的程序語法、數(shù)據(jù)型態(tài)、網(wǎng)絡(luò)協(xié)議等技術(shù)門坎所阻隔。趕快打造你的第一個(gè)Pipes吧。