涂子沛
中國在數(shù)據(jù)可視化方面的先驅(qū)人物,是地理學(xué)家陳正祥。陳正祥在國際地理學(xué)界享有崇高的聲譽(yù),但因?yàn)榉N種原因,墻里開花墻外香,他的作品和貢獻(xiàn),尤其是在數(shù)據(jù)可視化方面的貢獻(xiàn),并不為中國大眾所知。
陳正祥一生致力于繪圖,他主張用地圖說話,用地圖反映歷史,利用地圖對(duì)政治、經(jīng)濟(jì)、文化、生態(tài)、環(huán)境等現(xiàn)象進(jìn)行描繪和闡述。陳正祥認(rèn)為:“有些長篇大論說不清楚的現(xiàn)象,用地圖來表示卻可一目了然?!边@些思想,正是數(shù)據(jù)可視化的目的和精髓。直到今天,他的不少作品還被世界各國的專家視為精品,被稱為數(shù)據(jù)可視化的經(jīng)典之作。
以其作品《中國文化地理》為例,這本書堪稱用數(shù)據(jù)和地圖譜寫的中國文化史。陳正祥在這本書中提出,中國的經(jīng)濟(jì)、文化中心經(jīng)歷了由北向南遷移的過程。為了證明這個(gè)觀點(diǎn),他首先引用了大量的數(shù)據(jù),其中有各個(gè)朝代的人口數(shù)據(jù)。例如在西漢元始二年(公元2年),南方人口戶數(shù)僅占全國總戶數(shù)的10.3%,但到明朝隆慶六年(1572年)已經(jīng)上升為65.4%。還有政治領(lǐng)袖籍貫分布的數(shù)據(jù),如唐朝共有369人擔(dān)任宰相職務(wù),其中的90%為北方人,但北宋中葉之后,宰相高位多被南方人占據(jù),到了明朝,共有宰相189人,其中南方人占2/3以上,和唐朝相比,分布形勢(shì)完全逆轉(zhuǎn)。他還統(tǒng)計(jì)了明朝期間的狀元、榜眼、探花以及會(huì)元的人數(shù)和籍貫分布,在244名文魁當(dāng)中,南方人有215位,北方人只有29位。
除了用數(shù)據(jù)說話,陳正祥還針對(duì)漢朝至清朝的人口分布、人口密度、交通、鹽業(yè)以及三公九卿、詩人、進(jìn)士、狀元的籍貫分布繪制了18幅地圖。這些地圖華美精致,色彩鮮明,濃縮了上百年的歷史,一圖在手,勝過千言萬語的解釋,即使最普通的讀者也可以一眼看出中國文明的興衰和轉(zhuǎn)移。
類似于各朝代詩人分布的中國文化歷史地圖,陳正祥一共繪制了268幅。1981年,這些地圖收集成冊(cè),在日本、香港地區(qū)出版發(fā)行,大受歡迎。
要統(tǒng)計(jì)幾千名詩人的籍貫,雖然煩瑣,但畢竟有數(shù)據(jù)可查,只要愿意花上時(shí)間,用上“笨”功夫,就一定可以完成。陳正祥在繪圖過程當(dāng)中,遭遇的最大困難還是沒有數(shù)據(jù)。為了繪出一張有參考價(jià)值的好圖,他曾經(jīng)四處奔走。這些尋找數(shù)據(jù)的經(jīng)驗(yàn),他后來進(jìn)行了總結(jié),為中國的歷史文化研究開拓出了一條新路徑。
20世紀(jì)60年代,聯(lián)合國農(nóng)業(yè)氣象委員會(huì)、國際地理學(xué)會(huì)等幾個(gè)國際組織都先后向中國索要蝗蟲災(zāi)害分布的地圖,但陳正祥發(fā)現(xiàn),中國從來沒有這樣的地圖,也沒有現(xiàn)成的資料可以編制這樣的地圖。他回憶說,“就我個(gè)人說,只要回封航空信或電報(bào),老實(shí)告訴他們,便可推得一干二凈”,但是,一想到“將來的研究報(bào)告出版,在中國的空白上勢(shì)必按上‘沒有數(shù)據(jù)’的記號(hào)”,他就不忍心拒絕,因?yàn)椤啊疀]有數(shù)據(jù)’是專用于落伍地區(qū)的可恥記號(hào),我看了就臉紅”,所以他決心為中國編制這樣一份地圖。然而,沒有數(shù)據(jù),又不能憑空捏造,這個(gè)問題??嗟盟耙拱肜@室彷徨”。
陳正祥最后想出的方法,是利用中國各地的方志。中國歷史上鬧蝗災(zāi)的地方通常都會(huì)供蝗神、建蝗神廟,這類廟宇被稱為八蠟廟。若沒有蝗蟲災(zāi)害,農(nóng)村絕對(duì)不會(huì)勞民傷財(cái)去建造這類廟宇,因此可以肯定,這類廟宇越多的地方,蝗蟲災(zāi)害就越嚴(yán)重。而在中國的歷史方志中,對(duì)于這類廟宇的建立,都有詳盡的記錄。他于是開始一心一意查閱方志,“白天找到一批,晚上就把它們標(biāo)到地圖上去,從臺(tái)灣大學(xué)找到南港的歷史語言研究所,最后又找到東京、京都和天理”,他一共翻閱了三千多種方志,花了8個(gè)月的時(shí)間,最終制出了中國的蝗蟲災(zāi)害分布圖。
除了確定蝗神廟的地點(diǎn)與分布,陳正祥還針對(duì)華北平原這個(gè)蝗災(zāi)高發(fā)的地區(qū),作了更細(xì)致的數(shù)據(jù)分析。他把方志中關(guān)于蝗災(zāi)的記錄按地區(qū)和年代分門別類,計(jì)算出各地災(zāi)害發(fā)生的頻率。在把數(shù)據(jù)標(biāo)上地圖之后,陳正祥驚喜地發(fā)現(xiàn),蝗災(zāi)發(fā)生的頻率也和地理位置存在關(guān)系。根據(jù)各地災(zāi)害發(fā)生的頻度大小,陳正祥在地圖上做出了兩條等頻率線,其中A線包圍的地區(qū),平均相隔不到十年就可能爆發(fā)一次蝗災(zāi),在A、B兩線之間的地區(qū),平均每隔10~15年發(fā)生一次。例如,河北省大名縣位于A區(qū),該縣從宋代到清代的736年間,一共發(fā)生蝗災(zāi)73次,平均每10年一次。
除了在歷史文化和環(huán)境生態(tài)兩個(gè)領(lǐng)域的貢獻(xiàn),作為一名地理學(xué)家,陳正祥還針對(duì)中國的城市化進(jìn)程、工業(yè)發(fā)展、人口遷移、氣候變化、交通港口建設(shè)以及各類物產(chǎn)資源的分布等主題,繪制過更多的地圖,但可惜的是,這些地圖大部分都沒有在中國大陸出版。
在陳正祥大量繪圖的時(shí)代,計(jì)算機(jī)還遠(yuǎn)沒有普及。在那個(gè)時(shí)代,要繪一幅好圖,其資料的收集、數(shù)據(jù)的統(tǒng)計(jì),需要很長的時(shí)間不說,繪圖的過程也非常煩瑣,陳正祥也曾經(jīng)在其書中談過這個(gè)過程中的艱苦:
“經(jīng)過約莫二十年的歲月,很多地圖都成熟了。我選擇已經(jīng)熟透了的,張貼在書房最顯眼的墻壁上,一有閑暇就細(xì)心觀察它,看看是否合理,或加以必要的訂正。直到認(rèn)為滿意了,才分批開始精繪,我自己也參加精繪工作。不少已經(jīng)精繪的地圖,因?yàn)榘l(fā)現(xiàn)了重要的新資料,經(jīng)過修改,又得重繪。一幅地圖精繪兩三次,是常有的事。利用此方法編制地圖,要花費(fèi)很多的精力、時(shí)間和金錢,而所得的結(jié)果,仍不免有所欠缺。但這卻是目前唯一可行的辦法!”
20世紀(jì)50年代,中國的大陸和臺(tái)灣地區(qū)正處于緊張的對(duì)立狀態(tài),兩岸隔絕,陳正祥繪圖需要的大量數(shù)據(jù)和資料都無法獲得,他因此辭去自己在臺(tái)灣大學(xué)的教職。他寫道:“我下決心要離開臺(tái)灣,否則無法完成我的研究。”1964年,他經(jīng)歐洲輾轉(zhuǎn)來到香港中文大學(xué),出任首位華人講座教授,這才圓了他的中國繪圖夢(mèng)。
陳正祥也坦承,之所以不懈努力,是因?yàn)橹袊谶@一領(lǐng)域的作品極其匱乏,很多空白甚至是由外國人來填補(bǔ)的:
“中國的歷史如此悠久,文化遺產(chǎn)如此豐富,有許多歷史和文化事項(xiàng),皆可形之于圖,換言之,都可以用地圖來表示。但是奇怪得很,中國學(xué)術(shù)界卻始終沒有能夠系統(tǒng)化地編制歷史和文化地圖。日本同歐美的學(xué)者,雖有個(gè)別人下過功夫,但似乎受到文字修養(yǎng)和史料來源的限制,對(duì)中國很多古老的事項(xiàng)不能徹底了解……難以觸及比較深刻和更有意義的部分。這些事實(shí)增加了我的志趣和勇氣?!?/p>
斯人已逝。今天翻開他給我們留下的幾百張圖形瑰寶,感觸很多。一百多年來,相較于西方發(fā)達(dá)國家,中國確實(shí)在許許多多方面明顯落后,別人有的,我們沒有,但是,如果別人有的,我們其實(shí)也有,只是不為人所知、不受人尊重,這算不算是一種更令人感到遺憾和難過的落后?
(摘自中信出版社《數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實(shí)與未來》一書)