岑嶸
早在2002年,谷歌就有了一個(gè)類似“全世界無產(chǎn)階級(jí)聯(lián)合起來”的理想,這個(gè)理想就是把全世界的數(shù)字圖書館項(xiàng)目統(tǒng)一起來,谷歌由此誕生了GooglePrint項(xiàng)目。
到2010年,谷歌已經(jīng)掃描了1 500萬冊(cè)書,這時(shí)谷歌決定將已經(jīng)掃過的書的某些統(tǒng)計(jì)結(jié)果公開,這便是Google BooksNgrams。也就是說,書的內(nèi)容不一定公開,但關(guān)于書的詞頻統(tǒng)計(jì)結(jié)果可以公開,只要輸入任何詞語,都會(huì)出來一個(gè)像股票價(jià)格一樣的詞頻走勢(shì)曲線圖。
當(dāng)我們把“市場”“價(jià)格”這兩個(gè)詞語輸入后,會(huì)發(fā)現(xiàn)“價(jià)格”的第一個(gè)高點(diǎn)出現(xiàn)在1955年,然后像魚一般一個(gè)猛子扎了下去,到了1967年,這個(gè)詞語幾乎消失在詞語的海洋中,然而在1976年,這個(gè)詞語以45度角的姿態(tài)重新躍出水面,向上飛騰。
而“市場”這個(gè)詞的表現(xiàn)更讓人驚嘆,從1940年開始只是一些小的波紋,和“價(jià)格”一樣,它在1976年左右猛然爆發(fā),但是它的體量更加驚人,仿佛一條座頭鯨,并且以接近90度角的姿態(tài)向上攀升,如同一支射出的箭,到了1997年才到達(dá)頂點(diǎn)開始回落。
如果把“國家”“個(gè)人”這兩個(gè)詞輸入,我們會(huì)發(fā)現(xiàn),“國家”這條曲線總是遠(yuǎn)遠(yuǎn)高于“個(gè)人”。從上世紀(jì)70年代到90年代,“國家”曲線一路上揚(yáng),而“個(gè)人”曲線則波瀾不起,呈現(xiàn)出幾乎和橫坐標(biāo)平行的曲線。
當(dāng)我們將詞語換成“黑暗”和“光明”時(shí),得到的曲線和詞語本身的文學(xué)性一樣的復(fù)雜,“黑暗”和“光明”互相糾纏,彼此追逐。1964年到1971年間,“光明”獲得了短暫的勝利,把我們帶到這一段“陽光燦爛的日子”,然而有意思的是,在1972年“黑暗”超過“光明”之后,雖然彼此都很接近,但“光明”再也沒有沖破“黑暗”。
我們來看看“腐敗”和“廉潔”吧?!傲疂崱边@個(gè)詞一直是躺在地平線上,從上世紀(jì)80年代開始抬頭向上攀緣,而“腐敗”的詞頻曲線則野性十足,從1984年到1998年經(jīng)歷了第一輪波瀾壯闊的牛市,指數(shù)從2 000點(diǎn)一直上漲到9 000點(diǎn),一路上揚(yáng)勢(shì)不可當(dāng),從1998年到2002年,經(jīng)過短暫的調(diào)整以后,2003年以更加凌厲的幅度繼續(xù)上攻,輕松突破一萬點(diǎn)。
“敵人”和“偉大”這兩個(gè)詞從1940年開始飆升,在1974年同時(shí)達(dá)到最高峰后一路下滑,到了2004年,近九成的“敵人”被消滅,“偉大”也縮水了八成。
最后,我們來說說“人民”“群眾”和“公民”吧,“人民”從上世紀(jì)40年代中期筆直上揚(yáng),整個(gè)圖形像青藏高原一樣壯觀,而“群眾”在上世紀(jì)50年代到70年代也頗具規(guī)模,只有“公民”像這些山腳下修建的一條小路,低調(diào)而含蓄。
那些如恒河沙數(shù)般的詞匯正靜悄悄地躺在電腦磁盤中,這些詞匯將為我們揭示出一部隱秘的歷史。
編輯/王一鳴endprint