孫二林,張為斌,2
(1.北京宸瑞科技股份有限公司,北京 100080;2.北京宸信征信有限公司,北京 100080)
“國(guó)家”是地理學(xué)的重要概念,根據(jù)聯(lián)合國(guó)官網(wǎng),目前全世界的國(guó)家個(gè)數(shù)是193 個(gè)[1]。除了“國(guó)家”以外,還有一些“地區(qū)”或“經(jīng)濟(jì)體”,如中國(guó)香港特別行政區(qū)、百慕大。關(guān)于地區(qū)的個(gè)數(shù),不同的組織有不同的說(shuō)法,如世界銀行數(shù)據(jù)庫(kù)中的地區(qū)個(gè)數(shù)是24 個(gè)[2]。國(guó)家和地區(qū)總數(shù)是200 多個(gè)。
國(guó)家和地區(qū)有三個(gè)基本變量:個(gè)數(shù)、人口、經(jīng)濟(jì)總量。國(guó)家和地區(qū)個(gè)數(shù)相對(duì)穩(wěn)定,但有時(shí)也會(huì)發(fā)生變化,如1991 年蘇聯(lián)解體為15 個(gè)獨(dú)立國(guó)家。一般認(rèn)為,人口和GDP 在一定程度上符合冪律分布。奧爾巴赫(Auerbach)最早指出,城市規(guī)模分布可以用冪律分布近似表示;后來(lái)經(jīng)過(guò)齊普夫(Zipf) 的進(jìn)一步發(fā)展和完善,形成了城市規(guī)模分布的齊普夫定律[3]。從國(guó)內(nèi)外現(xiàn)有文獻(xiàn)來(lái)看,學(xué)者們采用齊普夫定律等方法,對(duì)中國(guó)城市規(guī)模分布進(jìn)行了大量的實(shí)證研究,得出的主要結(jié)論爭(zhēng)議比較大[4]。關(guān)于國(guó)家GDP 的分布,Corrado Di Guilmi 等人發(fā)現(xiàn),在1960-1997 年期間,中等收入國(guó)家的人均GDP 符合冪律分布,其他國(guó)家不符合[5]。Narushige SHIODE 和Michael BATTY 發(fā)現(xiàn),各國(guó)的人口、GDP、網(wǎng)站、超鏈接都不遵循冪律分布,只不過(guò)人口和GDP 的分布比Web 數(shù)據(jù)更接近冪律分布[6]。至于國(guó)家個(gè)數(shù)分布的研究則非常少。本文的目的就是探討國(guó)家及地區(qū)個(gè)數(shù)、人口、GDP 的分布規(guī)律。
正態(tài)分布是自然界最常見的一種分布。例如,一個(gè)人口群體的智商;一組人的某科目考試成績(jī);實(shí)驗(yàn)中的隨機(jī)誤差,等等,均呈現(xiàn)為正態(tài)或近似正態(tài)分布[7]。布拉德福定律、齊普夫定律、洛特卡定律是文獻(xiàn)計(jì)量學(xué)中最基本的三大定律,可以認(rèn)為它們是一種分布規(guī)律的不同表現(xiàn)形式[8]。這種分布規(guī)律就是冪律分布。在經(jīng)濟(jì)學(xué)中,需求規(guī)律是在其他條件相同時(shí),一種物品價(jià)格上升,該物品需求量減少的規(guī)律。需求規(guī)律可以用需求曲線表示,需求曲線是一種物品價(jià)格與需求量之間關(guān)系的圖形。根據(jù)習(xí)慣,價(jià)格在縱軸,需求量在橫軸,需求曲線是從左上方向右下方傾斜的曲線[9]。需求定律中的需求曲線也符合冪律分布。指數(shù)增長(zhǎng)和Logistic 增長(zhǎng)是最基本最常見的增長(zhǎng)方式,它們能很好地刻畫自然界和人類社會(huì)中很多物質(zhì)量的變化規(guī)律。比如:生物種群的繁衍;人口的增加;樹木的生長(zhǎng);國(guó)民收入的增長(zhǎng);傳染病的傳播;新產(chǎn)品、新技術(shù)的市場(chǎng)擴(kuò)散等[10]。國(guó)家GDP的增長(zhǎng)是指數(shù)增長(zhǎng),這方面的研究很多;各國(guó)GDP 的分布是否也是指數(shù)分布,這方面的研究較少。本文將嘗試提出一種以指數(shù)分布為主、輔之以正態(tài)分布和冪律分布的分布模型。
當(dāng)代法國(guó)政治社會(huì)學(xué)家莫里斯·迪韋爾熱(Maurice Duverge)基于對(duì)政治的社會(huì)學(xué)認(rèn)識(shí),他首先把所有已存在過(guò)或存在著的國(guó)家分為兩類:一是“未發(fā)展的國(guó)家”,二是“發(fā)展的國(guó)家”。莫里斯把現(xiàn)代社會(huì)的國(guó)家稱之為發(fā)展的國(guó)家,并具體分為發(fā)達(dá)國(guó)家、半發(fā)達(dá)國(guó)家(認(rèn)為稱這類國(guó)家為發(fā)展中國(guó)家)、不發(fā)達(dá)國(guó)家三種國(guó)家類型。此外,有人按國(guó)家實(shí)力及國(guó)際地位把世界各國(guó)劃分為超級(jí)大國(guó)、大國(guó)、中等國(guó)家和弱小國(guó)家[11]。世界銀行于1978 年在世界發(fā)展報(bào)告中首次發(fā)布了國(guó)家收入分類標(biāo)準(zhǔn)以及人均國(guó)民總收入(GNI)指標(biāo)的國(guó)家排序數(shù)據(jù),將全球所有國(guó)家和地區(qū)按人均GNI 高低,劃分為高收入國(guó)家組、中上等收入國(guó)家組、中下等收入國(guó)家組和低收入國(guó)家組[12]。以上分類中除了世界銀行屬于定量標(biāo)準(zhǔn)以外,其他均為定性標(biāo)準(zhǔn)。要研究國(guó)家及地區(qū)的個(gè)數(shù)、人口、GDP 分布,應(yīng)該把定性標(biāo)準(zhǔn)定量化。
地理環(huán)境對(duì)人類有明顯的限制作用。例如,科學(xué)技術(shù)迅速發(fā)展,促進(jìn)了現(xiàn)代人類起源的研究,科學(xué)家們?cè)诨⒎肿由飳W(xué)、遺傳學(xué)等方面不斷取得新成果,總地來(lái)看,近幾年獲得的各項(xiàng)現(xiàn)代人類起源研究成果都明顯傾向于“非洲起源說(shuō)”[13]。為什么最早的人類起源于非洲,這難以用地理環(huán)境以外的原因解釋。能量最低原理是自然界一切物質(zhì)運(yùn)動(dòng)所必須遵循的自然法則,大到每一個(gè)化學(xué)反應(yīng),小到原子核外的電子運(yùn)動(dòng),無(wú)不按照這一規(guī)律進(jìn)行。齊普夫定律的理論基礎(chǔ)是“最省力法則”[14]。這一法則也是能量最低原理的一種表現(xiàn)形式。人類受到地理環(huán)境和物理規(guī)律的限制,說(shuō)到底是受到能量最低原理的限制。它使得人類像電子一樣,按照能量從低到高的順序填充地球表面乃至宇宙空間。能量最低原理也是本文的主要思想基礎(chǔ)。
齊普夫定律可以描述單詞在文獻(xiàn)中以及城市在國(guó)家中的分布,文獻(xiàn)可以看成是一維空間,國(guó)家內(nèi)部的人口可以自由流動(dòng)。但國(guó)家并非處于一維空間中,國(guó)家間的人口也不能自由流動(dòng)。國(guó)家分布于地球表面,這是一個(gè)由經(jīng)度、緯度、海拔高度組成的三維空間,但可以近似地看成是二維空間,因?yàn)楹0胃叨扰c地球半徑的比值大約為1:1000,可以忽略不計(jì)。
人類從非洲出發(fā),沿著經(jīng)度變化(自西向東)和緯度變化(自南向北)兩個(gè)基本方向遷徙,當(dāng)然也可能沿著自西南向東北的方向遷徙,這個(gè)方向也可以分解為經(jīng)度變化和緯度變化兩個(gè)基本方向。在遷徙的路上,人類會(huì)組成人口越來(lái)越多的群體;另一方面,人類的人均GDP 又會(huì)越來(lái)越高。也就是說(shuō),“人口”和“人均GDP”也是人類進(jìn)化的兩個(gè)維度。人口越來(lái)越多的方向大致就是經(jīng)度變化的方向,人均GDP 越來(lái)越高的方向大致就是緯度變化的方向。例如,印度、中國(guó)這樣人口較多、較為貧窮的國(guó)家位于非洲的東方,而西歐、北歐這些人口較少、較為富裕的國(guó)家位于非洲的北方。既可以認(rèn)為國(guó)家位于經(jīng)度和緯度組成的二維地理空間中,也可以認(rèn)為國(guó)家位于人口和人均GDP 組成的二維經(jīng)濟(jì)空間中。一個(gè)國(guó)家的人口和人均GDP 的乘積恰巧就是這個(gè)國(guó)家的GDP,因此在二維經(jīng)濟(jì)空間中分析國(guó)家的GDP 是最簡(jiǎn)單直接的方法。
經(jīng)濟(jì)學(xué)中的需求定律描述的人類的產(chǎn)品數(shù)量和價(jià)格之間的規(guī)律,從更底層角度來(lái)講,人類本身也是地球的一種“產(chǎn)品”,同樣也遵循地球的需求定律。我們可以繪制一張“人口GDP圖”,其橫坐標(biāo)表示人口,縱坐標(biāo)表示人均GDP,任何一個(gè)人群——包括家族、企業(yè)、國(guó)家、地區(qū)等——都可以用這張圖上的一個(gè)點(diǎn)表示,點(diǎn)的橫坐標(biāo)與縱坐標(biāo)的乘積就是這個(gè)人群的GDP。如圖1 所示。
圖1 人口GDP 圖的示意圖
在這張圖上,按照冪律分布規(guī)律,人口和人均GDP 成反向變動(dòng)關(guān)系,同一條雙曲線(可以簡(jiǎn)化為從左上角到右下角的斜線)上的點(diǎn)表示GDP 相同的人群,雙曲線的位置越高,線上的人群的GDP 也越高。例如,人群A 和B 位于同一條雙曲線上,它們的GDP 相同;C 位于較低的雙曲線上,它的GDP也較低;D 位于較高的雙曲線上,它的GDP 也較高。
經(jīng)濟(jì)學(xué)中有兩條重要的曲線:需求曲線和供應(yīng)曲線,它們合起來(lái)構(gòu)成了供需關(guān)系。一般來(lái)說(shuō),需求曲線從左上角向右下角延伸,而供應(yīng)曲線從左下角向右上角延伸。在圖1 中,人群A 和人群B 處于同一條需求曲線上,而人群C 和人群D 處于同一條供應(yīng)曲線上。人群A 和人群B 的GDP 大致相同,人群C 和人群D 也有一個(gè)大致相同的變量,這就是人口。小而富的人群和大而窮的人群的GDP 總量差不多,小而窮的人群和大而富的人群的人口總量差不多。
人口GDP 圖既可以分為四格,也可以分為九格、十六格等等,其中最好的劃分方法是劃成九宮格。這是因?yàn)槿祟惖哪X力、體力等各種能力都服從正態(tài)分布,可以大致分為低水平的人、中等水平的人、高水平的人。一般來(lái)說(shuō),一個(gè)國(guó)家的人口多少基于組織能力,人均GDP 則基于科技研發(fā)能力。可以假定這兩個(gè)能力服從正態(tài)分布,因此人口GDP 圖的縱向和橫向都可以分為低、中、高三檔,由此構(gòu)成九宮格,把所有國(guó)家和地區(qū)分為九種類型,如圖2 所示。
圖2 人口GDP 圖中的九宮格
為方便起見,我們把九宮格編上號(hào),從左下角到右上角依次是方格1 至方格9。如前所述,同一條從左上延伸到右下的斜線上的點(diǎn)的GDP 相同,斜線越高GDP 也越高,因此又可以把九宮格分為5 個(gè)GDP 等級(jí),從左下角到右上角逐漸從1 級(jí)升高至5 級(jí),它們的GDP 依次升高。與GDP 等級(jí)類似,還可以把九宮格分為5 個(gè)人口等級(jí),從左上角到右下角逐漸從1 級(jí)升高至5 級(jí),它們的人口依次升高。
至此,我們提出國(guó)家和地區(qū)的個(gè)數(shù)、人口、GDP 的分布的假設(shè)如下:
在以人口為橫坐標(biāo)、以人均GDP 為縱坐標(biāo)的人口GDP 圖中,所有國(guó)家和地區(qū)可以劃分為九宮格,九宮格內(nèi)的國(guó)家和地區(qū)個(gè)數(shù)、人口、GDP 符合指數(shù)分布,可以用三個(gè)指數(shù)函數(shù)表示。
指數(shù)函數(shù)一:國(guó)家和地區(qū)個(gè)數(shù)介于[27-M,29-M]之間,大致等于28-M,其中M 是從1 至9 的整數(shù),是從左下角到右上角的方格序號(hào);
指數(shù)函數(shù)二:假設(shè)方格1 的GDP 為1,那么其余各方格的GDP 介于[2N-2,2N-1]之間,其中N 是從2 至5 的整數(shù),是從左下角到右上角的GDP 等級(jí)。或者,假設(shè)方格9 的GDP 為1,那么其余各方格的GDP 介于[2N-5,2N-4]之間,其中N 是從1至4 的整數(shù),是從左下角到右上角的GDP 等級(jí);
指數(shù)函數(shù)三:假設(shè)方格3 的人口為1,那么其余各方格的人口介于[2L-2,2L]之間,大致等于2L-1,其中L 是從2 至5的整數(shù),是從左上角到右下角的人口等級(jí)。
我們用世界銀行數(shù)據(jù)庫(kù)中2000、2005、2010、2015、2018這五個(gè)年度的各國(guó)人口和人均GDP 數(shù)據(jù)進(jìn)行驗(yàn)證[15][16]。該數(shù)據(jù)中共有217 個(gè)國(guó)家及地區(qū),其中有20 多個(gè)中小國(guó)家和地區(qū)沒(méi)有某年的人均GDP 數(shù)據(jù),采用聯(lián)合國(guó)數(shù)據(jù)[17]或世界銀行數(shù)據(jù)庫(kù)最接近該年的數(shù)據(jù)代替。還有3 個(gè)地區(qū)完全沒(méi)有人均GDP數(shù)據(jù),它們?nèi)丝诤嫌?jì)約為10 萬(wàn)人,即使忽略也影響不大。經(jīng)過(guò)處理后有214 個(gè)國(guó)家和地區(qū)的數(shù)據(jù)。
五年數(shù)據(jù)的劃分閾值及部分方格的具體國(guó)家如表1 所示。每一年都有兩個(gè)人口閾值和兩個(gè)人均GDP 閾值,它們把214個(gè)國(guó)家和地區(qū)劃分為九宮格。請(qǐng)注意方格9 由美國(guó)獨(dú)占,方格8 在2000 年、2005 年是空缺的,在2010 年以后巴西、中國(guó)依次進(jìn)入方格8,2018 年中國(guó)獨(dú)占方格8。
表1 五年數(shù)據(jù)的劃分閾值及部分方格的具體國(guó)家
表2 是五年數(shù)據(jù)的驗(yàn)證情況。表格中有125 個(gè)背景為灰色的數(shù)值,這些數(shù)值可以驗(yàn)證實(shí)際數(shù)值是否符合指數(shù)函數(shù)。其中有15 個(gè)加粗的數(shù)值,它們是不符合假設(shè)的數(shù)值。2000 年、2005 年方格8 的各項(xiàng)數(shù)值為0,這是因?yàn)樵摲礁袷强杖钡摹?/p>
表2 五年數(shù)據(jù)的驗(yàn)證情況
表3 是五年總的驗(yàn)證情況,各年的準(zhǔn)確率(相符數(shù)據(jù)個(gè)數(shù)與總數(shù)據(jù)個(gè)數(shù)的比值)在80%至96%之間波動(dòng),平均值是88%。
表3 五年總的驗(yàn)證情況
在15 個(gè)不符合的數(shù)據(jù)中,方格8 占了8 個(gè),方格7 占了5個(gè),不符合的數(shù)據(jù)主要集中在這兩個(gè)方格。方格8 在2000 年、2005 年是空缺的,2010 年巴西進(jìn)入方格8,但它的GDP、人口都達(dá)不到方格8 的指數(shù)函數(shù)值。直到2015 年,巴西、中國(guó)組成的方格8 才達(dá)到指數(shù)函數(shù)值。在2018 年,中國(guó)一國(guó)就可以使方格8 達(dá)到指數(shù)函數(shù)值。也就是說(shuō),2000 年、2005 年、2010 年的方格8 空缺或者數(shù)值偏低,是因?yàn)楫?dāng)時(shí)中國(guó)的GDP明顯偏低。這段時(shí)間也是中國(guó)GDP 高速發(fā)展的時(shí)期,似乎是在填補(bǔ)方格8 的空缺,實(shí)際上2018 年中國(guó)一國(guó)就完全填補(bǔ)了這一空缺。方格7 的函數(shù)值與實(shí)際值差距較大,也是因?yàn)槠渲械膰?guó)家——主要是印度——的GDP 明顯偏低。目前印度的GDP 發(fā)展較快,可以預(yù)見在不遠(yuǎn)的將來(lái)方格7 的指數(shù)函數(shù)值與實(shí)際值就會(huì)相符。
從時(shí)間的角度來(lái)說(shuō),2010 年的準(zhǔn)確率最低,這是因?yàn)?008 年爆發(fā)了全球經(jīng)濟(jì)危機(jī),世界經(jīng)濟(jì)格局處于劇變之中,因此準(zhǔn)確率較低。
由此可見,國(guó)家及地區(qū)的個(gè)數(shù)、人口、GDP 基本符合指數(shù)分布,但國(guó)家及地區(qū)處于動(dòng)態(tài)變化之中,有的上升、有的下降、有的解體、有的合并,有時(shí)還會(huì)出現(xiàn)全球經(jīng)濟(jì)危機(jī),因此會(huì)出現(xiàn)局部、短期不符合指數(shù)分布的情況。
根據(jù)以上三個(gè)公式可以推出世界上的國(guó)家和地區(qū)總數(shù)、人口總數(shù)和GDP 總值,它們可以用四個(gè)推論來(lái)描述。
推論一:根據(jù)指數(shù)函數(shù)一,用28-M 模擬九個(gè)方格中的國(guó)家和地區(qū)個(gè)數(shù),累加起來(lái)得到255.5,這就是指數(shù)函數(shù)預(yù)測(cè)的國(guó)家和地區(qū)總數(shù)。實(shí)際上國(guó)家和地區(qū)總數(shù)為兩百多個(gè)。
推論二:根據(jù)指數(shù)函數(shù)一可知,國(guó)家和地區(qū)的個(gè)數(shù)在1 倍、2 倍、4 倍之間來(lái)回波動(dòng)。實(shí)際上,中國(guó)在從秦朝至今兩千多年的歷史中分分合合,絕大多數(shù)時(shí)間都是1 至4 個(gè)國(guó)家和地區(qū)。彼得-圖爾欽利用歷史動(dòng)力學(xué)建立的模型也得出類似的結(jié)論:在一個(gè)模擬空間中相對(duì)穩(wěn)定的帝國(guó)個(gè)數(shù)在1 個(gè)、2 個(gè)、4 個(gè)之間來(lái)回波動(dòng)[18]。
推論三:根據(jù)指數(shù)函數(shù)二,假設(shè)方格9 的GDP 為1,把各方格的GDP 的范圍[2N-5,2N-4]累加起來(lái),得到GDP 總值的范圍是[3.0625,5.125],即方格9 的GDP 是GDP 總值的20%至33%。實(shí)際上在1960 年至2018 年的59 年中,方格9(即美國(guó))GDP 占世界的比值介于21%至39%之間,平均值為29.4%[2]。
推論四:根據(jù)指數(shù)函數(shù)三,假設(shè)方格3 的人口為1,用2L-1 模擬各個(gè)方格的人口,累加起來(lái)得到49,也就是說(shuō),人口總數(shù)是方格3 的49 倍。實(shí)際上五年的總?cè)丝谂c方格3 人口的比值在49 左右來(lái)回波動(dòng),平均值是53.3。
可見,四個(gè)推論的數(shù)值接近于實(shí)際數(shù)值。
本文的分布模型說(shuō)明:地球上的200 多個(gè)國(guó)家和地區(qū)構(gòu)成一個(gè)整體,國(guó)家及地區(qū)的個(gè)數(shù)、人口、GDP 是最重要、最基本的三個(gè)變量。這三個(gè)變量看似復(fù)雜,但它們都受地理和物理規(guī)律的限制,可以用簡(jiǎn)單的指數(shù)函數(shù)描述。在分析過(guò)程中應(yīng)把正態(tài)分布、冪律分布、指數(shù)分布結(jié)合起來(lái)。本模型對(duì)于地理、歷史、人口、經(jīng)濟(jì)、政治等學(xué)科的交叉學(xué)科的研究有啟發(fā)作用,可以對(duì)一些老問(wèn)題提出新解釋,或者對(duì)未來(lái)作出預(yù)測(cè)。
例如,蘇聯(lián)解體的原因很多,從本模型的角度來(lái)說(shuō),蘇聯(lián)從1 個(gè)國(guó)家解體為15 個(gè),這使得國(guó)家和地區(qū)總數(shù)更接近于255.5。又如,中國(guó)、印度之所以發(fā)展速度很快,從本模型的角度來(lái)說(shuō),是因?yàn)榉礁? 和方格7 空缺或者GDP 偏低。隨著這兩個(gè)方格的數(shù)值逐步達(dá)到指數(shù)函數(shù)值,GDP 增速也會(huì)放緩。