郝進欣,劉紅玲,蔡紹洪
1.貴州大學(xué)理學(xué)院,貴州 貴陽 550025
2.貴州師范學(xué)院物理與電子科學(xué)學(xué)院,貴州 貴陽 550018
3.貴州財經(jīng)學(xué)院經(jīng)濟系統(tǒng)仿真重點實驗室,貴州 貴陽 550004
人類行為遍布我們生存空間的方方面面,研究和理解人類行為有重要的社會和經(jīng)濟意義。人類對于自身行為的研究近百年來一直未曾停止過,隨著計算機技術(shù)、網(wǎng)絡(luò)通信和數(shù)據(jù)庫技術(shù)的快速發(fā)展,大量人類行為發(fā)生的準確時間被記錄下來,這就為建立人類動力學(xué)行為理論奠定了基礎(chǔ)。特別是近幾年,人類動力學(xué)的研究有了飛速的發(fā)展,亦是得益于此。
最初的研究普遍把人類行為的時間性簡化為用泊松過程描述的隨機穩(wěn)態(tài)過程,這種假設(shè)的直接推論是兩次相繼行為之間的時間間隔較為均勻,呈指數(shù)分布,大量事件的集中爆發(fā)與長期靜默都很難出現(xiàn)。故而泊松過程可以直接應(yīng)用在粗略地刻畫人類活動時,如模擬交通流量的模式或事故發(fā)生頻率、商業(yè)話務(wù)中心的配置、庫存管理、以及估計移動通信中占線的電話數(shù)量等。這是以泊松過程假設(shè)為基礎(chǔ)進行的經(jīng)典的人類動力學(xué)研究。但Barabási等人的研究中卻顯示,大量由人類活動驅(qū)動的系統(tǒng),具有明顯偏離泊松過程的性質(zhì),即人類常在短時間內(nèi)密集從事某事,而后又在很長的時間里將其束之高閣,這些現(xiàn)象對基于泊松過程的假設(shè)提出了反思。
人類在通訊方面的行為,是人類溝通交流的重要行為方式之一。研究人類在各種通訊行為中的統(tǒng)計特征,能夠較好地反映人類自身的行為特點,為進一步的應(yīng)用提供幫助。
圖1 用戶發(fā)送電子郵件時間間隔分布
本文研究了某大型社區(qū)150人之間商業(yè)、社區(qū)活動、友誼圈等的電子郵件通訊行為收發(fā)記錄,統(tǒng)計分析了社區(qū)中個體收發(fā)郵件的數(shù)目、發(fā)送電子郵件的時間間隔、接收電子郵件的時間間隔以及個體回復(fù)郵件的時間間隔,驗證了人類行為在社區(qū)范圍內(nèi),個體層面所對應(yīng)的時間間隔統(tǒng)計特征都具有偏離指數(shù)分布的胖尾現(xiàn)象,可以用冪律函數(shù)很好的擬合。圖1是兩位用戶發(fā)送電子郵件時間間隔分布,圖2是典型兩位用戶接收電子郵件時間間隔分布。采用雙對數(shù)坐標作圖,橫坐標為時間間隔τ,縱坐標為相應(yīng)的頻率次數(shù)p(τ),方點為實證數(shù)據(jù),直線為擬合的冪函數(shù),各冪指數(shù)標度α如圖所示。
圖2 用戶接收電子郵件時間間隔分布
國外的Oliveira等人和Vázquez等人研究了達爾文、愛因斯坦和弗洛伊德的個人書信記錄,記錄包含以天為單位的書信收發(fā)時間。發(fā)送時間、回復(fù)時間分布是指連續(xù)兩封書信發(fā)出或回復(fù)的時間間隔。采用了雙對數(shù)坐標,橫坐標為時間間隔τ,縱坐標為相應(yīng)的概率p(τ),圖3給出了達爾文、愛因斯坦信件的回復(fù)時間分布,通過切除胖重彌散的尾部,發(fā)現(xiàn)它們幾乎都滿足指數(shù)為1.5 的冪律分布。
圖3 個人信件的回復(fù)時間分布
國內(nèi)的李楠楠等人統(tǒng)計了錢學(xué)森、魯迅等人的個人信件記錄[1],同樣以天為單位分析了兩位所寫的連續(xù)兩封信件之間的時間間隔。通過分析發(fā)現(xiàn)兩位寫信的間隔時間和回復(fù)時間分布都具有冪律的特性(圖4)。隨后,曹盼盼等人統(tǒng)計了茅盾、傅雷、陶行知和胡適等人的信件[2],采用漂移冪律分布模型,最優(yōu)擬合得到寫信時間間隔,也都發(fā)現(xiàn)了類似的統(tǒng)計特征。
圖4 錢學(xué)森個人信件的回復(fù)時間(左圖)和寫信間隔時間分布(右圖)
Julián Candia等人研究了六百萬手機用戶手機通話一個月的通話記錄。這里面有的用戶一個月只有幾次通話記錄,而有的產(chǎn)生了成百上千次記錄。根據(jù)通話個體通話總數(shù)的多少,分組研究各用戶連續(xù)兩次通話的時間間隔。其分布都服從帶指數(shù)截斷的冪律,整體上冪指數(shù)為0.9,截斷值約為48天。
圖5 手機通話時間間隔的分布
中國科技大學(xué)的洪偉等對手機用戶志愿者短消息通訊行為進行了研究。研究統(tǒng)計了多名志愿者手機短消息通訊記錄,時間從3個月到6個月不等。結(jié)果顯示各志愿者發(fā)送短消息時間間隔分布都接近冪律分布,只是指數(shù)略有不同。趙志丹等分析了真實生活中2006年中國農(nóng)歷新年期間6326713位用戶的37577781條記錄的短消息交流的大量數(shù)據(jù)。結(jié)果顯示,發(fā)送短消息的數(shù)目,兩次發(fā)送、回復(fù)短信息交流的時間間隔都服從冪律胖尾分布。圖6給出了某一用戶發(fā)送短消息的時間間隔分布。
圖6 雙對數(shù)坐標下的發(fā)送短消息時間間隔分布
綜合以上幾種情況我們可以看出,在人類通訊行為中相繼兩次行為的時間間隔分布普遍存在著p(τ) ~τ?α的冪律分布,在雙對數(shù)坐標下體現(xiàn)為標度α的直線。不同通訊方式、不同用戶的分布指數(shù)α各不相同,基本上都介于1至3之間;另外就是在沒有截斷尾部的情況下,都出現(xiàn)了胖尾特征,這也與經(jīng)典的人類動力學(xué)泊松假設(shè)的指數(shù)尾部不同。由此可見,這確實和Albert Barabási分析的結(jié)果有相似性,滿足陣發(fā)性的冪律分布,而非經(jīng)典的時間間隔幾乎均勻的泊松分布。
目前,人類通訊行為的實證研究范圍已遠遠超出了傳統(tǒng)的通訊形式網(wǎng)絡(luò),像QICQ即時通訊、網(wǎng)絡(luò)論壇BBS、個人博客[3]、在線電影點播[4]以及在線游戲、在線社區(qū)、在線交友等等也成為研究的對象。以上這些對于人類通訊行為的研究都是針對行為時間性的統(tǒng)計,另外,系統(tǒng)科學(xué)工作者把人類行為空間性的研究也納入了系統(tǒng)科學(xué)的研究范疇,利用出租車網(wǎng)絡(luò)、公交車網(wǎng)絡(luò)、飛機出行等來研究人類行為的統(tǒng)計特征。
近幾年來,關(guān)于人類行為的研究吸引了物理學(xué)、數(shù)學(xué)、系統(tǒng)科學(xué)、生物學(xué)、社會科學(xué)等各方面的人才。大家從不同的角度研究人類行為,共同促進經(jīng)濟發(fā)展和社會進步,物理學(xué)者則側(cè)重探求其統(tǒng)計特性和動力學(xué)機制。一些經(jīng)驗結(jié)果顯示出大量人類行為時間序列服從非泊松分布。本文首先分析了某大型社區(qū)的電子郵件網(wǎng)絡(luò),利用電子郵件的收發(fā)記錄研究其統(tǒng)計特性,然后結(jié)合普通書面信件通訊、手機通話通訊和短信息通訊等通訊行為,概括出人類通訊行為的統(tǒng)計特性,即冪律與胖尾。
[1]李楠楠,張寧,周濤.人類通信模式中基于時間統(tǒng)計的實證研究[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(3):43-46
[2]曹盼盼,閻春寧等,人類通信模式的冪律分布和Zipf定律[J],復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2009,6(4):1-6.
[3]郭進利.博客評論的人類行為動力學(xué)實證研究和建模.計算機應(yīng)用研究, 2011,28(4):1422-1424.
[4]周濤.在線電影點播中的人類動力學(xué)模式[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(1):1-5.