字星運
摘 要:隨著近年來信息時代的到臨,數(shù)據(jù)也變得越發(fā)的重要起來。逐漸,數(shù)據(jù)等級結(jié)構(gòu)分析的方法開始出現(xiàn),多層模型數(shù)據(jù)分析技術(shù)也隨之應(yīng)運而生。顧名思義,多層模型是在單層模型技術(shù)分析的基礎(chǔ)上發(fā)展起來,也具有單層模型不可比擬的優(yōu)勢,分析數(shù)據(jù)時多層模型比單層模型更加全面,實用性更加廣泛,使用起來也更加的靈活多變。本文將簡要的闡述多層模型在社會科學(xué)中的應(yīng)用基本原理,以及使用多層模型所具有的優(yōu)勢。
關(guān)鍵詞:多層模型;社會科學(xué);應(yīng)用
由于我國經(jīng)濟的迅速發(fā)展,人口的轉(zhuǎn)移與遷移也越來越頻繁。一般進行人口普查的時候都會采取大規(guī)模的社會調(diào)查方法,多層次、分步驟的進行樣本的采集[1]。這樣,就是得到的人口數(shù)據(jù)龐大而具有層次性。運用以往的統(tǒng)計方法對這些數(shù)據(jù)進行分析的話,無法得到精確和準(zhǔn)確的答案,因為,往往會將高層的數(shù)據(jù)與底層的數(shù)據(jù)混合在一起統(tǒng)計。為了得到更加科學(xué)、準(zhǔn)確的數(shù)據(jù)分析,在社會科學(xué)領(lǐng)域中運用多層模型進行統(tǒng)計的方式就越來越受到關(guān)注了。
一、多層線性模型
在社會科學(xué)的研究中,收集而來的數(shù)據(jù)往往具有多層次的特點,不僅會描述調(diào)查個體的變量,還會出現(xiàn)更高一層的變量,這樣的變量一般都是以組合的形式出現(xiàn)[3]。具有這樣特點的結(jié)構(gòu)數(shù)據(jù)在測量的時候可以看作為一個具有層次結(jié)構(gòu)的數(shù)據(jù),第一水平為測量的不同種類,第二水平為個體或組合,這樣重復(fù)的測量數(shù)據(jù)就擴大了多層模型的使用范圍。在社會科學(xué)領(lǐng)探究之中,像人口調(diào)查數(shù)據(jù)就是典型的分層數(shù)據(jù),一般考慮的變測量為社會經(jīng)濟地位,職業(yè)、住址等,第一水平的設(shè)定是每個公民個人,第二水平則是每個不同的社區(qū)。也就是說,對帶有層次特征的數(shù)據(jù)分別在每一個層級進行討論,并分別設(shè)立模型,再通過高層變量對底層方程的截距和變量施加影響來達(dá)到相互聯(lián)系的目的[2]。使用多層模型不僅能考慮到不同水平的變異,還能在模型的假設(shè)上與實際情況更加一致,并得出更加合理的答案,也更加正確的揭示了事物之間的變量關(guān)系。
二、多層線性模型運用的基本原理
多層模型運用的基本原理是:將變量中的變異分解為兩部分,一部分是同一個群體之中的個體差異;另一個部分則是不同群體之間的個體差異,通過分解變異區(qū)分多層模型中的群體效果及個體效果,并揭示群體與個體之間的變量關(guān)系[1]。
(一)無條件平均模型
比如人口普查,我國的人口普查是社區(qū)以家庭為單位的進行統(tǒng)計,最后匯總到統(tǒng)計局的數(shù)據(jù)往往都是具有家庭和社區(qū)兩層結(jié)構(gòu),社區(qū)由千萬個家庭組合而成,家庭由存在于各個社區(qū)之中,兩者之間任何一方產(chǎn)生變量另一方也隨之發(fā)生變化。首先對該數(shù)據(jù)進行無條件平均模型進行回歸分析,假設(shè)該模型沒有產(chǎn)生任何變量,然后運用公式進行數(shù)據(jù)的分析,然后要注意三個方面:第一,群體會因變量的變異而產(chǎn)生明顯的變異,在人口普查的時候,沒有被調(diào)查的或者是無法接受調(diào)查的社區(qū)層次的隨機變量的變異成分明顯不等于零時,那么因變量就會隨著群體的變異而變異,這個時候就需要使用多層線性模型分析了;第二,群體特征對因變量影響的大小;第三,自變量對因變量的解釋能力[4]。
(二)隨機截距模型
然后,在無條件平均模式中加入變量因素,探討個體和群體這兩個因素對因變量的作用。隨機截距模型主要體現(xiàn)的是每個層次的因素之間會缺乏互動性,主要是因為模型假設(shè)了因變量的截距會隨著群體的變異而變異,且每個群體的回歸斜率是固定的前置條件。另一種常用的多層模型則是隨機截距和隨機斜率相結(jié)合的模型。跟隨機截距模型的不同是,它不僅假設(shè)了截距會會因群體變異而變異,還假設(shè)了回歸斜率也會因群體變異而變異,這樣,就允許了不同層次之間的各個因素可以相互互動和影響。比如,在人口普查中,因變量為家庭背景和社區(qū)環(huán)境,在經(jīng)過計算后,這個隨機的因變量值就可以成為統(tǒng)計人員估算社區(qū)環(huán)境對家庭影響大小的依據(jù)。另外,也可以根據(jù)這個因變量估算出,在同等的社區(qū)環(huán)境和家庭影響下,不同想的個體之間可能會存在相同的因素。
(三)隨機截距與隨機斜率模型
反過來,在一些情況下,個體的因素對因變量的影響可能會因群體的不同而不同,也就是允許群體擁有不同的截距和不同的斜率。套用中國的古話則是:近朱者赤近墨者黑。在每次人口普查統(tǒng)計后,統(tǒng)計人員都會發(fā)現(xiàn),每個城市都存在著‘打工村這樣的情況。不僅是因為‘打工村社區(qū)本身就聚集了許許多多的外來務(wù)工人員,更是因為外來的務(wù)工人員在城市‘落腳的時候往往會因為自我對號入座的思想及‘打工村的‘名聲而選擇性的留在‘打工村。另一方面,城市的常住人口也會具有明顯的聚集性。這也就是說,個體的因素對因變量的影響很可能會因為社會環(huán)境的不同而不同。
三、多層線性模型的優(yōu)勢性
將因變量的變異分解為群內(nèi)變異和群間變異并將結(jié)果盡可能的標(biāo)準(zhǔn)化、精確化是多層模型的主要優(yōu)點。運用多層模型,不僅可以分析出社區(qū)和假體因素對家庭個經(jīng)濟地位的影響,還能探討出因變量的變異、自變量對因變量的影響和社區(qū)之間的關(guān)系,從而利于對人口的統(tǒng)計與管理,為城市發(fā)展導(dǎo)向提供了良好的依據(jù)[1]。
(一)多層模型具有區(qū)分不同層次因素對因變量的解釋能力
傳統(tǒng)的線性模型只能對樣本數(shù)據(jù)的一層進行分析,然而,在社會科學(xué)領(lǐng)域當(dāng)中,研究意義更為重要的、更讓人引發(fā)興趣的是家庭層的變量與社區(qū)層的變量之間的交互作用。多層模型也許會因為數(shù)據(jù)的局限性和理論的局限性,在實際計算的時候往往會因為遺漏一些對家庭經(jīng)濟地位至關(guān)重要的因素,導(dǎo)致計算出來的答案往往會出現(xiàn)不符合常理、不符合實際的情況。即使社區(qū)因素的解釋能力強,但是社區(qū)層次的隨機變量變異非?;钴S,要求研究人員仍需要進一步的研究:是否需要在模型中加入其它的重要因素。但是,相對其它模型而言,多層模型能在發(fā)現(xiàn)新的重要因素使能隨時予以加入,并更加完善的表現(xiàn)出不同層次因素對家庭經(jīng)濟地位的影響結(jié)果,并進一步的發(fā)展了社會科學(xué)領(lǐng)域研究模型,完善了研究理論學(xué)識,對社會科學(xué)領(lǐng)域的調(diào)查數(shù)據(jù)也更加精準(zhǔn),結(jié)論也更加準(zhǔn)確、真實。
(二)多層模型運用范圍廣,使用比較的靈活
多層模型的運用范圍很廣,比如,在不同層次的數(shù)據(jù)調(diào)查中,同一個個體的特征在不同時間內(nèi)調(diào)查會顯示其的共性關(guān)聯(lián)性,這樣,就違反了研究中的樣本獨立原則。那么,后期計算出的數(shù)據(jù)必然是不真實的,有些數(shù)據(jù)很有可能重疊計算了。經(jīng)過研究,運用多層模型進行計算,將每個調(diào)查時間作為一個單獨的層次來處理就能克服調(diào)查數(shù)據(jù)的重疊問題、假如一個多層模型的縱向設(shè)計包括了家庭和社區(qū),那么,在實際計算的時候往往要多加一個類別——時間。并且,多層模型的運用是非常靈活的,橫向的因變量不是一成不變的,可以根據(jù)社會發(fā)展中出現(xiàn)的新產(chǎn)物而進行編入,可以隨著時代的發(fā)展而不斷完善。所以,多層模型又稱之為“生長模型”。
四、結(jié)語
綜上所述,隨著社會的不斷發(fā)展,以及人口遷移的加快,對社會科學(xué)領(lǐng)域的研究也越來越深入。但是,社會科學(xué)是一門數(shù)據(jù)非常龐大,統(tǒng)計非常困難,穩(wěn)定性特別弱的學(xué)科。導(dǎo)致社會科學(xué)研究人員在面對龐大的數(shù)據(jù)進行計算的時候,往往會因為公式的運用錯誤,或者是考慮的不周全而導(dǎo)致結(jié)論出錯,或者結(jié)論不夠精準(zhǔn)。經(jīng)過研究人員研究發(fā)現(xiàn),運用多層模型進行數(shù)據(jù)統(tǒng)計是目前最良好的方式,不僅能得到可靠的假定檢驗和參數(shù)估計,還能使研究人員發(fā)現(xiàn)一系列傳統(tǒng)數(shù)據(jù)無法回答,但又具有重要意義的問題。(作者單位:德宏州宏康投資開發(fā)有限公司)
參考文獻(xiàn):
[1] 楊菊華.多層模型在社會科學(xué)領(lǐng)域的應(yīng)用[J].中國人口科學(xué),2006,(3)
[2] 雷靂,張雷.多層線性模型的原理及應(yīng)用[J].首都師范大學(xué)學(xué)報(社會科學(xué)版),2002,(2)
[3] 蔡永紅,姜勤德.統(tǒng)計在社會科學(xué)領(lǐng)域應(yīng)用的新進展及反思[J].統(tǒng)計研究,2006,(2)
[4] 謝美華,黃友泉,董圣鴻等.多層多項Logit模型:原理與應(yīng)用[J].心理學(xué)探新,2013,33(5)