• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      卡方分布的探源

      2018-08-10 10:47彭志發(fā)
      科學(xué)與財富 2018年16期
      關(guān)鍵詞:皮爾遜卡爾統(tǒng)計學(xué)

      彭志發(fā)

      摘 要:卡爾·皮爾遜(KralPearson)是近代統(tǒng)計學(xué)史土最負盛名的統(tǒng)計學(xué)家之一。他在統(tǒng)計理論及統(tǒng)計方法上都做出了極大的貢獻。皮爾遜于1900年提出了卡方檢驗,他不僅導(dǎo)出了測度,而且給出了它的分布,使其成為可計算的??ǚ椒植?(χ2分布)是概率論與統(tǒng)計學(xué)中常用的一種概率分布。k 個獨立的標準正態(tài)分布變量的平方和服從自由度為k 的卡方分布??ǚ椒植汲S糜诩僭O(shè)檢驗和置信區(qū)間的計算。統(tǒng)計學(xué)的發(fā)展表明,對于一系列應(yīng)用來說,卡方的檢驗是一項極其有用的方法,其作用遠遠超過了皮爾遜提出這一概念時所想要解決的特殊問題,在現(xiàn)代統(tǒng)計理論中有著重要的地位。本文對卡方分布的起源進行探索,系統(tǒng)梳理卡方分布的發(fā)展歷程。

      關(guān)鍵詞:卡方分布; 統(tǒng)計學(xué); 卡爾·皮爾遜

      1 引言

      目前國際上統(tǒng)計界流行的觀點是將統(tǒng)計學(xué)分為三大派:經(jīng)典學(xué)派、貝葉斯學(xué)派和信任學(xué)派。經(jīng)典學(xué)派是指由皮爾遜、奈曼等人從本世紀初到四十年代發(fā)展的一套理論和方法,它以概率的頻率解釋為基礎(chǔ),以有抽樣資料為前提,因此又被稱作頻率學(xué)派或抽樣學(xué)派。目前國內(nèi)常見的概率統(tǒng)計教材,大都是講這一學(xué)派的觀點和方法的,所以大家都比較熟悉。而關(guān)于經(jīng)典學(xué)派的皮爾遜,他的一大貢獻就是卡方分布,統(tǒng)計學(xué)一直發(fā)展至今,卡方分布仍然起著非常重要的作用,所以本文對卡方分布的起源進行分析也具有重要的現(xiàn)實意義。

      2 卡方分布的產(chǎn)生

      正當(dāng)皮爾遜作為一位應(yīng)用數(shù)學(xué)教師和科學(xué)哲學(xué)家受到人們的尊敬時,有兩件事改變了他的專業(yè)研究方向。其一是高爾頓的《自然遺傳》在1889年出版,其二是1890年任命韋爾登為大學(xué)學(xué)院動物學(xué)喬德雷爾教席教授[1]。

      2.1 相關(guān)和回歸概念的產(chǎn)生

      《自然遺傳》概括了高爾頓關(guān)于遺傳的相關(guān)和回歸概念以及技巧方面的工作,明確思考了它們在研究生命形式中的可用性和價值。在該書出版那年,皮爾遜在前面提到的那個小俱樂部讀了一篇評論此書的論文,他了解到相關(guān)和回歸的數(shù)學(xué)問題并未弄清。他對高爾頓的相關(guān)概念的含義十分著迷,看到這是一個比因果性更為廣泛的范疇,因果性只是它的極限。它把心理學(xué)、人類學(xué)、醫(yī)學(xué)和社會問題引入數(shù)學(xué)處理的領(lǐng)域。皮爾遜立即決定全力為統(tǒng)計學(xué)這一新學(xué)科奠定基礎(chǔ),他在接著的15年內(nèi)幾乎是單槍匹馬地奮戰(zhàn)在這一前沿領(lǐng)域。韋爾登在1891年初受命后,開始應(yīng)用、拓展、改善高爾頓的測量變異和相關(guān)的方法,以尋求支持達爾文自然選擇理論的論據(jù)。這些工作不久使他在經(jīng)典誤差理論外碰到了一系列難題,這位劍橋動物學(xué)家的數(shù)學(xué)能力是難以解決它們的[2],韋爾登請求皮爾遜幫助。

      皮爾遜結(jié)合準備格雷沙姆講座和大學(xué)學(xué)院統(tǒng)計理論的兩門課程(1891一1896),對來自生物學(xué)、物理學(xué)和社會科學(xué)的統(tǒng)計資料作了圖示的、綜合性的處理,討論了概率理論和相關(guān)概念,并用擲硬幣、抽紙牌和觀察自然現(xiàn)象來證明它們。他引人“標準離差”術(shù)語代替麻煩的均方根誤差,并論述了法曲線、斜曲線、復(fù)合曲線。他關(guān)于變差和相關(guān)的四篇材料發(fā)表在《哲學(xué)學(xué)報》上。他創(chuàng)造出3個、4個乃至n個變數(shù)的正態(tài)相關(guān)的一般理論,揭示出早先探索的斜相關(guān)和非線性回歸的一般理論。

      在之后的日子里,皮爾遜一直在對統(tǒng)計學(xué)進行研究,發(fā)表了上百篇的論文,將統(tǒng)計學(xué)的理論和應(yīng)用更加深入,更加具體化了。皮爾遜發(fā)展了矩量法,又定義了曲線的類型,并討論了曲線的應(yīng)用。在隨后的幾十年中,生物學(xué)家和社會科學(xué)家廣泛應(yīng)用皮爾遜曲線來處理觀察數(shù)據(jù),結(jié)果消除了人們把正態(tài)分布作為生物、物理和社會現(xiàn)象的變差的唯一數(shù)學(xué)模型的信仰。該曲線系在統(tǒng)計理論和實踐中取得了未曾料到的重要性。

      2.2 皮爾遜相關(guān)系數(shù)的產(chǎn)生

      皮爾遜還在高爾頓和韋爾登等人關(guān)于相關(guān)和回歸統(tǒng)計概念和技巧的基礎(chǔ)上,建立了極大似然方法,可以稱為“皮爾遜相關(guān)系數(shù)”。隨后,皮爾遜發(fā)表的論文中將多元正態(tài)相關(guān)的理論幾乎發(fā)展成為一種實用的工具。皮爾遜之后又創(chuàng)造了斜相關(guān)理論和非線性回歸,到了1926年,皮爾遜證明樣本回歸系數(shù)的分布分別是關(guān)于相關(guān)總數(shù)回歸系數(shù)對稱的類型VII分布。盡管相關(guān)和回歸分析的步驟今天不同于皮爾遜和他的同事原先提出的步驟,但是前者是建立在后者的基礎(chǔ)上。皮爾遜在世紀之交采取的步驟無論如何在當(dāng)時來說是開拓性的、富有獨創(chuàng)精神的[3]。

      2.3 卡方分布的產(chǎn)生

      對于用來估計總體參數(shù)的樣本函數(shù)在大樣本中的標準誤差問題的第一個普遍探討,是由皮爾遜和年輕的法國數(shù)學(xué)證明者菲爾翁在“論頻率常數(shù)的可能誤差及隨機選擇對變異性和相關(guān)的影響”一文中給出的。皮爾遜后來發(fā)表了一組文章用來答復(fù)讀者的詢問。哲學(xué)雜志》1900年6月刊載了皮爾遜一篇有名的論文,他在文中引人了一個準則χ2=Σ[(fi-Fi)2/fi] ,它是觀察和假設(shè)之間一致性的量度,用來作為確定概率的基礎(chǔ)。其中差fi-fiχ2 fi-Fi(i=1,2,k) (i=1,.2..,k)以這樣的概率共同地起因于隨機取樣的不可避免的漲落,fi表示在k個互斥范疇第i個中觀察到的頻率,F(xiàn)i 是對應(yīng)的理論頻率。他導(dǎo)出χ2 在大樣本中的取樣分布是k的函數(shù),發(fā)現(xiàn)它是類型三分布的特化形式,現(xiàn)稱為“關(guān)于k一1自由度的χ2 分布”。 χ2 準則開創(chuàng)了統(tǒng)計決策的新紀元,它無疑是皮爾遜在統(tǒng)計理論和實踐方面的最偉大貢獻之一。1904年和1911年,皮爾遜又兩次把他的χ2 準則加以推廣,用來檢驗統(tǒng)計學(xué)的一些問題。

      3.卡方分布的應(yīng)用

      皮爾遜從他1896年關(guān)于相關(guān)和回歸的第一篇基礎(chǔ)論文起就卷入到遺傳和進化的研究中,他充分證明了他的新數(shù)學(xué)工具在解決這些問題中的價值。在“史前人種身高的再建”(1898)和“論親族遺傳定律”中(1898),他導(dǎo)出了各種親族回歸和相關(guān)系數(shù)的理論值,檢驗了高爾頓的身高資料,并提出推廣了的高爾頓親族遺傳定律。他宣稱:“……把全部復(fù)雜的遺傳影響的跡象納人簡單的描述性的陳述中是十分可能的。如果達爾文的進化是與遺傳結(jié)合的自然選擇的話,那么必然可以證明,囊括整個遺傳領(lǐng)域的單一陳述對生物學(xué)來說就象引力定律對天文學(xué)家一樣是劃時代的?!北M管后來,孟德爾學(xué)說牢固確立起來了,但并沒有消除生物統(tǒng)計方法的用途和意義。皮爾遜的卡方分布在生物統(tǒng)計領(lǐng)域還起著重要的作用。

      4.結(jié)論

      皮爾遜對于統(tǒng)計學(xué)領(lǐng)域的作用是不容小覷的,其卡方分布作用也是不可小覷的,其在數(shù)學(xué)領(lǐng)域、統(tǒng)計學(xué)領(lǐng)域,甚至是生物基因領(lǐng)域等等方面,都起著非常重要的作用。通過對卡方分布的起源進行系統(tǒng)的梳理分析,對皮爾遜創(chuàng)作過程的了解熟悉,讓我們了解了數(shù)學(xué)方法的奧妙之處,卡方分布可以從數(shù)學(xué)領(lǐng)域發(fā)展到生物領(lǐng)域,進而發(fā)展到其他領(lǐng)域,這是非常偉大的舉措,是值得我們學(xué)習(xí)的。對于卡方分布的研究還任重而道遠,卡方分布的作用之大,是無法想象的,其應(yīng)用的領(lǐng)域是否還可以擴展是不可知的,還需要學(xué)者們進行進一步的努力和研究。

      參考文獻:

      [1]姚存峰. 卡爾·皮爾遜──數(shù)理統(tǒng)計學(xué)的奠基者[J]. 數(shù)理統(tǒng)計與管理, 2011(4):37-38+65.

      [2]丁海勇, 史文中. 利用卡方分布改進N-FINDR端元提取算法[J]. 遙感學(xué)報, 2013, 17(1):122-137.

      [3]朱祖銳, 陳守全. 卡方分布序列最大值的收斂速度[J]. 西南大學(xué)學(xué)報(自然科學(xué)版), 2016, 38(9):137-142.

      猜你喜歡
      皮爾遜卡爾統(tǒng)計學(xué)
      關(guān)于投稿的統(tǒng)計學(xué)要求
      統(tǒng)計學(xué)符號使用的說明
      卡爾幾歲
      統(tǒng)計學(xué)符號使用的說明
      雨洪滯留措施在梅雨期面臨的挑戰(zhàn)
      現(xiàn)代統(tǒng)計學(xué)之父:卡爾·皮爾遜
      現(xiàn)代統(tǒng)計學(xué)之父:卡爾·皮爾遜
      本刊對來稿中統(tǒng)計學(xué)處理的有關(guān)要求
      一個半世紀后的卡爾·馬克思
      Excel在水文學(xué)教學(xué)中的應(yīng)用
      金川县| 天长市| 花莲市| 余干县| 甘洛县| 富川| 潞西市| 宁蒗| 青岛市| 周宁县| 平罗县| 高雄市| 潞西市| 永年县| 长治县| 莒南县| 营山县| 桐柏县| 军事| 湖北省| 沅陵县| 偏关县| 德保县| 西和县| 金坛市| 嘉黎县| 大方县| 山西省| 白玉县| 墨玉县| 孙吴县| 法库县| 海盐县| 宁安市| 桑日县| 宜丰县| 禄丰县| 繁峙县| 福建省| 宝山区| 扶绥县|