蔣驍飛
這個例子說明,分組比較中都占優(yōu)勢的一方,也許在總評中反而是失勢的一方。
曾有人起訴貝克萊大學,說他們歧視女性,有數(shù)據(jù)顯示他們學校男性錄取率比女性錄取率高。后來校方也給出數(shù)據(jù),雖然從全校來看,男性錄取率比女性高,但從各系來看,女性錄取率都比男性高。后來,經(jīng)法院調查證實貝克萊大學所言不虛,貝克萊大學最終勝訴。這里出現(xiàn)了一件令人匪夷所思的事——各系女性錄取率比男性高,但全校女性錄取率卻比男性低。這究竟是怎么回事?先來看看下面這個簡化的例子,也許能幫助你消除困惑。
假設某大學只有A系和B系,招生時共有130名男生和130名女生報名。A系有50男80女參加考試,錄取10男20女,女生錄取率(20/80)大于男生錄取率(10/50);B系有80男50女參加考試,錄取60男40女,此時,女生錄取率(40/50)仍高于男生錄取率(60/80)。兩系女生錄取率都大于男生錄取率,這是否意味著全校錄取女生的總數(shù)高于男生的總數(shù)呢?你也許會毫不猶豫地給出肯定答案。然而,實際情況并非如此,總共被錄取女生是(20+40)個,總共被錄取男生是(10+60)個,男生多于女生。這意味著,從全???,女生錄取率(60/130)是低于男生錄取率(70/130)的。
這個例子說明,分組比較中都占優(yōu)勢的一方,也許在總評中反而是失勢的一方。大家不要對此迷惑不解,這并不是這個例子有什么高深莫測的地方,而是我們慣常的思維方式存在著一個隱蔽的缺陷——喜歡將局部的階段性的評價相加匯總作為總體的全程性的評價。
再來看一個體育賽事的例子。我們通常用勝率來衡量運動員在某一時期的運動水平,勝率高意味著運動成績好?,F(xiàn)有甲乙兩名運動員,在一個賽季的上半程,甲7戰(zhàn)2勝,乙2戰(zhàn)皆輸,甲的勝率(2/7)高于乙的勝率(0/2);在這個賽季的下半程,甲3戰(zhàn)2勝,乙8戰(zhàn)5勝,此時甲的勝率(2/3)仍高于乙的勝率(5/8)。但從總個賽季來看,甲的勝率(4/10)低于乙的勝率(5/10),階段性評價中占優(yōu)的甲運動員在全程性評價中卻處于了劣勢。
現(xiàn)實中存在不少這樣的現(xiàn)象——某個條件下的兩組數(shù)據(jù),分別討論時都會滿足某種性質,可是一旦合并考慮,卻可能導致相反的結論。英國統(tǒng)計學家辛普森曾深入研究過這種現(xiàn)象,于是人們就把這種局部評價與總體評價相悖的現(xiàn)象稱為辛普森悖論。辛普森曾說過一句發(fā)人深省的話:“量與質是不等價的,無奈的是,量比質容易測量,所以人們總是習慣用量的多少來評定質的好壞。然而,不少事實證明,數(shù)據(jù)其實并沒有我們認為的那么重要、可靠。”
摘自《知識窗》