杜月嬌
“彩云之南,我心的方向……”一首《彩云之南》唱出了世人對(duì)這片凈土的向往之心。伴隨著悠揚(yáng)的歌聲,記者來(lái)到滇池腳下的巍巍學(xué)府——云南大學(xué)。
2015年1月,國(guó)家主席習(xí)近平在考察云南時(shí),為云南的發(fā)展點(diǎn)明了新的定位:“云南要主動(dòng)服務(wù)和融入國(guó)家發(fā)展戰(zhàn)略,闖出一條跨越式發(fā)展的路子來(lái)?!?/p>
諄諄教誨猶如燈塔指明了云大人創(chuàng)新發(fā)展的航向。幾年來(lái),他們始終牢記習(xí)總書(shū)記的殷切囑托,以脫胎換骨之勇氣和自我革新之精神,主動(dòng)融入國(guó)家和地方建設(shè),闖出一條創(chuàng)新發(fā)展的路子。2017年9月,在國(guó)家“雙一流”建設(shè)高校名單中,云南大學(xué)赫然在列。
“被列入‘雙一流是新機(jī)遇,也是新挑戰(zhàn),往后的發(fā)展任重道遠(yuǎn)。”云南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院院長(zhǎng)唐年勝如是總結(jié)“雙一流”帶來(lái)的影響。15年來(lái),他和所帶領(lǐng)的團(tuán)隊(duì)融入在云大跨越發(fā)展的浪潮中,奏響了一曲來(lái)自數(shù)學(xué)與統(tǒng)計(jì)學(xué)的現(xiàn)代創(chuàng)新之歌。
堅(jiān)守初心
——讓數(shù)學(xué)與統(tǒng)計(jì)為民所用
運(yùn)用統(tǒng)計(jì)學(xué)的方法,從某些人的生活特性和生活習(xí)慣所展現(xiàn)的數(shù)據(jù)中找出異常點(diǎn)和影響點(diǎn),以此判斷他有沒(méi)有老年癡呆癥的前兆;
建立數(shù)學(xué)模型,通過(guò)數(shù)據(jù)分析識(shí)別出一個(gè)人的甲狀腺結(jié)節(jié)屬于什么階段;
…………
進(jìn)入唐年勝及其團(tuán)隊(duì)構(gòu)建的研究世界,你會(huì)發(fā)現(xiàn)數(shù)學(xué)和統(tǒng)計(jì)并不是枯燥難懂的數(shù)字和公式,而是人們生活中實(shí)實(shí)在在用到的靈巧工具?!皩?shù)學(xué)搬下高閣,帶入尋常百姓家?!边@其實(shí)是唐年勝最初投入統(tǒng)計(jì)研究的初心,也是他多年堅(jiān)持其中的動(dòng)力源泉。
時(shí)光倒回到20世紀(jì)90年代初,純真樸實(shí)的四川伢子唐年勝還在重慶師范大學(xué)數(shù)學(xué)系攻讀學(xué)士學(xué)位的時(shí)候,有一天在圖書(shū)館里看到統(tǒng)計(jì)學(xué)應(yīng)用于天氣預(yù)報(bào)的相關(guān)文獻(xiàn),瞬間聯(lián)想到家鄉(xiāng)農(nóng)民“靠天吃飯”的疾苦。如果能將所學(xué)應(yīng)用到天氣預(yù)報(bào)上,提高天氣預(yù)報(bào)的準(zhǔn)確度,不就可以幫助家鄉(xiāng)父老乃至全國(guó)農(nóng)民早日擺脫“靠天吃飯”的困境嗎?帶著樸實(shí)的愿望,唐年勝?gòu)拇送渡砥渲?,這一干就是近30年。
近30年間,他從一名普通的本科畢業(yè)生,一路攀爬象牙塔,先后成為云南大學(xué)統(tǒng)計(jì)系理學(xué)碩士、東南大學(xué)數(shù)學(xué)系工學(xué)博士,之后到香港中文大學(xué)心理學(xué)系擔(dān)任副研究員并在統(tǒng)計(jì)系從事博士后研究工作。在此之后還先后成為美國(guó)哥倫比亞大學(xué)醫(yī)學(xué)院博士后研究員、香港浸會(huì)大學(xué)數(shù)學(xué)系訪問(wèn)學(xué)者、美國(guó)北卡羅萊納大學(xué)生物統(tǒng)計(jì)系訪問(wèn)教授……“讀萬(wàn)卷書(shū),不如行萬(wàn)里路。”多年積累,收獲了居于學(xué)科前沿的觀念技術(shù),為他之后帶領(lǐng)云南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院奔涌在相關(guān)學(xué)科理論和應(yīng)用研究浪潮前端奠定了堅(jiān)實(shí)的基礎(chǔ)。
當(dāng)新世紀(jì)的鐘聲敲響,人類進(jìn)入了一個(gè)信息化的時(shí)代。彼時(shí)經(jīng)常流轉(zhuǎn)在國(guó)內(nèi)外統(tǒng)計(jì)學(xué)研究殿堂學(xué)習(xí)進(jìn)步的唐年勝對(duì)國(guó)家在相關(guān)領(lǐng)域的大力舉措和投入發(fā)展有著深刻的體會(huì)。師夷長(zhǎng)技以自強(qiáng),和眾多海外華人及學(xué)子一樣,他也愿意將自己所學(xué)所得帶回祖國(guó)、報(bào)效祖國(guó)。
2005年,唐年勝開(kāi)始全職回到母校——云南大學(xué)擔(dān)任統(tǒng)計(jì)系主任,至此扎根彩云之南,將多年在數(shù)學(xué)與統(tǒng)計(jì)領(lǐng)域收獲的居于前沿的思想和技術(shù)在云山之巔散發(fā)出其特有的光芒。
搬下高閣
——研究成果潤(rùn)澤大地
隨著現(xiàn)代科學(xué)技術(shù)尤其是計(jì)算機(jī)、網(wǎng)絡(luò)信息和生物醫(yī)學(xué)工程等的發(fā)展,大量的數(shù)據(jù)出現(xiàn)在諸如:生物醫(yī)學(xué)、經(jīng)濟(jì)、金融、環(huán)境科學(xué)、醫(yī)療健康等學(xué)科領(lǐng)域,并以前所未有的速度產(chǎn)生和積累。
“從統(tǒng)計(jì)學(xué)的角度來(lái)看,這類大數(shù)據(jù)的主要特點(diǎn)是維數(shù)高,樣本量大但通常小于變量的個(gè)數(shù),并且具有復(fù)雜的相依結(jié)構(gòu)?!比绾伟堰@些高維數(shù)據(jù)準(zhǔn)確利用起來(lái),是唐年勝及其團(tuán)隊(duì)這些年來(lái)一直關(guān)注的焦點(diǎn)。
傳統(tǒng)的統(tǒng)計(jì)分析方法、統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)推斷理論并不能勝任,立足國(guó)際前沿,他們通過(guò)大量的摸索和調(diào)整,創(chuàng)新地提出“懲罰指數(shù)傾斜似然方法”,并在傳統(tǒng)假設(shè)不成立的情況下,利用“懲罰”函數(shù)方法將可能不重要的變量個(gè)數(shù)盡可能地壓縮至可接受的范圍,通過(guò)降低重要變量的個(gè)數(shù)從而巧妙地達(dá)到降維的目的。
為更好地提高效率,唐年勝還帶領(lǐng)團(tuán)隊(duì)與香港中文大學(xué)合作對(duì)超高維齊性分類數(shù)據(jù)提出了獨(dú)立于模型假設(shè)的篩選重要變量的分類自適應(yīng)方法。這一方法的獨(dú)特性在于適用響應(yīng)選擇(Responseselective)抽樣數(shù)據(jù)分析,在1∶1還原數(shù)據(jù)原本屬性情況下,既得到準(zhǔn)確的統(tǒng)計(jì)推斷,還可提高數(shù)據(jù)處理速度。
目前,部分研究成果已成功運(yùn)用于醫(yī)院甲狀腺結(jié)節(jié)的病例篩查中。醫(yī)生只需通過(guò)患者的臨床觀察,輸入其年齡、性別、生活習(xí)慣、C T數(shù)據(jù)等,利用建立的模型,即可快速探測(cè)是否存在甲狀腺結(jié)節(jié)的癥狀,不需要過(guò)度依賴醫(yī)生的經(jīng)驗(yàn),探測(cè)準(zhǔn)確率基本可達(dá)到90%左右。事實(shí)上,這只是唐年勝及其團(tuán)隊(duì)研究應(yīng)用于醫(yī)學(xué)研究領(lǐng)域的“冰山一角”。
針對(duì)生物醫(yī)學(xué)研究中的有序分類數(shù)據(jù)、動(dòng)態(tài)空間數(shù)據(jù)和缺失數(shù)據(jù)等復(fù)雜數(shù)據(jù),唐年勝及其團(tuán)隊(duì)提出了分析處理這類復(fù)雜數(shù)據(jù)的新理論和新方法。特別是,在不假設(shè)不可忽略缺失數(shù)據(jù)機(jī)制模型的具體形式的情況下,找到了估計(jì)方程在給定觀測(cè)數(shù)據(jù)和缺失數(shù)據(jù)示性函數(shù)下的條件期望的一個(gè)非常重要的、簡(jiǎn)潔的公式,該公式是推廣和發(fā)展可忽略缺失數(shù)據(jù)估計(jì)方程的統(tǒng)計(jì)推斷理論的一個(gè)至關(guān)重要的成果。
在日常生活中,我們常常遇見(jiàn)很多統(tǒng)計(jì)數(shù)據(jù)都不同程度的存在部分缺失。針對(duì)數(shù)據(jù)缺失的問(wèn)題,唐年勝及其團(tuán)隊(duì)在假設(shè)缺失數(shù)據(jù)機(jī)制是不可忽略缺失的情況下,提出了查補(bǔ)缺失數(shù)據(jù)的一些新方法,如基于傾斜得分的非參數(shù)查補(bǔ)方法等。模擬研究表明:這些方法對(duì)查補(bǔ)缺失數(shù)據(jù)是非常有效的,可用于處理經(jīng)濟(jì)、金融、心理學(xué)、社會(huì)學(xué)等領(lǐng)域中的缺失數(shù)據(jù)。
“識(shí)別數(shù)據(jù)集中的強(qiáng)影響點(diǎn)或異常點(diǎn)以及評(píng)價(jià)模型微小擾動(dòng)對(duì)統(tǒng)計(jì)推斷的影響是統(tǒng)計(jì)學(xué)中一個(gè)重要的研究領(lǐng)域?!碧颇陝賹?duì)這一重要研究領(lǐng)域展現(xiàn)出極大的興趣?!敖y(tǒng)計(jì)建模就是把可能對(duì)響應(yīng)變量有影響的因素作為協(xié)變量建立一個(gè)簡(jiǎn)單的回歸模型,但是存在一個(gè)自然的問(wèn)題,這些模型假設(shè)是否合理?數(shù)據(jù)與假定的模型是否大致一致等”,對(duì)此唐年勝開(kāi)展了統(tǒng)計(jì)診斷研究,而這正代表了他多年研究的獨(dú)特性。