米蘭
在終極的分析中,一切知識(shí)都是歷史;在抽象的意義下,一切科學(xué)都是數(shù)學(xué);在理性的基礎(chǔ)上,所有判斷都是統(tǒng)計(jì)!
這段讓人感觸頗深的話是筆者從《SAS技術(shù)內(nèi)幕》的扉頁上讀到的。
2019年初,清華大學(xué)出版社出版了一本數(shù)據(jù)分析著作《SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家》,作者為數(shù)據(jù)分析行業(yè)巨頭SAS中國研發(fā)中心技術(shù)總監(jiān)巫銀良先生,作序者為北京大學(xué)信息科學(xué)技術(shù)學(xué)院博導(dǎo)張銘教授。
作為數(shù)據(jù)分析專業(yè)性的SAS著作,該書至今在當(dāng)當(dāng)網(wǎng)上依然顯示為100%的好評(píng),實(shí)屬難能可貴。循序漸進(jìn)掌握數(shù)據(jù)分析要義和精髓,從數(shù)據(jù)中獲取洞見和智慧,應(yīng)當(dāng)是該書著作者的核心宗旨。
獲得業(yè)內(nèi)大咖聯(lián)袂推薦的《SAS技術(shù)內(nèi)幕》分上下兩卷。上卷著重介紹SAS程序的語法與實(shí)踐,下卷著眼于統(tǒng)計(jì)學(xué)以及數(shù)據(jù)分析相關(guān)內(nèi)容的介紹以及在SAS程序上的應(yīng)用。正如該書的副標(biāo)題“從程序員到數(shù)據(jù)科學(xué)家”,它確實(shí)很好地為廣大程序員和數(shù)據(jù)分析師架起了一座橋梁。
書中的知識(shí)點(diǎn)很好地兼顧了系統(tǒng)性、邏輯性和易讀性:程序員需要了解的SAS編程知識(shí),數(shù)據(jù)分析師需要了解的統(tǒng)計(jì)、數(shù)據(jù)分析相關(guān)理論,該書都有很全面的介紹。同時(shí),知識(shí)的引入、切換也順理成章,邏輯性很強(qiáng)。更妙的是,書中所帶豐富的代碼示例,讓讀者可以輕松上手,自助學(xué)習(xí)、實(shí)踐和調(diào)試。代碼所用的數(shù)據(jù)大部分都源自系統(tǒng)自帶,或通過簡單幾行代碼創(chuàng)建,盡量照顧到讀者使用該書進(jìn)行練習(xí)的便捷性。
該書上卷第2章詳細(xì)介紹了SAS傳統(tǒng)的DATA步,并在第7章引入了SAS的第二代數(shù)據(jù)處理步DS2的介紹;在第12章到第17章,則分別介紹了不同數(shù)據(jù)結(jié)構(gòu)在SAS編程中的應(yīng)用。
下卷第18章在介紹統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)時(shí),加入了詳盡的SAS產(chǎn)品與過程步概覽,涵蓋了幾乎所有的BASE SAS和SAS/STAT過程步。讀者不僅能從書中學(xué)到相關(guān)的統(tǒng)計(jì)學(xué)知識(shí),而且可以把它當(dāng)成常備工具書使用。
作者在一些章節(jié)不時(shí)為讀者對(duì)知識(shí)點(diǎn)進(jìn)行總結(jié),譬如第20章的附錄 (P403:各統(tǒng)計(jì)分布之間的關(guān)系) 揭示了統(tǒng)計(jì)分布之間的簡明清晰的邏輯關(guān)系,便于讀者記憶和理解(如圖2)。
該書最后一章詳細(xì)論述了圓周率? 的高精度求解方法與探索分析,令人嘆為觀止。該書附錄提供了業(yè)界最精確完整的統(tǒng)計(jì)學(xué)查表及其制作方法,涵蓋二項(xiàng)分布,泊松分布,標(biāo)準(zhǔn)正態(tài)分布的累積概率表以及 t 分布, 分布,F(xiàn) 分布不同顯著性水平 α 下的臨界值表。
該書涉及的知識(shí)內(nèi)容全面,知識(shí)層次由淺入深,同時(shí)也涵蓋技術(shù)和分析領(lǐng)域的前沿科技,無論是初學(xué)者,還是相關(guān)領(lǐng)域從業(yè)者,都會(huì)從本書中得到不同程度的收獲。
責(zé)編/龐貝