魏忠
先說一道經常用于公司開發(fā)人員筆試的數學題:有一種傳染病有萬分之一的發(fā)病率,有一種試紙有99%的準確性,一個被測人員用試紙檢測顯示陽性,請問這個人真正被感染的幾率是多少?
這是一道條件概率題,正確的解題思路是這樣的:99%的準確性,一萬人中不準確的人就是100人,那么1萬人中有多少病人呢?1個。100個被誤診的傳染病加上一個真正的傳染病人是被測出來的,其真正的感染率1%量級才對。如果提高試紙的精度為萬分之9999的準確性,一萬個人中就有1個被誤診的,再加上一個真正得病的,如果被這種精確的試紙診斷出來的病的話,還有一半是錯誤的診斷。那么繼續(xù)升高試紙的精度,達到十萬分之99999,一萬個人中就只有0.1人是錯誤的,那么加上一個正確的,如果被檢測到了,就基本是靠譜的了。也就是說,你若希望診斷出一種偶發(fā)的現象,要想得到靠譜的結論的話,基本上是要比“偶發(fā)”高一個數量級的測量精度才行。
1985年,我就讀一所省著名高中的二年級。當時學校連續(xù)兩年從500人中選拔20人和30人去學習計算機程序,我都報了名,卻都被刷下來了。原因很簡單,我的成績還不夠優(yōu)秀。第二年的期中考試,我用一種極限的方法去證明一個等腰三角形的命題,考試又得到了比較差的分數。一天晚自習,數學老師走到我身邊,問我為什么會用代數問題去解幾何題?當時我說出理由并表示根本不服考試的批改時,老師沉默了半晌對我說:“你知道嗎?我找你就是為了這件事。我知道你申請計算機程序班兩次都落選了,我不懂計算機,但我查了很多資料,你用代數方法解那道幾何題的方法就是計算機方法,沒有錯,你今后如果能從事計算機行當會有出息的,但是首先要考上大學,考上好大學?!?/p>
后面30年的事情驗證了老師的看法。我雖然沒有進入計算機專業(yè),卻進入到計算機教研室做畢業(yè)論文,當初被選上計算機程序班的同學后來一個也沒有從事計算機行業(yè),我倒是誤打誤撞進入到了計算機行業(yè)。
上個月,我被一個省級的科技部門作為專家,受邀參與這個省的“技能型大師工作室”評審。看完評審標準,我似乎回到了多年前的那個晚自習,不過今天被評審的大師不會有我當初那么幸運,因為評審標準是:獲得省部級科技進步獎、獲得專利、發(fā)表核心期刊文章、職稱正高級、學歷碩士還是博士……這些考核大學教授的指標竟然一點不改地用在了評價和測試創(chuàng)新性技能大師的身上,結果可想而知。
最近受邀各省市少年編程思維、人工智能等活動,作為專家進行咨詢,我發(fā)現有一些非常值得關注的測試精度問題,以下誤區(qū)是值得警覺的:①少兒人工智能、少兒編程思維,是適合少兒年齡特點的訓練,但絕不是玩具訓練。②多數廠商驅動和產品驅動的此類實驗室或者活動,起點堪憂。多數從事這個行業(yè)教育或者標準的人本身就不是行業(yè)高手,甚至東抄西湊。③數學與邏輯訓練是核心,人工智能的核心算法是深度學習,是矩陣運算,而多數人工智能已經偏離了方向。④圍繞創(chuàng)客和電子類的肌肉訓練越早越好,但玩具化和成品化傾向并不利于篩選和培養(yǎng)真正的天才和普通孩子的真實興趣。⑤藝術與文學的離散思維對創(chuàng)新至關重要,然而無論是“詩詞大會”類大賽,還是名著閱讀類的訓練,如果指征不是創(chuàng)作而是背誦和成績,那么往往訓練越多,腦筋越死。
文章最后說說文章開頭的那類問題,為了避免誤判,我情愿相信用類似邏輯題目的數學題來篩選適合開發(fā)的工程師,而不是靠經驗和成績,這方面數學的試紙往往更準。