作者有幸全程參加了Intel ISEF 2011的大獎評審工作,就親身的感受來對評審的程序和辦法提出自己的理解,供讀者參考。
評委的要求
Intel ISEF的評委都是由志愿者所組成的,很多是本地大學(xué)的教授或其他科技人員,也有從世界各地趕來的科技工作者或科技教師。所有評委的費用都是自理的。當(dāng)然有些團體或機構(gòu)為了大賽的有效性和參與程度也部分資助了一些評審人員的行程費用,但每個評委的工作絕對是義務(wù)的。對評委的要求是至少有相關(guān)競賽領(lǐng)域的博士學(xué)位或者在本領(lǐng)域有超過5年的從業(yè)經(jīng)歷的有碩士學(xué)位的專業(yè)人員,比如工程師、實驗師、科技教師等。
在大賽開始前的幾個月,ISEF開始接受各個領(lǐng)域的評委申請,大賽評委會主席會根據(jù)申請者的科技工作背景來決定是否接受申請。ISEF是英語為主要工作語言的科技大賽,因此評委至少要掌握英語來對參賽者進行面試。每年大賽評委的數(shù)目一般都是不足的,為了保證比賽的公正性,一個作品應(yīng)該被多個評委(至少4~6個)所評審才能真實反映出真正的實力。所以大賽每年都希望能有更多的評委來志愿參與。當(dāng)然,這種模式下會造成評委數(shù)量的不足,比如2011年在生命科學(xué)類的評委數(shù)量就不足,這也會影響評分的公正和大賽的有效性。
評委組織
因為每個評委都是志愿者,所以大會組織者一直在不同的場合表達(dá)對評委的感謝和對志愿科學(xué)工作的尊敬和欣賞。在評委報到的當(dāng)天會有一個20分鐘的評審過程講解和培訓(xùn),因為評委人數(shù)較多,這個培訓(xùn)是不斷循環(huán)的。在培訓(xùn)后會發(fā)給每個評委場地的詳細(xì)地圖并且去自己的學(xué)科所在的會議室報到。
每個學(xué)科會有1~2名資深評委來做學(xué)科評審主席,他們的任務(wù)是負(fù)責(zé)保證這個學(xué)科評審的順利進行,回答一切評委的問題,以及協(xié)助所有評委做本學(xué)科大獎的打分和排名工作。在2天的主要工作中,評審主席會鼓勵評委們互相交流,相互解答問題,唯一的目的是公平、公正地評價每個學(xué)生的工作。評委們被要求認(rèn)真對待每個被評的學(xué)生,交流的時候要平等對待每個孩子,把他們當(dāng)成嚴(yán)肅的科學(xué)工作者來評價他們的工作,而不是帶著自上而下的態(tài)度對待他們??梢赃m當(dāng)?shù)丶右栽u審,但評審過程不是在糾正他們的不足和指導(dǎo)他們。如果你覺得哪個項目很好,評委可以在評審結(jié)束后單獨和選手交流以減少不公平。因為如果你指導(dǎo)了這個學(xué)生,他可能在下一個評委來面試的時候用到剛學(xué)會的知識,這對其他選手是不公平的。
評委的打分準(zhǔn)則
任何做研究的人都應(yīng)該知道,評價一個好的科研論文的基本考查方面是該研究的原創(chuàng)性(novelty)和創(chuàng)新性(innovation),技術(shù)可靠性(technical soundness)和表達(dá)的清晰程度(presentation and clarity)。Intel ISEF的評分標(biāo)準(zhǔn)其實考查的也主要是這幾個方面。因為是中學(xué)生的項目,其實在原創(chuàng)性上要求相對會弱一點,更多注意力是在技術(shù)和工作量方面。18\China Science&Technology Education但不可質(zhì)疑的是,如果是一個比較原創(chuàng)性好的研究,評委應(yīng)該會傾向于給高分。因為研究本身最大的價值是想前人所沒想到的,在一個成熟領(lǐng)域獨辟蹊徑或跨領(lǐng)域地研究新問題,這些都是一個好的項目所力求達(dá)到的。
很多今年來的項目都屬于國際前沿的研究,很多中學(xué)生也開始進大學(xué)實驗室來從事研究。一個好的研究不只是因為你做了超出你年齡的事(盡管這也能加很多分),更重要的是研究者的思路、方法和結(jié)果。并不是說你用了復(fù)雜的技巧或多高級的儀器就說明你是個出色的研究者,那只能說明你掌握了復(fù)雜的技巧和技能,有做一流研究者的潛質(zhì)。因此,不要過度迷信知識超前的作用(知識超前的一個例子就是小學(xué)學(xué)中學(xué)的知識,中學(xué)學(xué)大學(xué)的知識來體現(xiàn)出高于同年齡的解決問題能力)。希望學(xué)生們能夠開闊視野、認(rèn)真鉆研,把研究當(dāng)做自己的興趣(至少是熱愛的工作),而不是僅以得獎為目的的心態(tài)來功利化對待比賽。
打分的科學(xué)
盡管每個評委被要求打分在0~100分之間,但是根據(jù)不同評委的偏好,有的人喜歡打在60~90之間,有的則喜歡在90~98之間……從統(tǒng)計上講,區(qū)間所用越小,越容易產(chǎn)生小的區(qū)別。所以盡管評委被要求給分的區(qū)間盡量拉大,以體現(xiàn)出不同項目的好壞差別,但仍然存在很多問題。大會利用了一個統(tǒng)計學(xué)家自制的統(tǒng)計軟件來直觀地給出絕對分?jǐn)?shù)和這個分?jǐn)?shù)對于打分的人屬于高分還是低分。這個可視化的軟件用來最后辯論和評獎的依據(jù)。也就是說,分?jǐn)?shù)其實不是最后決定成績的唯一因素,而是最重要的參考因素。
為什么要引入討論環(huán)節(jié)而不是平均分?jǐn)?shù)來決定呢?這是因為每個項目一般會收到5~7個評委的評分。一個項目不是每個評委都看過,尤其對于平均分在前面的受到好評的項目,支持的評委要說明為什么這個項目他給了高分。其他評委可以再去重新研究這個項目,如果有不同的意見,最后投票決定。實際上這個環(huán)節(jié)還是比較重要的,有幾個得分比較高的項目是因為有幾個評委的反對,并指出了不足和說服了其他的評委,這樣即使得分比較高,但經(jīng)過評委投票后可能重排它的位置,有些項目也因此失去了得獎的機會。但一些公認(rèn)比較好的項目一般會比較穩(wěn)定地排在前頭。所有這些機制都是為了在最大的可能上提供公平、公正的機會。
對科學(xué)的尊重
對科學(xué)的尊重可以從對科學(xué)研究者的相互尊重談起。大賽中做研究的孩子是主角,這個精神主導(dǎo)著整個比賽。成人在比賽中充當(dāng)著配角,即使是諾貝爾獎獲得者,也坐在孩子們的后面,為他們的努力和成績歡呼。另外一個體現(xiàn)出來的精神是科學(xué)是有趣的,是比較酷的,這樣才能吸引更多的年輕人來從事這個事業(yè)。而整個社會也努力地在營造對科學(xué)的尊重。比如美國總統(tǒng)奧巴馬會親自接見Intel TalentSearch中得獎的中學(xué)生。一個好的社會文化是鼓勵和支持年輕人,為他們創(chuàng)造更多的機會,而不是來過度地把資源分配給已經(jīng)很成功的人或既得利益者。資源的不平衡會扶持權(quán)利,權(quán)利又會用來加深這種不平衡。
希望我們以后的比賽能夠借鑒他們的成功經(jīng)驗,為下一代創(chuàng)造一個更好的環(huán)境。我們國家的希望也在我們的孩子身上。希望他們從小能夠尊重科學(xué),能被社會所尊重和認(rèn)可,讓他們遠(yuǎn)離那種為利益而諂媚型的尊重和虛偽化的認(rèn)同,逐漸培養(yǎng)出一種相互平等尊重的社會文化和民主的科學(xué)精神,這種文化和精神是將每個人都從心里所認(rèn)可和尊重的,也是我們民族的希望所