據(jù)合眾國際社(UPI)的報(bào)道,麻省理工學(xué)院通過裝有促銷銷售日期和每周利潤的數(shù)據(jù)庫測試了一個計(jì)算機(jī)系統(tǒng)——“數(shù)據(jù)科學(xué)機(jī)器”(The Data Science Machine),并認(rèn)為該系統(tǒng)在數(shù)據(jù)模式發(fā)現(xiàn)方面優(yōu)于人類。
通常,人類在模式識別領(lǐng)域的表現(xiàn)優(yōu)于計(jì)算機(jī)。直到現(xiàn)在,數(shù)據(jù)分析和數(shù)據(jù)挖掘過程還需要人工介入。但麻省理工的科學(xué)家們認(rèn)為他們可能已經(jīng)破解人類完成模式識別任務(wù)的密碼,并聲稱他們的“數(shù)據(jù)科學(xué)機(jī)器”在大數(shù)據(jù)分析和模式提取方面比人類速度更快且更可靠。他們的機(jī)器參加過三次和人的比賽,任務(wù)是通過N種算法對幾個月的數(shù)據(jù)進(jìn)行模式預(yù)測。“數(shù)據(jù)科學(xué)機(jī)器”預(yù)測的準(zhǔn)確率分別為94%、96%和87%。其中一次比賽中,“數(shù)據(jù)科學(xué)機(jī)器”與906人組成的團(tuán)隊(duì)對抗,最后機(jī)器戰(zhàn)勝了其中的615人。報(bào)告稱計(jì)算機(jī)通過使用一些數(shù)字標(biāo)識符試圖找到數(shù)據(jù)中的相關(guān)關(guān)系,然后更新標(biāo)識符,繼續(xù)緊縮數(shù)據(jù),隨后,機(jī)器改進(jìn)其過程并開始分辨數(shù)據(jù)中的趨勢。
這些測試如果成功,將大大減輕人類的工作量,特別是數(shù)據(jù)分析方面的工作量。目前,“數(shù)據(jù)科學(xué)機(jī)器”在預(yù)測學(xué)生是否會放棄在線課程方面已經(jīng)有了較高的準(zhǔn)確度,但是系統(tǒng)至少需要兩套算法才能做出預(yù)測。它需要分析學(xué)生在在線課程上所花的時間以及學(xué)生在截止日期前花在作業(yè)上的時間。哈佛大學(xué)的一位計(jì)算機(jī)科學(xué)家認(rèn)為,這類新機(jī)器不僅能解決問題,還能為如何看待問題提供不同的視角。
http://www.themarketbusiness.com
謝 洵 編譯
(本欄目由北京師范大學(xué)遠(yuǎn)程教育研究中心、交互媒體與遠(yuǎn)程學(xué)習(xí)實(shí)驗(yàn)室同本刊合辦)