楊雪
近日,由北京大學(xué)人工智能研究院和北京通用人工智能研究院聯(lián)合組成的科研團隊完成最新研究成果——“人類水平的小樣本概念學(xué)習(xí)”,并在國際頂級學(xué)術(shù)期刊《科學(xué)·進展》發(fā)表論文。這一成果首次讓AI系統(tǒng)在沒有大數(shù)據(jù)訓(xùn)練的情況下,像人類一樣通過概念學(xué)習(xí)和邏輯推理的方式完成任務(wù),并在經(jīng)典智商測試中戰(zhàn)勝了高智商人類選手。這是由我國科學(xué)家獨立完成,并在國內(nèi)實現(xiàn)的AI高水平研究成果,標志著中國在邁向通用AI的道路上更進一步。
那么,與當前主流AI相比,小樣本AI有何不同與優(yōu)勢?
當前,廣泛應(yīng)用的AI系統(tǒng)主要以海量數(shù)據(jù)為基礎(chǔ),利用大量算力和存力資源進行數(shù)據(jù)搜索,其核心范式是深度學(xué)習(xí)。這類AI在數(shù)據(jù)擬合和感知層面取得了顯著進展,催生了ChatGPT等一批生成式AI應(yīng)用。它們能寫詩作畫、為人答疑解惑,甚至可以協(xié)助藥物開發(fā)。
然而,在擁有這些能力的同時,AI卻無法準確理解因果關(guān)系等邏輯問題。這是因為目前很多AI以大數(shù)據(jù)和深度學(xué)習(xí)為核心范式,十分依賴數(shù)據(jù)數(shù)量和標注質(zhì)量,無法對問題進行快速、準確、細致的推理。尤其是面對數(shù)據(jù)匱乏或僅有少量數(shù)據(jù)和抽象概念等情況,目前的AI更是無能為力。
北京大學(xué)人工智能研究院助理教授朱毅鑫解釋,目前很多AI大模型是對數(shù)據(jù)的擬合,其“記憶力”很強,但遷移泛化能力有限。“就好比說,如果它之前見過A、B,那么下次再見到A、B,它能認識,甚至見到與之類似的A′、B′它也能認識。但如果見到的是C,它就認不出來了?!敝煲泠握f。
北京通用人工智能研究院研究員張馳認為,目前大多數(shù)AI以大數(shù)據(jù)和深度學(xué)習(xí)為核心范式,效率較低、成本較高。出于成本考量,在算力和高質(zhì)量數(shù)據(jù)緊缺的背景下,這種范式難以真正實現(xiàn)通用AI。
那么,是否存在另外一種人工智能范式,較好地解決上述問題?聯(lián)合科研團隊另辟蹊徑,借鑒了北京大學(xué)人工智能研究院教授朱松純在20世紀90年代提出的最大最小熵思路。他們將問題化為易于求解的優(yōu)化問題,并將其描述為概率條件下的熵限制問題。利用這種思路,聯(lián)合科研團隊讓機器快速迭代和建模,獲得了既容易得到又具可解釋性的問題解決模型。
在朱毅鑫看來,小樣本是邁向通用AI的另一路徑。小樣本的“小”并不是不需要數(shù)據(jù),而是希望通過提高數(shù)據(jù)利用率,實現(xiàn)舉一反三。“就和做口算一樣,你不可能把所有的題都練一遍。但學(xué)會基本原理后,就能觸類旁通。”朱毅鑫說,小樣本AI有著較為廣泛的應(yīng)用前景,如可應(yīng)用于醫(yī)療、航空航天等樣本較少或幾乎沒有樣本的場景。