7月4日—6日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議在上海舉行。國務(wù)院總理李強(qiáng)出席開幕式并致辭。李強(qiáng)強(qiáng)調(diào),要推動(dòng)人工智能更好服務(wù)全球發(fā)展、增進(jìn)人類福祉,并建議要推進(jìn)網(wǎng)絡(luò)、算力、數(shù)據(jù)等普惠化,為廣大中小企業(yè)和普通民眾提供低門檻、低價(jià)格的人工智能服務(wù),實(shí)現(xiàn)更大程度的數(shù)字包容。
人工智能的核心命題是讓計(jì)算機(jī)學(xué)會(huì)完成各類復(fù)雜任務(wù)的知識(shí)。在經(jīng)歷了符號(hào)智能和專用智能等發(fā)展階段后,以O(shè)penAIGPT為代表的大模型技術(shù)建立了通用的模型架構(gòu)和學(xué)習(xí)方法,能夠從大規(guī)模數(shù)據(jù)中持續(xù)學(xué)習(xí)和積累知識(shí),在諸多任務(wù)上表現(xiàn)出強(qiáng)大乃至超越人類的性能,標(biāo)志著人工智能進(jìn)入通用智能階段。
2022年底,OpenAI發(fā)布ChatGPT后,引發(fā)全球關(guān)注。近兩年,大模型技術(shù)突飛猛進(jìn),中國國內(nèi)上演了“百模大戰(zhàn)”。然而,在追逐更“大”模型的熱潮中,我們也需審視,“越大越好”是否是未來發(fā)展的最優(yōu)解。
數(shù)字社會(huì)的關(guān)鍵元器件——大規(guī)模集成電路的發(fā)展,或可為智能社會(huì)大模型技術(shù)的發(fā)展提供一定啟示。如摩爾定律所示,集成電路的成功關(guān)鍵在于晶體管密度的迅速提升,而非僅數(shù)量的持續(xù)增加。通過持續(xù)改進(jìn)制造工藝,電路密度的提升在增強(qiáng)電路性能的同時(shí),也優(yōu)化了能效與成本。對(duì)照至大模型技術(shù),模型規(guī)模的增長確實(shí)帶來了性能提升,但這種提升并非無限制。隨著模型規(guī)模增長,所需的計(jì)算資源與能耗也在迅速提升,這將成為制約大模型發(fā)展的瓶頸。
因此,提升知識(shí)密度——即在給定的計(jì)算資源內(nèi),模型能夠存儲(chǔ)更多知識(shí)、具備更強(qiáng)智能——將成為未來大模型技術(shù)可持續(xù)發(fā)展的重要目標(biāo),亦是實(shí)現(xiàn)大模型普惠發(fā)展的重要路徑。在此背景下,面向大模型技術(shù)的普惠發(fā)展,圍繞極致提升知識(shí)密度,未來有三個(gè)方向值得重點(diǎn)關(guān)注與布局。
一是人工智能科學(xué)化。人工智能科學(xué)化旨在將人工智能從工程實(shí)踐推向科學(xué)理論的形成和系統(tǒng)化發(fā)展,圍繞“算法—架構(gòu)—數(shù)據(jù)”的技術(shù)路線,形成推動(dòng)大模型知識(shí)密度增強(qiáng)的理論基礎(chǔ)。在算法層面,探索模型性能成長規(guī)律,在小模型中高效尋找最優(yōu)數(shù)據(jù)和配置,進(jìn)而外推至大模型。在架構(gòu)層面,探索腦啟發(fā)的模型架構(gòu),顯著降低完成任務(wù)時(shí)參與計(jì)算的神經(jīng)元和計(jì)算量,提高模型的推理計(jì)算效率。數(shù)據(jù)層面,探索可擴(kuò)展、多樣化的高質(zhì)量數(shù)據(jù)構(gòu)造體系,實(shí)現(xiàn)自動(dòng)高效生產(chǎn)、篩選和驗(yàn)證數(shù)據(jù)。
二是計(jì)算系統(tǒng)智能化。計(jì)算系統(tǒng)智能化旨在面向智能技術(shù)優(yōu)化和擴(kuò)展現(xiàn)有硬件和軟件架構(gòu),如底層芯片、操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)通信等,是實(shí)現(xiàn)大模型知識(shí)密度增強(qiáng)的設(shè)施保障。例如,在芯片層面,面向人工智能的專有芯片設(shè)計(jì)是近年來推動(dòng)大模型高效運(yùn)算的重要發(fā)展方向。尤其是目前國際上人工智能芯片設(shè)計(jì)仍處于發(fā)展階段,中國在神經(jīng)網(wǎng)絡(luò)處理單元(即NPU)和類腦芯片等人工智能芯片設(shè)計(jì)方面已形成一定技術(shù)與產(chǎn)業(yè)優(yōu)勢,有望在此方向成為技術(shù)引領(lǐng)者?;谥悄芑能浻布O(shè)施保障,推動(dòng)算力、網(wǎng)絡(luò)、數(shù)據(jù)等資源的高效利用,實(shí)現(xiàn)大模型發(fā)展所需基礎(chǔ)設(shè)施的普惠化。
三是領(lǐng)域應(yīng)用廣譜化。領(lǐng)域應(yīng)用廣譜化旨在推動(dòng)大模型在各專業(yè)領(lǐng)域的應(yīng)用,實(shí)現(xiàn)知識(shí)密度增強(qiáng)的應(yīng)用適配。這意味著,首先大模型需要具備更高的專業(yè)素養(yǎng)。在高價(jià)值應(yīng)用場景,例如科學(xué)發(fā)現(xiàn)、高精尖制造業(yè)等領(lǐng)域,大模型具有低成本持續(xù)探索的優(yōu)勢,但前提是要讓大模型具備超越常規(guī)的專業(yè)能力和決策精度。這需要模型具備對(duì)專業(yè)領(lǐng)域知識(shí)的深度理解。再者,大模型需增強(qiáng)風(fēng)險(xiǎn)管控能力。在高風(fēng)險(xiǎn)應(yīng)用場景,例如自動(dòng)駕駛、醫(yī)療診斷,大模型需要具備極高的情境敏感性、適應(yīng)性以及決策可靠性,從而在盡可能規(guī)避風(fēng)險(xiǎn)的前提下,進(jìn)行高效決策。通過增強(qiáng)大模型在各專業(yè)領(lǐng)域的適配能力,推動(dòng)大模型應(yīng)用的專業(yè)性、穩(wěn)定性、安全性。
通用人工智能的發(fā)展目前尚處于初步發(fā)展階段,距離人工智能技術(shù)的普惠應(yīng)用仍需長期持續(xù)探索與投入。中國作為世界大國,理應(yīng)在人工智能的發(fā)展中做引領(lǐng)者、擔(dān)當(dāng)者和示范者,協(xié)同世界各國,共同走向更加美好的智能未來。