美國OpenAI公司推出語言大模型ChatGPT,被業(yè)界認(rèn)為是人工智能從專業(yè)智能向通用智能演進(jìn)的里程碑事件,具有劃時(shí)代意義。美國科技巨頭紛紛跟進(jìn),微軟推出能處理文本、圖像多種信息的多模態(tài)大模型GPT4,谷歌采用多模態(tài)大模型開發(fā)更具有通用能力的機(jī)器人。大模型有望成為通往通用人工智能的可行途徑,或?qū)⒁l(fā)通用人工智能研究范式的根本性轉(zhuǎn)變,需要加緊布局。我國在人工智能產(chǎn)業(yè)的核心技術(shù)創(chuàng)新生態(tài),“大模型+統(tǒng)一計(jì)算架構(gòu)+圖形處理器”生態(tài)以及數(shù)據(jù)、算法、算力“三位一體”生態(tài)需要加快完善,抓住短暫的窗口期加緊推進(jìn)。
OpenAI成功將大模型技術(shù)轉(zhuǎn)化為人工智能產(chǎn)品,并加快推動(dòng)在各個(gè)場景的商業(yè)化應(yīng)用。大模型將成為智能時(shí)代的“新電力”,為千行百業(yè)提供多樣化、泛在化的云上智能服務(wù)。ChatGPT的出現(xiàn),標(biāo)志著人工智能從研發(fā)各種專用小模型的大練模型時(shí)代,開始邁向研發(fā)超大規(guī)模通用智能模型的煉大模型時(shí)代。
一是大模型將演變?yōu)橹悄軙r(shí)代新型基礎(chǔ)設(shè)施。由于采用“預(yù)訓(xùn)練+微調(diào)”模式,大模型具備良好的拓展性。同一模型只需要針對(duì)不同特定任務(wù)的標(biāo)注數(shù)據(jù)進(jìn)行微調(diào),即可應(yīng)用于不同任務(wù),可具備內(nèi)容創(chuàng)意生成、語言互譯、對(duì)話、搜索、文本分析等豐富功能,在醫(yī)療、營銷、客服、教育、文娛、法律等場景有廣闊的應(yīng)用前景。大模型功能豐富、性能優(yōu)越,將有望成為智能時(shí)代的底層架構(gòu),為各種智能化應(yīng)用提供智能數(shù)據(jù)分析能力,大幅提升人工智能的通用性、實(shí)用性、泛化性。
二是人工智能產(chǎn)業(yè)體系面臨全面重塑。大模型將打破原有的人工智能產(chǎn)業(yè)格局,建立起全新的產(chǎn)業(yè)體系。在基礎(chǔ)設(shè)施層,由云計(jì)算平臺(tái)、人工智能芯片構(gòu)成算力底座。在模型層,主要是由資金實(shí)力雄厚、數(shù)據(jù)資源豐富、技術(shù)能力突出的科技領(lǐng)軍企業(yè)和大型科研機(jī)構(gòu)主導(dǎo),研發(fā)跨場景、多任務(wù)的通用型基礎(chǔ)大模型。在應(yīng)用層,一批深耕特定行業(yè)且積累大量行業(yè)數(shù)據(jù)的新銳科技企業(yè),將使用行業(yè)數(shù)據(jù)訓(xùn)練大模型,調(diào)整模型以滿足特定行業(yè)和場景需求。提供解決方案的企業(yè),將模型封裝到產(chǎn)品,為電商、文娛、醫(yī)療、工業(yè)設(shè)計(jì)等垂直領(lǐng)域用戶提供各種專用化智能服務(wù)。
三是人工智能資源分布格局將迎來深刻調(diào)整。以ChatGPT為代表的大模型,是數(shù)據(jù)、算力、算法“三駕馬車”共同驅(qū)動(dòng)的成果,表現(xiàn)出大算力、高質(zhì)量數(shù)據(jù)與高性能算法三方面優(yōu)勢相互強(qiáng)化、相互促進(jìn)的突出特點(diǎn)。使用超強(qiáng)算力和高質(zhì)量數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,才能得到高性能的模型算法。同時(shí),高性能的模型算法帶來的良好使用體驗(yàn)又吸引新用戶不斷加入,為模型持續(xù)補(bǔ)給高質(zhì)量的用戶使用數(shù)據(jù)。ChatGPT在發(fā)布后5天內(nèi)全球用戶破百萬,2個(gè)月月活躍用戶破億,為研發(fā)團(tuán)隊(duì)帶來超2000萬條高質(zhì)量的用戶使用數(shù)據(jù),這對(duì)于大模型的迭代優(yōu)化至關(guān)重要。在虹吸效應(yīng)影響下,高性能模型算法與高質(zhì)量數(shù)據(jù)資源將同時(shí)向具有先發(fā)優(yōu)勢的國家和機(jī)構(gòu)匯聚。
四是開源開放成為推動(dòng)大模型落地的關(guān)鍵。各科技企業(yè)現(xiàn)已公布的大模型多數(shù)未開源,如OpenAI發(fā)布的GPT-3以及谷歌的PaLM等??萍碱I(lǐng)軍企業(yè)和大型科研機(jī)構(gòu)恐將堆砌一道普通開發(fā)者和中小企業(yè)難以進(jìn)入的高墻,導(dǎo)致資源壟斷和創(chuàng)新受阻的風(fēng)險(xiǎn)日益凸顯。目前正處于推動(dòng)大模型商業(yè)化落地的關(guān)鍵時(shí)期,迫切需要營造開放的產(chǎn)業(yè)生態(tài),讓各類機(jī)構(gòu)和個(gè)體都能參與行業(yè)創(chuàng)新。眾多有創(chuàng)造力的開發(fā)者基于開放的模型、代碼和數(shù)據(jù)集,從事底層架構(gòu)研發(fā)、模型調(diào)整、數(shù)據(jù)加工、應(yīng)用開發(fā)等各類創(chuàng)新,將顯著加快技術(shù)創(chuàng)新速度,最大程度釋放大模型應(yīng)用潛力,最終帶來大模型在各行業(yè)中的真正落地。
大模型的蓬勃發(fā)展高度依賴于良好的產(chǎn)業(yè)生態(tài),前瞻性、系統(tǒng)性地謀劃布局產(chǎn)業(yè)生態(tài)成為關(guān)鍵。目前,我國面向大模型的AI生態(tài)建設(shè)存在三大急需解決的問題。
一是核心技術(shù)創(chuàng)新生態(tài)痼疾尚未得到解決。在本輪大模型的發(fā)展浪潮中,我國企業(yè)與OpenAI等美國科技企業(yè)存在一定差距。國內(nèi)大模型底層架構(gòu)創(chuàng)新能力不足,基本上以追隨國外為主,各機(jī)構(gòu)大多開發(fā)的是對(duì)應(yīng)單一任務(wù)的專用模型,在開發(fā)適用于多任務(wù)的通用大模型方面實(shí)力不強(qiáng)。開源AI框架還面臨著本土開源生態(tài)不完善、國際影響力不足、對(duì)外依賴度較高等問題,智能計(jì)算算法庫與國外開源框架捆綁發(fā)展,跟蹤創(chuàng)新趨勢嚴(yán)重。在芯片領(lǐng)域,大模型屬于計(jì)算密集型產(chǎn)品,算力需求巨大且飛速增長。根據(jù)Open AI測算,自2012年以來,全球頭部AI模型訓(xùn)練算力需求3-4個(gè)月翻一番,每年頭部訓(xùn)練模型所需算力增長幅度高達(dá)10倍。而我國在GPU領(lǐng)域缺少自主高端產(chǎn)品,并且面臨美國政府打造的“芯片鐵幕”技術(shù)封鎖。
二是“大模型+統(tǒng)一計(jì)算架構(gòu)+圖形處理器”生態(tài)與國外差距明顯?!按竽P?統(tǒng)一計(jì)算架構(gòu)(CUDA)+圖形處理器(GPU)”是智能時(shí)代的“三大件”。OpenAI使用了超2.5萬張英偉達(dá)GPU,并基于英偉達(dá)強(qiáng)大的CUDA架構(gòu)和算力才創(chuàng)造出ChatGPT。PyTorch、TensorFlow等主流AI框架同樣嚴(yán)重依賴英偉達(dá)CUDA,在該架構(gòu)上才有最佳性能。英偉達(dá)有超3000人的CUDA研發(fā)者以及300多萬開發(fā)者,遠(yuǎn)高于我國AI芯片廠商的統(tǒng)一計(jì)算架構(gòu)研發(fā)人員數(shù)量。國內(nèi)AI框架和AI芯片適配度不高,硬件和軟件棧碎片化問題突出,導(dǎo)致基于不同AI框架開發(fā)的大模型無法實(shí)現(xiàn)快速遷移。
三是數(shù)據(jù)、算法、算力“三位一體”的生態(tài)尚未形成。ChatGPT通過數(shù)據(jù)、算法、算力的精妙融合,打造出強(qiáng)大的技術(shù)“護(hù)城河”,而國內(nèi)數(shù)據(jù)、算法、算力“三駕馬車”分頭行動(dòng)而不是合力齊驅(qū)的問題突出。一方面,我國數(shù)據(jù)資源生態(tài)尚處于培育初期,國內(nèi)開源數(shù)據(jù)集普遍質(zhì)量不高,數(shù)據(jù)進(jìn)入AI企業(yè)和研發(fā)機(jī)構(gòu)以及數(shù)據(jù)在各機(jī)構(gòu)之間的流通渠道并未暢通。另一方面,數(shù)據(jù)中心等算力基礎(chǔ)設(shè)施與人工智能平臺(tái)各自建設(shè),建設(shè)數(shù)據(jù)中心時(shí)并沒有考慮AI大模型的算力需求,導(dǎo)致算力基礎(chǔ)設(shè)施和AI模型之間出現(xiàn)鴻溝。
大模型這條人工智能新賽道剛剛開啟,我國需要抓住短暫的窗口期加緊推進(jìn)。
一是保持戰(zhàn)略定力,完善頂層設(shè)計(jì)方案。堅(jiān)持《新一代人工智能發(fā)展規(guī)劃》的系統(tǒng)布局和總體部署,將推動(dòng)大模型發(fā)展納入國家《新一代人工智能發(fā)展規(guī)劃》中統(tǒng)籌考慮,研究制定具體指導(dǎo)意見,為大模型的發(fā)展提供良好的發(fā)展環(huán)境。工信部聯(lián)合發(fā)改委、科技部、網(wǎng)信辦等相關(guān)部委,定期組織行業(yè)產(chǎn)學(xué)研各界代表開展協(xié)商調(diào)研,對(duì)頂層方案進(jìn)行迭代完善。
二是堅(jiān)持自主可控,加強(qiáng)核心技術(shù)創(chuàng)新。引導(dǎo)和支持國內(nèi)企業(yè)和科研院所等開展大模型關(guān)鍵技術(shù)與產(chǎn)品的研發(fā),包括智能芯片、模型架構(gòu)設(shè)計(jì)、跨模態(tài)融合、智能計(jì)算基礎(chǔ)軟件、智能基礎(chǔ)算法庫等,提高我國大模型關(guān)鍵技術(shù)自主可控能力。要加強(qiáng)算法創(chuàng)新,探索中國特色的大模型產(chǎn)品。持續(xù)加大人工智能基礎(chǔ)科研的投入與建設(shè),支持對(duì)核心科學(xué)問題與關(guān)鍵技術(shù)的原創(chuàng)性、基礎(chǔ)性、前瞻性和交叉性研究,重視理論研究范式創(chuàng)新,從源頭和底層解決關(guān)鍵技術(shù)問題。
三是堅(jiān)持“三位一體”,打造國產(chǎn)大模型良好生態(tài)。加快構(gòu)建數(shù)據(jù)、算法、算力資源協(xié)同融通的良好生態(tài)。加快研究數(shù)據(jù)確權(quán)、定價(jià)、交易、流通機(jī)制,完善數(shù)據(jù)治理規(guī)則。建立高質(zhì)量行業(yè)數(shù)據(jù)池,強(qiáng)化優(yōu)質(zhì)供給,堅(jiān)持共享共用,加強(qiáng)高質(zhì)量行業(yè)數(shù)據(jù)與人工智能研究機(jī)構(gòu)的融合。推進(jìn)人工智能軟硬件平臺(tái)協(xié)調(diào)發(fā)展,盡早實(shí)現(xiàn)框架與芯片的適配、框架與框架的適配、技術(shù)底座的互聯(lián)互通。統(tǒng)籌算力基礎(chǔ)設(shè)施與人工智能平臺(tái)建設(shè),制定數(shù)字基礎(chǔ)設(shè)施建設(shè)標(biāo)準(zhǔn)。加強(qiáng)自主可控的開源開放生態(tài)建設(shè),推動(dòng)形成領(lǐng)軍企業(yè)推進(jìn)大模型升級(jí)迭代、中小企業(yè)深度開發(fā)應(yīng)用場景的協(xié)同發(fā)展格局。