段永朝
大模型的高質(zhì)量發(fā)展,有賴于業(yè)務(wù)領(lǐng)域、應(yīng)用場(chǎng)景、技術(shù)研發(fā)的協(xié)同創(chuàng)新,更有賴于牢固樹立公共服務(wù)、公共治理、公共安全的核心理念——追求公共利益,而不是企業(yè)的局部利益;追求互聯(lián)互通,而不是產(chǎn)生新的數(shù)字孤島;追求協(xié)同式開發(fā),而不是單打獨(dú)斗的閉門造車。
過去一年里,ChatGPT引爆的大模型技術(shù),已成為人工智能全新的應(yīng)用領(lǐng)域。2023年7月,在北京舉辦的世界人工智能大會(huì)上,披露了近百種大模型產(chǎn)品,一時(shí)間,“百模大戰(zhàn)”成為這一領(lǐng)域獨(dú)特的風(fēng)景。
大模型究竟是什么?能解決什么實(shí)際問題?對(duì)未來數(shù)字經(jīng)濟(jì)的發(fā)展將發(fā)揮何種重要的作用?這些問題隨著大模型領(lǐng)域的深入討論,日漸呈現(xiàn)出面向產(chǎn)業(yè)、面向應(yīng)用、面向深度創(chuàng)新的態(tài)勢(shì)。
簡(jiǎn)單說,大模型指的是擁有數(shù)十億至數(shù)百億個(gè)參數(shù)的神經(jīng)網(wǎng)絡(luò)模型。從應(yīng)用角度說,大模型可以完成圖像分類、機(jī)器翻譯、內(nèi)容生成等任務(wù)。特別突出的是其“多模態(tài)”內(nèi)容生成能力(如百度的文心大模型)。一時(shí)間,基于大模型的應(yīng)用大量涌現(xiàn),比如眾所周知的GPT4、PaLM2、Claude、Llama、文心一言、訊飛星火等。
人工智能從“分析式”向“生成式”轉(zhuǎn)變,可以視為人工智能這一領(lǐng)域創(chuàng)立66年來的第四次浪潮(前三次分別為符號(hào)演算、專家系統(tǒng)和深度學(xué)習(xí))。這次浪潮有三個(gè)主要的特點(diǎn):其一是模型參數(shù)量巨大,模型預(yù)訓(xùn)練所需算力巨大;其二是采用預(yù)訓(xùn)練和微調(diào)方法;其三是復(fù)雜的關(guān)系表達(dá)能力和優(yōu)異的泛化能力。
與國外側(cè)重通用人工智能(AGI)不同,國內(nèi)大模型側(cè)重垂直類大模型,在交通、能源、智能制造、金融、數(shù)字政務(wù)、在線辦公、生物計(jì)算等領(lǐng)域均有不同類型的垂直大模型出現(xiàn),其中百度的文心大模型表現(xiàn)尤為出色。
然而,在百模大戰(zhàn)的背后,需要深入思考的一個(gè)問題是:依托大模型的未來數(shù)字基礎(chǔ)設(shè)施將會(huì)發(fā)生何種變化?由此對(duì)企業(yè)的組織形態(tài)、生產(chǎn)方式將會(huì)引發(fā)何種變化?進(jìn)而人與智能技術(shù)的分工形式是怎樣的?下面從超級(jí)平臺(tái)、聯(lián)邦學(xué)習(xí)和智能代理,以及公共屬性——構(gòu)建超級(jí)平臺(tái)的基本原則、開發(fā)大模型的協(xié)作環(huán)境等五個(gè)方面簡(jiǎn)要分析。
超級(jí)平臺(tái)
企業(yè)智能平臺(tái)內(nèi)嵌大模型,將大大提升企業(yè)基于內(nèi)容的知識(shí)生產(chǎn)能力,比如平面設(shè)計(jì)、文案設(shè)計(jì)、智能客服、情報(bào)分析、場(chǎng)景模擬、生產(chǎn)過程仿真、產(chǎn)品設(shè)計(jì)、輔助決策、辦公事務(wù)處理等。垂直類大模型的興起,意味著企業(yè)對(duì)大模型的需求,大大溢出企業(yè)的運(yùn)營邊界、數(shù)據(jù)邊界、管理邊界,期待在更大的數(shù)據(jù)視野下,獲得產(chǎn)業(yè)的環(huán)境數(shù)據(jù)、生態(tài)的全景地圖、客戶的360度畫像。
但是,在百模大戰(zhàn)塵埃落定的時(shí)刻,是否會(huì)孕育出“超級(jí)平臺(tái)”這樣全新的“物種”?這是一個(gè)關(guān)鍵的問題。
所謂超級(jí)平臺(tái),是指具備行業(yè)特征、覆蓋某一特定領(lǐng)域,具備全時(shí)、全域、全聯(lián)通、全交互的公共服務(wù)平臺(tái)。與傳統(tǒng)聚焦交易服務(wù)的平臺(tái)企業(yè)不同的是:超級(jí)平臺(tái)屬于“第四方平臺(tái)”,具備行業(yè)視角,提供整合數(shù)據(jù)分析、交換、共享和價(jià)值傳遞,突出公共服務(wù)職能。
超級(jí)平臺(tái)的主要作用包括:
數(shù)據(jù)整合和分析能力:跨平臺(tái)、跨機(jī)構(gòu)、跨系統(tǒng)整合多個(gè)數(shù)據(jù)來源,提供更全面的數(shù)據(jù)視角,并通過垂直大模型提供對(duì)該領(lǐng)域數(shù)字世界的實(shí)時(shí)洞察。
合作和共享:支持不同實(shí)體之間的雙向數(shù)據(jù)交換,促進(jìn)更深層次的合作關(guān)系。
高級(jí)分析和洞察:基于領(lǐng)域、垂直大模型的典型場(chǎng)景和用例,提供多剖面分析功能,如預(yù)測(cè)分析、機(jī)器學(xué)習(xí)和人工智能等,以從數(shù)據(jù)中發(fā)現(xiàn)更深入的信息和洞察。
定制化服務(wù):根據(jù)用戶需求提供更具定制化的服務(wù),以滿足不同領(lǐng)域的特定需求。
數(shù)據(jù)安全和隱私保護(hù):更關(guān)注數(shù)據(jù)的安全性和隱私保護(hù),以確保數(shù)據(jù)在共享和分析過程中得到適當(dāng)?shù)谋Wo(hù)。
在超級(jí)平臺(tái)的視野下,百模大戰(zhàn)塵埃落定之時(shí),行業(yè)領(lǐng)域?qū)?huì)沉淀形成少數(shù)幾個(gè)優(yōu)質(zhì)的公共服務(wù)平臺(tái)。這將意味著絕大多數(shù)企業(yè)自行打造的封閉的、私有的大模型將難以有更大的生存和發(fā)展空間,轉(zhuǎn)而與超級(jí)平臺(tái)進(jìn)行有效的對(duì)接。
聯(lián)邦學(xué)習(xí)
2017年,Google研究員H. Brendan McMahan等在論文“Communication-efficient learning of deep networks from decentralized data”(《一種面向分布式數(shù)據(jù)的深度網(wǎng)絡(luò)有效通信的學(xué)習(xí)方法》)中首次介紹了聯(lián)邦學(xué)習(xí)的概念和原理。這篇論文在機(jī)器學(xué)習(xí)領(lǐng)域引起了廣泛的關(guān)注,成為聯(lián)邦學(xué)習(xí)研究領(lǐng)域的重要里程碑之一。
聯(lián)邦學(xué)習(xí)是一種分布式機(jī)器學(xué)習(xí)方法,它的基本原理是將大模型的訓(xùn)練過程,拆分為多個(gè)設(shè)備上的本地訓(xùn)練和中央服務(wù)器上的參數(shù)聚合。與傳統(tǒng)的集中式機(jī)器學(xué)習(xí)不同,每個(gè)設(shè)備使用本地局域數(shù)據(jù)訓(xùn)練模型,然后將局部模型的更新(通常是梯度)發(fā)送到超級(jí)平臺(tái)的中央服務(wù)器。中央服務(wù)器收集來自各個(gè)設(shè)備的更新,并根據(jù)一定的聚合算法(如平均)來更新全局模型。這樣,全局模型在不暴露原始數(shù)據(jù)的情況下進(jìn)行了改進(jìn)。
聯(lián)邦學(xué)習(xí)的方法,運(yùn)用“數(shù)據(jù)可用不可見”的原則,有效地回避了數(shù)據(jù)跨區(qū)域流動(dòng)的法律風(fēng)險(xiǎn),保護(hù)了數(shù)據(jù)持有者的數(shù)據(jù)隱私,同時(shí)又促進(jìn)了全局視角的數(shù)據(jù)可用,對(duì)于面向隱私的數(shù)據(jù)和設(shè)備間合作,奠定了有效的基礎(chǔ),特別適用于移動(dòng)設(shè)備、物聯(lián)網(wǎng)設(shè)備和分布式系統(tǒng)。
聯(lián)邦學(xué)習(xí)可以根據(jù)不同的分類方式進(jìn)行劃分,其中一種常見的分類是基于數(shù)據(jù)擁有者的區(qū)分:
垂直聯(lián)邦學(xué)習(xí)(Vertical Federated Learning):不同設(shè)備上的數(shù)據(jù)在特征維度上存在差異,但相同樣本的不同特征在不同設(shè)備上。這種情況下,垂直聯(lián)邦學(xué)習(xí)允許在保護(hù)數(shù)據(jù)隱私的前提下,進(jìn)行數(shù)據(jù)合作和模型訓(xùn)練。
水平聯(lián)邦學(xué)習(xí)(Horizontal Federated Learning):不同設(shè)備上的數(shù)據(jù)在樣本維度上存在差異,但相同特征的不同樣本在不同設(shè)備上。這種情況下,水平聯(lián)邦學(xué)習(xí)可以實(shí)現(xiàn)不同設(shè)備間的數(shù)據(jù)合作和模型訓(xùn)練。
聯(lián)邦學(xué)習(xí)在多個(gè)領(lǐng)域都有重要應(yīng)用,包括但不限于以下方面:移動(dòng)設(shè)備上的個(gè)性化模型訓(xùn)練,例如移動(dòng)端鍵盤的個(gè)性化建議。醫(yī)療領(lǐng)域中,不同醫(yī)療機(jī)構(gòu)間的合作分析,而不必共享患者敏感數(shù)據(jù)。物聯(lián)網(wǎng)設(shè)備之間的合作分析,例如傳感器數(shù)據(jù)分析。隱私保護(hù)的機(jī)器學(xué)習(xí)任務(wù),如用戶行為分析,而不泄露個(gè)人信息。
現(xiàn)階段,聯(lián)邦學(xué)習(xí)還面臨一些挑戰(zhàn),主要有:較高的通信和計(jì)算成本,大量異質(zhì)性數(shù)據(jù)如何有效參與訓(xùn)練,如何通過局部模型聚合出全局模型,惡意參與者和隱私泄漏等安全問題,聯(lián)邦學(xué)習(xí)聚合模型的性能和收斂性,跨區(qū)域聚合模型面臨的法律合規(guī)和風(fēng)控問題等。
智能代理
智能代理是一種智能計(jì)算機(jī)系統(tǒng),具有某種程度的自主性和能動(dòng)性,能夠在特定環(huán)境中感知和處理信息,以達(dá)到預(yù)定的目標(biāo)。在大模型時(shí)代,智能代理將成為取代App的重要用戶終端(或者稱超級(jí)App),并成為用戶與超級(jí)平臺(tái)之間雙向、多向交互的重要工具。
智能代理的概念最早可以追溯到20世紀(jì)80年代。1986年,計(jì)算機(jī)科學(xué)家Michael George Dyer在一篇名為“Agent Z and intelligent agents”(《代理Z和智能代理》)的論文中,首次提出了智能代理的概念,描述了能夠自主感知、決策和行動(dòng)的計(jì)算機(jī)程序。
智能代理的主要特點(diǎn)包括:
自主性:能夠獨(dú)立感知環(huán)境、做出決策和執(zhí)行行動(dòng)。
學(xué)習(xí)能力:能夠從經(jīng)驗(yàn)中學(xué)習(xí),并根據(jù)環(huán)境變化調(diào)整行為。
目標(biāo)導(dǎo)向:能夠根據(jù)預(yù)定目標(biāo)或任務(wù)執(zhí)行行動(dòng)。
適應(yīng)性:能夠適應(yīng)不同環(huán)境和情境。
通信能力:能夠與其他代理或系統(tǒng)進(jìn)行通信和協(xié)作。
智能代理在現(xiàn)實(shí)應(yīng)用中可以用于解決許多問題,包括:
自動(dòng)化任務(wù):智能代理可以在無人值守的環(huán)境中執(zhí)行任務(wù),如自動(dòng)駕駛汽車、工業(yè)生產(chǎn)線上的機(jī)器人等。
信息檢索和過濾:智能代理可以根據(jù)用戶的偏好和需求,自動(dòng)檢索和過濾信息,以提供個(gè)性化的內(nèi)容。
智能助理:智能代理可以成為虛擬助理,協(xié)助用戶完成日常任務(wù),如語音助手、聊天機(jī)器人、智能客服等。
在超級(jí)平臺(tái)、聯(lián)邦學(xué)習(xí)的環(huán)境下,智能代理可以基于大模型來實(shí)現(xiàn)更復(fù)雜的決策和任務(wù)處理,并利用大模型的學(xué)習(xí)能力來提高智能代理的表現(xiàn)。此外,智能代理也可以在聯(lián)邦學(xué)習(xí)中充當(dāng)前端設(shè)備或系統(tǒng),通過協(xié)作來訓(xùn)練和改進(jìn)共享的模型,實(shí)現(xiàn)更廣泛的學(xué)習(xí)。
超級(jí)平臺(tái)、聯(lián)邦學(xué)習(xí)和智能代理之間的緊密配合,將為涌現(xiàn)超級(jí)平臺(tái)提供重要的支撐,構(gòu)建更具智能性和協(xié)作性的人-機(jī)-環(huán)境的融合系統(tǒng)。
公共屬性:構(gòu)建超級(jí)平臺(tái)的基本原則
大模型、超級(jí)平臺(tái)、超級(jí)App等概念,除了讓人血脈僨張、腦洞大開之外,可能存在兩方面的誤區(qū):一個(gè)是傳統(tǒng)的互聯(lián)網(wǎng)思維的慣性,另一個(gè)是零和博弈的發(fā)展策略。
過去20年里,互聯(lián)網(wǎng)思維對(duì)發(fā)展互聯(lián)網(wǎng)經(jīng)濟(jì)起到了重要的推動(dòng)作用,包括社群思維、零邊際成本效應(yīng)、長尾模式等。但互聯(lián)網(wǎng)思維中也存在若干“毒性”很強(qiáng)的觀念,如“速度為王、唯快不敗”“贏者通吃”“流量經(jīng)營”等。一時(shí)間,互聯(lián)網(wǎng)疆域淪為“碾壓式創(chuàng)新”“掠奪式收割”的角斗場(chǎng),平臺(tái)肆意追求狹隘的規(guī)模增長,運(yùn)用平臺(tái)壟斷地位制定不平等的運(yùn)營規(guī)則,價(jià)格歧視、惡性競(jìng)爭(zhēng)、數(shù)據(jù)隱私泄漏、過度營銷、平臺(tái)孤島等亂象頻出。
大模型、超級(jí)平臺(tái)、智能代理和超級(jí)App,因其跨平臺(tái)、跨主體的數(shù)據(jù)聚合能力,使得數(shù)字時(shí)代涌現(xiàn)的新物種,必須在互聯(lián)互通、協(xié)作共生、監(jiān)管合規(guī)、安全有效的原則下開展運(yùn)營,必須以公共利益、公共治理、公共服務(wù)和公共安全中共有的“公共屬性”為重要的基本原則。
構(gòu)建大模型應(yīng)用涉及許多重要的原則,包括公共利益、公共治理、公共服務(wù)和公共安全。這些原則有助于確保大模型應(yīng)用的合理性、可持續(xù)性和社會(huì)影響的積極性。
公共利益(Public Interest):公共利益是指在社會(huì)范圍內(nèi)符合廣大人民群眾的利益,涉及社會(huì)的整體福祉和公共目標(biāo)。在構(gòu)建大模型應(yīng)用時(shí),必須確保應(yīng)用的設(shè)計(jì)、功能和影響是有益于社會(huì)和公眾的。大模型應(yīng)用應(yīng)該服務(wù)于廣大人民的需求,提供有意義、實(shí)用和有效的解決方案,以促進(jìn)社會(huì)共同進(jìn)步和可持續(xù)發(fā)展。
公共治理(Public Governance):公共治理是指社會(huì)各方面的參與和合作,通過政府和非政府機(jī)構(gòu)來管理和解決問題。在大模型應(yīng)用中,公共治理要求建立透明、開放、合作的決策過程和管理機(jī)制。各方利益相關(guān)者應(yīng)該參與到應(yīng)用的規(guī)劃、設(shè)計(jì)和監(jiān)管中,以確保決策的公平性、合法性和民主性。
公共服務(wù)(Public Service):公共服務(wù)是政府、組織或機(jī)構(gòu)向社會(huì)提供的服務(wù),旨在滿足人們的基本需求和社會(huì)發(fā)展的需要。大模型應(yīng)用應(yīng)該被視為一種公共服務(wù),為社會(huì)提供有益的功能和服務(wù)。這包括通過大模型來改善教育、醫(yī)療、交通、環(huán)境等方面的問題,以提高公眾生活質(zhì)量,促進(jìn)高質(zhì)量發(fā)展。
公共安全(Public Safety):公共安全是指維護(hù)社會(huì)秩序、保護(hù)人民生命財(cái)產(chǎn)安全的任務(wù)和責(zé)任。在大模型應(yīng)用中,保護(hù)用戶數(shù)據(jù)隱私和信息安全是至關(guān)重要的。應(yīng)該采取有效的隱私保護(hù)措施,防止數(shù)據(jù)泄露、濫用和侵犯,以確保用戶的信息得到適當(dāng)?shù)谋Wo(hù)。
開發(fā)大模型的協(xié)作環(huán)境
2023年2月27日,中共中央、國務(wù)院發(fā)布《數(shù)字中國建設(shè)整體布局規(guī)劃》,這是未來15年中國數(shù)字經(jīng)濟(jì)、數(shù)字社會(huì)、數(shù)字政務(wù)、數(shù)字文化和數(shù)字生態(tài)文明建設(shè)的綱領(lǐng)性文件。這個(gè)文件高度概括并提出了建設(shè)“數(shù)字基礎(chǔ)設(shè)施大動(dòng)脈”“數(shù)字資源流通大循環(huán)”的兩大基礎(chǔ),提升創(chuàng)新能力、安全能力兩大能力,拓展數(shù)字治理環(huán)境、國際交流協(xié)作環(huán)境兩個(gè)環(huán)境建設(shè)的重要框架。文件中明確指出“橫向打通、縱向貫通、協(xié)調(diào)有力”的指導(dǎo)思想,明確“互聯(lián)互通”是數(shù)字中國建設(shè)的首要支撐。
在這個(gè)總體思路下,未來無論通用大模型、行業(yè)與領(lǐng)域的垂直大模型,在度過“百模大戰(zhàn)、百模爭(zhēng)先”的階段之后,勢(shì)必會(huì)逐漸形成不同細(xì)分領(lǐng)域、不同區(qū)域的專屬大模型。這個(gè)大模型以及所支撐的超級(jí)平臺(tái),將大大削弱傳統(tǒng)平臺(tái)單一的經(jīng)濟(jì)屬性,強(qiáng)調(diào)其管理、運(yùn)營、安全和服務(wù)的公共屬性。在這個(gè)歷史發(fā)展過程中,企業(yè)發(fā)展大模型的基本思路,就有別于以往“競(jìng)爭(zhēng)性技術(shù)應(yīng)用”的思路,而是“開放協(xié)作式技術(shù)應(yīng)用”的思路。
具體而言,就是企業(yè)將依托頭部企業(yè)所提供的智能技術(shù)開發(fā)環(huán)境、開發(fā)技術(shù),依托開發(fā)者社群和開發(fā)資源,共建本行業(yè)的超級(jí)平臺(tái),為訓(xùn)練大模型增添本地的局域資源,最終享有行業(yè)的整合資源優(yōu)勢(shì),把企業(yè)的優(yōu)勢(shì)資源聚焦到生產(chǎn)過程和產(chǎn)品創(chuàng)新中來。
以百度為例。百度與大模型相關(guān)的智能科技布局,是國內(nèi)唯一涵蓋高端芯片(昆侖)、大規(guī)模深度學(xué)習(xí)與開發(fā)者社區(qū)(飛槳)、文心大模型、原生插件和大量行業(yè)應(yīng)用場(chǎng)景的高科技企業(yè)。目前飛槳平臺(tái)已經(jīng)凝聚800萬名開發(fā)者,服務(wù)22萬家企事業(yè)單位;飛槳星河大模型社區(qū),依托600萬+開發(fā)項(xiàng)目,形成了超過300個(gè)大模型創(chuàng)意應(yīng)用;基于飛槳系統(tǒng),已經(jīng)創(chuàng)建了80萬個(gè)模型。
千帆大模型,是百度智能云推出的全球首個(gè)一站式企業(yè)級(jí)大模型平臺(tái),以文心大模型為核心,同時(shí)全面接入Llama2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個(gè)大模型,成為國內(nèi)擁有大模型最多的平臺(tái)。
借助百度千帆大模型,已經(jīng)在智慧能源、智能制造、智慧金融、數(shù)字政務(wù)、智慧交通等領(lǐng)域獲得豐富的應(yīng)用場(chǎng)景。
大模型的高質(zhì)量發(fā)展,有賴于業(yè)務(wù)領(lǐng)域、應(yīng)用場(chǎng)景、技術(shù)研發(fā)的協(xié)同創(chuàng)新,更有賴于牢固樹立公共服務(wù)、公共治理、公共安全的核心理念——追求公共利益,而不是企業(yè)的局部利益;追求互聯(lián)互通,而不是產(chǎn)生新的數(shù)字孤島;追求協(xié)同式開發(fā),而不是單打獨(dú)斗的閉門造車。只有更新理念、更新思路、更新方法,建設(shè)數(shù)字中國的過程中,才有可能更加順暢地面對(duì)新挑戰(zhàn)、創(chuàng)造新生態(tài)、擁抱新變化。
(作者為杭州師范大學(xué)阿里巴巴商學(xué)院特聘教授,葦草智酷創(chuàng)始合伙人,信息社會(huì)50人論壇執(zhí)行主席)
責(zé)任編輯:馬莉莎