• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      廣布局、重應(yīng)用:生成式大語言模型的新進展

      2023-09-12 00:32:19郭全中朱燕
      新聞愛好者 2023年8期
      關(guān)鍵詞:大語言模型

      郭全中 朱燕

      【摘要】ChatGPT的上線掀起了大語言模型的熱潮,除了谷歌、微軟、OpenAI、百度、阿里巴巴等科技巨頭,創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)企業(yè)也紛紛布局大模型。目前,生成式大語言模型在搜索引擎、辦公軟件和諸多垂直領(lǐng)域有了初步應(yīng)用,加快了產(chǎn)業(yè)智能化發(fā)展的步伐,未來,大語言模型將探索更多垂類應(yīng)用場景,產(chǎn)業(yè)結(jié)構(gòu)將進一步分化。但大模型在落地應(yīng)用過程中也面臨著技術(shù)和社會層面的問題,需要各國在生成式人工智能的管理方面進行規(guī)范與治理。

      【關(guān)鍵詞】大語言模型;ChatGPT;生成式;廣布局;重應(yīng)用

      2022年11月30日,基于生成式預(yù)訓(xùn)練模型GPT-3.5微調(diào)而來的新一代對話式自然語言識別模型ChatGPT上線,這是人工智能研究實驗室Open AI歷經(jīng)四年迭代推出的生成式大語言模型。一般而言,大模型是指具有海量參數(shù)和復(fù)雜架構(gòu),用于深度學(xué)習(xí)任務(wù)的大容量模型,它采用的“預(yù)訓(xùn)練大模型■下游任務(wù)微調(diào)”模式極大地提高了模型的通用能力,呈現(xiàn)出“大模型”和“小模型”協(xié)進、通用性與專用性并進的發(fā)展趨勢。2023年1月末,上線僅兩個月,ChatGPT的月活用戶便突破1億,成為全球用戶增長速度最快的消費級應(yīng)用程序。面對用戶的對話、翻譯、分類、修改回答等指令,ChatGPT均呈現(xiàn)出極強的對用戶意圖的理解能力,其語言理解能力、邏輯推理能力與生成內(nèi)容能力的大幅提升是在自然語言處理領(lǐng)域的重要突破,是生成式AI(AIGC)極為關(guān)鍵的發(fā)展節(jié)點。ChatGPT的成功標志著人工智能從以專用小模型訓(xùn)練為主的“手工作坊時代”邁入到以通用大模型預(yù)訓(xùn)練為主的“工業(yè)化時代”,成為人工智能發(fā)展的分水嶺。[1]

      一、廣布局:多類主體大力布局大語言模型

      無論是在訓(xùn)練研發(fā)的上游市場,還是落地應(yīng)用的下游市場,以美國、中國為代表的國家均展開了廣泛布局,除了互聯(lián)網(wǎng)公司和AI公司,科研機構(gòu)、各垂直行業(yè)巨頭企業(yè)也紛紛加入大語言模型賽道。目前,大語言模型賽道主要分為兩類:一類是聚焦基礎(chǔ)層通用大模型訓(xùn)練的巨頭公司和科研機構(gòu),另一類是聚焦在開源大模型的基礎(chǔ)上訓(xùn)練垂類大模型或單純專注垂直行業(yè)具體應(yīng)用的中型公司和應(yīng)用型廠商。

      (一)國外大語言模型的發(fā)展現(xiàn)狀

      美國在大語言模型領(lǐng)域的布局方面處于領(lǐng)先地位。在上游市場,OpenAI、Anthropic、谷歌、Meta等行業(yè)巨頭和斯坦福大學(xué)、麻省理工學(xué)院等科研機構(gòu)均研發(fā)出了代表性大模型,在大模型的通用性方面實現(xiàn)了跨越式突破。以微軟、Jasper為代表的下游市場則將語言生成能力與自身產(chǎn)品生態(tài)相結(jié)合,極大增強了自身產(chǎn)品生態(tài)的商業(yè)競爭力。相較之下,英國和俄羅斯雖然也分別推出了Gopher、YaLM等大模型,但在研發(fā)和應(yīng)用上與美國還存在一定差距。

      1.美國在大語言模型領(lǐng)域的發(fā)展處于領(lǐng)先地位

      (1)上游市場:以O(shè)penAI為首的“一超多強”局面。

      作為傳統(tǒng)科技強國,美國背倚雄厚的技術(shù)、資金與人才資源,在大語言模型方面的發(fā)展具有顯著優(yōu)勢。在上游市場領(lǐng)域,美國市場以O(shè)penAI為首,谷歌、Anthropic、Meta等科技巨頭和創(chuàng)業(yè)公司競相追趕,形成了“一超多強”的競爭局面。

      OpenAI作為頂尖人工智能公司,其開發(fā)的ChatGPT是目前最具代表性的通用語言生成應(yīng)用。從GPT-1的1.17億、GPT-2的15億到GPT-3和GPT-3.5的1750億,再到GPT-4的萬億級以上的參數(shù)量,GPT系列模型的參數(shù)量不斷攀升。ChatGPT作為對話式機器人,聚焦多輪對話與情感交互,在“人性化”層面有了進一步探索。除了可以完成連續(xù)對話、翻譯、編程、算術(shù)等工作外,ChatGPT還會根據(jù)用戶的質(zhì)疑發(fā)表道歉語句,并根據(jù)用戶需求修改、完善先前的回答。而OpenAI于2023年3月中旬發(fā)布的GPT-4又在GPT-3.5的模型上進行了全方位升級。作為一個多模態(tài)大模型,GPT-4具備對圖片模態(tài)的分析推理能力,并能處理更長的文本。目前,OpenAI與微軟、Duolingo、冰島政府等均有合作,迅速建立并不斷拓展產(chǎn)業(yè)應(yīng)用生態(tài)。整體而言,無論是在文本理解與生成領(lǐng)域,還是在大模型的通用功能實現(xiàn)方面,Chat GPT的綜合表現(xiàn)相對更為優(yōu)異。

      Anthropic創(chuàng)始團隊多為前OpenAI研究員,其開發(fā)的AI聊天助手Claude是對標ChatGPT的大語言模型,主要用于理解用戶的自然語言,并進行智能回答與交互。Claude的參數(shù)量相對較小,僅有520億。相較ChatGPT,Claude更強調(diào)語言生成應(yīng)用的安全性,為企業(yè)提供從數(shù)據(jù)到模型再到系統(tǒng)的人工智能應(yīng)用安全服務(wù),注重對類ChatGPT的邏輯錯誤、負面信息等問題的檢測與回避,最大化地避免提供有害建議。

      谷歌作為新一代科技巨頭,它在語言生成應(yīng)用領(lǐng)域并未搶占到先機,其對標ChatGPT的語言生成應(yīng)用Bard還沒有成型的商業(yè)模式,但其目標是將Bard接入Google產(chǎn)品體系中,提升其產(chǎn)品生態(tài)與微軟產(chǎn)品生態(tài)競爭的能力。[2]Bard此前是基于LaMDA模型開發(fā),但LaMDA的負責(zé)任AI實踐模式導(dǎo)致其回答存在生硬、淺層等局限,因而將從基于輕量級LaMDA模型升級為更大規(guī)模的PaLM模型。PaLM模型的參數(shù)量達5400億,幾乎是LaMDA的四倍。在此基礎(chǔ)上,升級后的Bard不僅將在常識推理和編程方面的回答上有所突破,在回答方式上也將更自然、更深入。目前,谷歌已開始嘗試將Bard跟旗下和外部產(chǎn)品集成,朝著實用與通用的方向發(fā)展。例如,谷歌嘗試在Chrome OS中整合Bard AI聊天機器人,引入“會話搜索”的實驗性功能。

      Facebook的母公司Meta也于2023年2月下旬推出了開源大語言模型LLaMA-13B。LLaMA-13B是Meta新語言模型家族“大型語言模型Meta AI”(簡稱LLaMA)的一部分,Meta將其LLaMA模型稱為“基礎(chǔ)模型”,這意味著其將如在GPT-3的基礎(chǔ)上構(gòu)建ChatGPT一樣,用這些模型來幫助構(gòu)建更精細的AI模型。盡管LLaMA模型集合的參數(shù)從70億到650億個不等,遠不及GPT-3模型的1750億個參數(shù),但這種相對較小的AI模型反而可能催生能在PC端和移動端上運行類似ChatGPT的語音助手,是最有安卓像的開源生態(tài)。LLaMA-13B在單一GPU上運行的表現(xiàn)也超過了GPT-3,為不久的將來在消費級硬件上實現(xiàn)類似ChatGPT的功能打開了大門。[3]此外,作為完全開源的領(lǐng)先模型,LLaMA具有高度的可配置性與泛化能力,還具備成為垂類AI模型的通用基座的潛力,加速垂類模型的發(fā)展。

      此外,還有部分高校研究機構(gòu)也相繼推出了大模型,如斯坦福大學(xué)基于Meta的LLaMA-7B模型微調(diào)出新模型Alpaca,該模型僅用52K數(shù)據(jù)指令即可達到良好效果;麻省理工學(xué)院提出大語言模型跨界視覺領(lǐng)域新范式LAMPP,用于視覺感知和推理任務(wù)等。

      (2)下游市場:微軟處于絕對領(lǐng)先地位。

      微軟在上游市場也有所布局,聯(lián)合英偉達發(fā)布了具有5300億參數(shù)量的自然語言生成模型MT-NLG,這是模型發(fā)布之時訓(xùn)練的最大、最強大的單片Transformer語言模型。但是,微軟在下游市場的表現(xiàn)更為突出,且占有絕對的市場領(lǐng)先地位。微軟打造了基于場景的語言生成應(yīng)用,并通過與OpenAI的合作將大語言模型與產(chǎn)品生態(tài)相結(jié)合,不斷探索語言生成的場景應(yīng)用潛力。在搜索引擎方面,微軟基于Edge瀏覽器的數(shù)據(jù),接入GPT-4,推出了AI版搜索引擎New Bing;在辦公軟件方面,微軟接入GPT-4與ChatGPT,推出365 Copilot;在代碼生成方面,微軟在其全球最大的代碼托管平臺GitHub上推出代碼生成應(yīng)用CopilotX。目前,微軟在語言生成應(yīng)用場景上實現(xiàn)了廣泛布局,形成了強大的業(yè)務(wù)矩陣。

      JasperAI是一家專注營銷領(lǐng)域內(nèi)容創(chuàng)作的公司,也是最早嘗試將大語言模型進行商業(yè)化的公司之一。在ChatGPT發(fā)布前,JasperAI就基于GPT-3模型的API,通過模型微調(diào)打造了AI營銷內(nèi)容生成平臺,提供廣告文案、營銷策劃、產(chǎn)品描述等多種類型的商業(yè)性文字的生成服務(wù)。但隨著ChatGPT面向公眾開放、成為C端現(xiàn)象級應(yīng)用后,JasperAI提供的部分基礎(chǔ)功能面臨被取代的風(fēng)險,對JasperAI的語言生成應(yīng)用市場造成了威脅。

      2.英國、俄羅斯等發(fā)達國家也陸續(xù)布局,但較美國還有一定差距

      在開發(fā)語言模型的過程中,谷歌旗下的英國的人工智能公司Deepmind探索了六類不同大小的Transformer模型,參數(shù)量從4400萬到2800億不等。Deepmind不僅提供了對包括模型規(guī)模與偏差在內(nèi)的訓(xùn)練數(shù)據(jù)集和模型行為的整體分析,還討論了語言模型在下游危害與AI安全等方面的問題,能進行有害語言識別與事實核查。但整體而言,Gopher的應(yīng)用范圍相對狹窄,離通用性的實現(xiàn)還有較遠距離。

      Yandex擁有俄羅斯最大的搜索引擎,是俄羅斯的互聯(lián)網(wǎng)巨頭公司之一。YaLM 100B是Yandex開發(fā)的具有1000億參數(shù)的開源大模型,它可以生成和處理文本,在Yandex旗下的Alice語音助手和Yandex搜索中有了初步應(yīng)用,并允許研究和商業(yè)免費使用。盡管Yandex已部分使用生成式神經(jīng)網(wǎng)絡(luò),但在形成搜索結(jié)果時并不能直接生成文本答案,而是作為輔助判別工具用于搜索引擎中,其發(fā)展僅處于行業(yè)中下游。

      總的來說,美國在大語言模型開發(fā)方面保持著領(lǐng)先地位。從文本生成的直觀體驗層面來看,目前ChatGPT的表現(xiàn)最為優(yōu)異。但對于谷歌等大廠而言,目前暫時落后于Open AI的主要原因是技術(shù)路線與公司戰(zhàn)略的差異,趕超GPT系列模型依然存在很大可能。在語言模型閉源趨勢明顯的環(huán)境下,Meta的開源語言模型則在促進大語言模型研究方面作出了重要貢獻。相較傳統(tǒng)互聯(lián)網(wǎng)大廠,由頂尖技術(shù)人才初創(chuàng)的AI公司也成為大語言模型發(fā)展過程中的一股重要力量,并在不斷實現(xiàn)新的突破。

      (二)中國的大語言模型大干快上

      中國在大語言模型領(lǐng)域大干快上,目前國內(nèi)已經(jīng)有30多家公司發(fā)布或宣布研發(fā)大模型,布局企業(yè)以互聯(lián)網(wǎng)巨頭、AI公司、初創(chuàng)科技團隊、科研院所和教育行業(yè)公司為主,如百度、阿里巴巴、騰訊、華為、商湯科技、科大訊飛、百川智能、清華大學(xué)、復(fù)旦大學(xué)以及網(wǎng)易有道、學(xué)而思等。我國大語言模型盡管與國外還有一定差距,但在參數(shù)量、跨模態(tài)、泛化能力等方面表現(xiàn)優(yōu)異,且在垂直領(lǐng)域有了廣泛的落地應(yīng)用。

      在人工智能產(chǎn)業(yè)迎來熱潮時,中國人工智能產(chǎn)業(yè)也抓住了這一難得的發(fā)展契機,迎來了“國產(chǎn)ChatGPT元年”,大語言模型密集上線。相較國外產(chǎn)業(yè)巨頭致力于提升大語言模型的通用性,我國則聚焦垂類場景的應(yīng)用落地。以百度、阿里巴巴、騰訊、華為等為代表的互聯(lián)網(wǎng)巨頭在深耕通用大模型研發(fā)的同時,積極根據(jù)自身產(chǎn)業(yè)生態(tài)布局進行垂直基礎(chǔ)大模型打造;具備大模型自研能力的肩部公司則聚焦在開源模型和海量數(shù)據(jù)的基礎(chǔ)上打造垂類大模型,建立垂直領(lǐng)域的平臺生態(tài)。

      在模型參數(shù)量方面,互聯(lián)網(wǎng)大廠的參數(shù)量遠大于科研院所,基本處于千億級以上規(guī)模,如阿里巴巴的通義千問擁有10萬億級以上的參數(shù)量,騰訊混元大模型的參數(shù)量在萬億級以上,但科研院所的參數(shù)量多在千億級以下。在模型應(yīng)用方面,大部分公司和團隊的大模型將以內(nèi)部應(yīng)用和面向B端的企業(yè)拓展服務(wù)為主,面向C端市場進行規(guī)?;瘧?yīng)用的可能性較低。相較國外,我國在垂類大模型領(lǐng)域的發(fā)展更快。目前,我國已有不少中小型企業(yè)基于國內(nèi)外大模型“底座”訓(xùn)練適配自身所處行業(yè)的垂類模型,而已發(fā)布通用大模型的公司也推出了針對特定行業(yè)的大模型。值得一提的是,我國在大模型領(lǐng)域的開源趨勢明顯,如智譜AI的ChatGLM已經(jīng)開源,復(fù)旦大學(xué)邱錫彭教授團隊的MOSS產(chǎn)品即將開源等,這些中文開源語言生成模型將極大地促進我國通用大模型及垂類模型的發(fā)展。

      (三)中外大語言模型差距背后的原因

      目前,我國與外國尤其是美國在大語言模型的研發(fā)上還存在較大差距,在數(shù)據(jù)、算力、工程化能力等關(guān)鍵因素上存在短板。大語言模型更多僅聚焦于垂直領(lǐng)域的應(yīng)用,缺乏多技術(shù)融合創(chuàng)新帶來的通用能力。

      第一,創(chuàng)新意識不足。一方面,大模型的高額研發(fā)成本和高風(fēng)險特點限制了試錯空間,導(dǎo)致我國企業(yè)在風(fēng)險技術(shù)上更傾向于追隨與模仿。

      第二,技術(shù)設(shè)施不完善。首先,我國在核心的人工智能算法上(算法透明度、魯棒性等)存在痛點,關(guān)鍵技術(shù)缺乏進一步突破;[4]其次,國外對中國的“芯片制裁”持續(xù)升級,用于人工智能和高性能計算機的芯片獲取困難,國產(chǎn)智能芯片在性能上與英偉達A100和H100芯片差距較大;再次,中文開源高質(zhì)量數(shù)據(jù)相對匱乏,缺少用于大模型訓(xùn)練的經(jīng)過加工、清洗和標注的數(shù)據(jù)集。

      第三,制度環(huán)境有缺陷。美國的AIGC產(chǎn)業(yè)得以蓬勃發(fā)展的一個重要原因在于建立了保護和激勵創(chuàng)新的制度環(huán)境,在知識產(chǎn)權(quán)、風(fēng)險投資、高等教育、人才集聚等方面不斷實現(xiàn)制度創(chuàng)新,而我國的強監(jiān)管環(huán)境則在一定程度上限制了人工智能產(chǎn)業(yè)能動性的發(fā)揮。此外,隨著地緣政治緊張局勢的加劇,科技產(chǎn)業(yè)的中外合作也受到了較大限制。

      第四,研發(fā)力量分散。大語言模型的研發(fā)具有高投入、高風(fēng)險、長周期的特征,這也決定了其對頂尖人才和核心團隊的極高要求。目前,我國不僅研發(fā)領(lǐng)域分散,企業(yè)和高校在大數(shù)據(jù)、大模型等方面各有側(cè)重,頂尖人才也分散在不同機構(gòu)中,難以形成對標Open AI的兼具核心技術(shù)與豐富經(jīng)驗的領(lǐng)軍人物和團隊。

      二、重應(yīng)用:大語言模型積極探索落地場景

      由于大語言模型的泛化能力極強,通用性和實用性明顯,越來越多的企業(yè)在聚焦基礎(chǔ)層的通用大模型訓(xùn)練時,也將目光放在了垂類大模型的研發(fā)上,重視并積極探索模型的落地場景應(yīng)用。目前,大語言模型已在搜索引擎、辦公軟件和金融、醫(yī)療、傳媒、教育等多個垂直行業(yè)落地應(yīng)用,并取得了良好效果。

      (一)AI搜索引擎:個性化交互

      隨著全球第二大搜索引擎微軟Bing在今年3月接入ChatGPT,搜索引擎這樣一個傳統(tǒng)行業(yè)迎來了新發(fā)展時代。New Bing在提供文本生成服務(wù)的同時還具有網(wǎng)頁信息總結(jié)功能,并能在互聯(lián)網(wǎng)上實時搜索信息。此外,Bing Chat也會在每個回復(fù)的底部注明其引用來源,以供用戶參考驗證生成文本的準確性。據(jù)微軟公布的消息,Bing接入ChatGPT一個月后的日活量破億,New Bing憑借優(yōu)秀的性能在短時間內(nèi)吸引了大量用戶,并在商業(yè)上直接威脅到了谷歌的搜索業(yè)務(wù)。目前,谷歌、百度等國內(nèi)外搜索引擎龍頭和360、知乎等公司紛紛開始加速在大模型嵌入搜索引擎應(yīng)用方面的布局,如谷歌的AI版搜索引擎Magi即將面世,360集團推出360智腦服務(wù),知乎將“知海圖AI”中文大模型應(yīng)用于知乎的“熱榜摘要”等。

      嵌入大模型后的搜索引擎將為用戶帶來諸多便利。第一,搜索形式和搜索結(jié)果呈現(xiàn)方式將不斷升級,即關(guān)鍵詞式搜索轉(zhuǎn)變?yōu)閷υ捠剿阉?,線性排列式結(jié)果轉(zhuǎn)變?yōu)橐?guī)范的篇章閱讀式結(jié)果,用戶無需根據(jù)結(jié)果梳理即可得到具有清晰邏輯的篇章和規(guī)范的參考源。第二,交互性與針對性得以增強。以New Bing的搜索功能為例,用戶在搜索欄中最長可輸入長達1000字符的問題,并可進行追問與反駁,以獲取具有高準確度的搜索結(jié)果。

      但大語言模型與搜索引擎的結(jié)合也會滋生出新的問題。首先,傳統(tǒng)廣告模式的商業(yè)邏輯受到?jīng)_擊。搜索引擎廣告是搜索引擎公司的主要收入來源,但大語言模型的生成結(jié)果注重功能性與準確性,這將大大降低用戶對廣告鏈接的點擊率。因此,如何在創(chuàng)新升級的基礎(chǔ)上保持穩(wěn)定收入,探索與該文本生成邏輯相匹配的盈利模式尤為重要。其次,大語言模型的運營成本高昂,企業(yè)將面臨著是否面向C端用戶收費的難題,施行收費制度后用戶數(shù)量的擴張與留存也將面臨風(fēng)險。

      (二)智能化辦公:淘汰重復(fù)性勞動

      大語言模型目前已嘗試嵌入?yún)f(xié)同辦公平臺、AI辦公工具、AI編程工具等辦公軟件,智能化辦公將成為大模型的另一重要應(yīng)用場景。首先,在協(xié)同辦公平臺領(lǐng)域,微軟是最早接入大語言模型的公司,2023年3月16日,微軟正式將GPT-4接入Office工具,推出AI版Office“全家桶”——Microsoft 365 Copilot,在Word中AI能秒出文稿和配圖,根據(jù)用戶需求修改文風(fēng)和排版;在Excel中對數(shù)據(jù)進行清洗和分析后可總結(jié)關(guān)鍵信息,并進行可視化呈現(xiàn);在Outlook中則可自動總結(jié)郵件要點,并生成郵件初稿。在國內(nèi),釘釘于4月11日接入阿里巴巴的通義千問大模型,同日,字節(jié)跳動旗下的辦公軟件飛書對其智能助手“My AI”進行了預(yù)告;4月17日,百度宣布文心一言大模型在百度內(nèi)部全面應(yīng)用在智能工作平臺“如流”上,助力員工的代碼編寫、思路搭建等日常工作。其次,在AI辦公工具領(lǐng)域,Notion于2月推出了基于ChatGPT的企業(yè)服務(wù)工具Notion AI,以及熱門類GPT應(yīng)用ChatPDF的推出等,這類AI辦公工具的功能極為廣泛,包括但不限于總結(jié)會議、回復(fù)郵件、整理PDF文檔。最后,在AI編程工具領(lǐng)域,微軟旗下的代碼托管平臺GitHub接入GPT-4推出輔助編程工具CopilotX,AWS的實時AI編程伴侶Amazon CodeWhisperer也免費向開發(fā)者開放等,這些AI編程軟件不僅可以根據(jù)開發(fā)者的語言指令生成代碼建議,還能提供實時的錯誤代碼修復(fù)建議。

      目前看來,大語言模型接入?yún)f(xié)同辦公平臺并未完全取代相關(guān)腦力工作,它提供的大多是簡單瑣碎的工作內(nèi)容,其目的在于淘汰重復(fù)性勞動。具體而言,這類應(yīng)用主要面向三類場景:一是面向工作群體,承擔(dān)簡單的重復(fù)性工作,快速提取員工所需信息;二是面向?qū)W生群體,提煉文檔要點,承擔(dān)如演示文稿般的形式上的工作;三是面向有創(chuàng)意想法的人,AI可從史料、文學(xué)等作品中提取信息供用戶參考,拓寬用戶的想象維度。

      (三)垂直領(lǐng)域應(yīng)用:迭代行業(yè)場景

      建立垂直行業(yè)的平臺生態(tài)、迭代行業(yè)場景是觸達應(yīng)用場景落地的重要方向。目前,大語言模型已在金融、醫(yī)療、電商、營銷、傳媒、教育等多個垂直領(lǐng)域展開應(yīng)用,并不斷展望新的應(yīng)用場景。國外主要通過在垂直領(lǐng)域嵌入大語言模型的方式進行應(yīng)用,如摩根士丹利利用GPT-4搜索研報內(nèi)容,協(xié)助資管顧問工作;海外生鮮電商平臺Intacart的食物搜索工具基于ChatGPT推出了食物推薦應(yīng)用,為客戶購物提供參考;客戶關(guān)系管理領(lǐng)域SaaS巨頭Salesforce基于ChatGPT推出了相關(guān)AI產(chǎn)品,幫助銷售人員、客服專員等完成基礎(chǔ)性工作。國內(nèi)企業(yè)則根據(jù)自身產(chǎn)業(yè)生態(tài)布局,致力打造垂直基礎(chǔ)大模型。以百度為例,百度和多行業(yè)的頭部企業(yè)聯(lián)合研發(fā)融合了行業(yè)數(shù)據(jù)和專家經(jīng)驗的NLP大模型,如與國家電網(wǎng)聯(lián)合打造的NLP大模型“國網(wǎng)—百度·文心”,通過設(shè)計電力領(lǐng)域?qū)嶓w判別和文檔判別等作為預(yù)訓(xùn)練任務(wù)讓文心模型深度學(xué)習(xí)電力行業(yè)知識,實現(xiàn)了對數(shù)據(jù)、算力與技術(shù)等資源的統(tǒng)籌優(yōu)化;與人民網(wǎng)輿情數(shù)據(jù)中心合作研發(fā)了“人民網(wǎng)—百度·文心”大模型,在人民網(wǎng)輿情數(shù)據(jù)中心積淀的行業(yè)知識和任務(wù)樣本數(shù)據(jù)的基礎(chǔ)上進行訓(xùn)練,并已應(yīng)用于輿情分析、新聞內(nèi)容審核分類、新聞?wù)傻阮I(lǐng)域,相較從前的基線模型,大模型在人民網(wǎng)各應(yīng)用的自然語言處理任務(wù)效果方面有了顯著提升。

      探索大模型在各垂直領(lǐng)域場景中的應(yīng)用,觸達多個細分場景與業(yè)務(wù)場景的應(yīng)用落地,有利于推動相關(guān)產(chǎn)業(yè)實現(xiàn)從人力密集型向智能密集型轉(zhuǎn)變,實現(xiàn)產(chǎn)業(yè)的智能化升級,進一步解放重復(fù)性腦力工作勞動力??偟膩碚f,大語言模型的落地應(yīng)用仍處于初級發(fā)展狀態(tài),性能和配套服務(wù)不足、產(chǎn)業(yè)模式不成熟、存在隱私漏洞、監(jiān)管體系尚未建立等是亟待解決的阻礙其落地進程的問題。隨著產(chǎn)業(yè)模式發(fā)展日趨成熟,大語言模型的產(chǎn)業(yè)結(jié)構(gòu)將進一步分化,形成囊括“上游—中游—下游”全流域的產(chǎn)業(yè)鏈格局,加快產(chǎn)業(yè)智能化發(fā)展的步伐。

      三、大語言模型的應(yīng)用風(fēng)險及治理策略的最新進展

      由于大語言模型自身存在的技術(shù)問題,加上相關(guān)法律法規(guī)不完善,導(dǎo)致大語言模型在落地應(yīng)用過程中存在諸多亟待治理的問題,美國、中國也相繼在生成式人工智能的治理領(lǐng)域開展布局。

      (一)大語言模型落地應(yīng)用存在的風(fēng)險

      從技術(shù)層面來看,一方面,由于大語言模型的生成機制難以解釋,其回答也難以追溯其邏輯與理由,缺乏可解釋性,容易生成錯誤信息,影響用戶判斷。在法律、醫(yī)學(xué)等嚴謹、敏感的領(lǐng)域,錯誤的法律和醫(yī)學(xué)知識可能會導(dǎo)致用戶違法或使用錯誤急救方式,對自身健康和社會安全造成傷害。加上大語言模型存在算法偏見,可能會無意中放大社會文化歧視,誤導(dǎo)用戶的價值觀。另一方面,人工智能是基于收錄了他人享有版權(quán)作品的數(shù)據(jù)庫生成內(nèi)容,因此生成內(nèi)容很可能面臨侵權(quán)風(fēng)險。

      從社會層面來看,第一,大語言模型可能會侵犯用戶隱私、泄露一些組織乃至國家的機密信息,對個人身心健康、企業(yè)安全和國家安全造成威脅。第二,大語言模型易被多行業(yè)、多領(lǐng)域濫用,例如,內(nèi)容生成技術(shù)使得以低廉價格生成有效虛假信息等成為可能,有可能誘發(fā)信息欺詐、線上詐騙等犯罪行為;在現(xiàn)有教育體系缺乏應(yīng)對準備的情況下,學(xué)生可能會在開卷測試中用其作弊或出現(xiàn)利用AI生成文本生成論文的學(xué)術(shù)不端行為。第三,大模型在內(nèi)容生成與數(shù)據(jù)預(yù)測方面的能力較高,對重復(fù)性工作的可替代性強,有可能對傳統(tǒng)的低創(chuàng)造性與低情感性腦力勞動崗位的嚴重威脅。第四,大語言模型的普及應(yīng)用可能會加大科技發(fā)達地區(qū)與其他地區(qū)之間的數(shù)字鴻溝。

      (二)大語言模型落地應(yīng)用的治理策略進展

      由于這類生成式人工智能的應(yīng)用相對較新,它們在很大程度上仍處于無監(jiān)管狀態(tài)。目前,為促進生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用,各國都在就如何對生成類人工智能進行有效治理與監(jiān)管這一問題進行積極探索,并有了初步進展。

      美國率先對生成式人工智能的監(jiān)管領(lǐng)域展開探索。2023年1月26日,美國國家標準與技術(shù)研究院發(fā)布了《AI風(fēng)險管理框架1.0》,從治理、映射、測量和管理四部分對AI風(fēng)險管控與問責(zé)制度等進行了規(guī)定。5月5日,美國國家科學(xué)基金會宣布將撥款1.4億美元成立7個國家級人工智能研究機構(gòu),確保美國在AI領(lǐng)域保持領(lǐng)先的同時遏制AI引發(fā)的社會問題和道德問題。5月16日,OpenAI的CEO Sam

      Altman出席了美國參議院聽證會,參與關(guān)于AI監(jiān)管話題的討論。在聽證會上,Sam Altman建議通過成立監(jiān)管AI的新的政府機構(gòu),為AI模型創(chuàng)建安全標準,要求獨立專家對模型在各指標上的表現(xiàn)進行獨立審核,對AI模型進行嚴格監(jiān)管,并認為生成式人工智能工具需要一套新的責(zé)任框架。紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)名譽教授Gary Marcus在會上也指出,此前熱議的“暫停大規(guī)模人工智能模型研發(fā)”聯(lián)名信的目的并非要求暫停研發(fā)AI,而是希望在具備足夠規(guī)范、安全的AI管理措施出臺之前,暫停部署比GPT-4更大的AI模型。

      2023年4月11日,我國國家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,明確了生成式人工智能的定義、相關(guān)產(chǎn)品和服務(wù)提供者的合規(guī)義務(wù)。這意味著我國將逐步完善人工智能法律體系,對生成式人工智能進行嚴格、科學(xué)監(jiān)管。

      四、結(jié)語

      大語言模型的多模態(tài)發(fā)展趨勢特征進一步拓寬了語言生成的場景應(yīng)用維度和商業(yè)化維度,如何實現(xiàn)內(nèi)容安全、數(shù)據(jù)安全和保護個人隱私,如何處理競爭關(guān)系,如何高效賦能行業(yè),將成為生成式大模型應(yīng)用規(guī)?;仨氁紤]和解決的技術(shù)問題與社會問題,在生成式人工智能的治理問題上,政府、企業(yè)、用戶等應(yīng)進一步合力探索。

      參考文獻:

      [1]趙朝陽,朱貴波,王金橋.Chat GPT給語言大模型帶來的啟示和多模態(tài)大模型新的發(fā)展思路[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023,7(3):26-35.

      [2]易觀分析.AIGC產(chǎn)業(yè)研究報告2023:語言生成篇[EB/OL].(202

      3-05-16)[2023-05-19].https://mp.weixin.qq.com/s/MMZE08EVc3jItWc

      BJyIpjg.

      [3]騰訊科技.Meta推出大語言模型LLaMA參加AI大戰(zhàn):比GPT-3小10倍,表現(xiàn)更好[EB/OL].(2023-02-25)[2023-05-19].https://new.qq.com/rain/a/20230225A021BI00.

      [4]華東政法大學(xué)政治學(xué)研究院和人工智能與大數(shù)據(jù)指數(shù)研究院.人工智能通用大模型(Chat GPT)的進展、風(fēng)險與應(yīng)對[EB/OL].(2023

      -02-23)[2023-05-19].http://fxcxw.org.cn/dyna/content.php?id=25211.

      作者簡介:郭全中,中央民族大學(xué)新聞與傳播學(xué)院教授(北京 100081),互聯(lián)網(wǎng)平臺企業(yè)發(fā)展與治理研究中心主任(北京 100081),江蘇紫金傳媒智庫高級研究員(南京 211199);朱燕,中央民族大學(xué)新聞與傳播學(xué)院碩士生(北京 100081)。

      編校:王 謙

      猜你喜歡
      大語言模型
      基于ChatGPT的管理會計應(yīng)用場景研究
      會計之友(2024年6期)2024-03-03 16:57:44
      反思與重構(gòu):中國式現(xiàn)代化進程中的 人工智能“中國方案”
      ChatGPT技術(shù)原理及未來影響研究
      財務(wù)共享服務(wù)中心的大語言模型應(yīng)用探究
      會計之友(2023年15期)2023-08-04 14:34:08
      人工智能需要“靈魂”嗎
      生成式人工智能的教育應(yīng)用與展望
      杭锦后旗| 台中县| 赤壁市| 沅陵县| 赤峰市| 上杭县| 武汉市| 鸡西市| 连城县| 陈巴尔虎旗| 双辽市| 郎溪县| 菏泽市| 永兴县| 德阳市| 吴川市| 湖北省| 阿拉善左旗| 卓尼县| 新龙县| 双牌县| 阳城县| 西盟| 安岳县| 华坪县| 嘉鱼县| 大港区| 昂仁县| 江陵县| 靖宇县| 宝鸡市| 涟水县| 徐水县| 普格县| 容城县| 舞钢市| 长子县| 綦江县| 宣化县| 汤阴县| 凯里市|