騰訊的大模型故事　為什么要從產(chǎn)業(yè)開(kāi)始？

2023-11-26 23:43:08張?zhí)靷?/span>

新財(cái)富 2023年10期

關(guān)鍵詞：模型

張?zhí)靷?/p>

面對(duì)大模型這樣一個(gè)被馬化騰視為幾百年不遇、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇，騰訊終于公布了其在這一領(lǐng)域的全面布局。

一方面，騰訊通過(guò)混元大模型、騰訊云MaaS，將大模型能力應(yīng)用于內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。另一方面，騰訊在企業(yè)服務(wù)、人工智能領(lǐng)域的投資已累計(jì)超過(guò)280起，其中包括估值達(dá)到12.5億美元的大模型初創(chuàng)企業(yè)MiniMax。

種種跡象表明，騰訊的大模型故事將著重從B端市場(chǎng)展開(kāi)。

從6月18日在國(guó)內(nèi)率先推出行業(yè)大模型解決方案騰訊云MaaS（Modelas-a-Service，模型即服務(wù)），到9月7日將混元大模型放到其在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域最具影響力的“全球數(shù)字生態(tài)大會(huì)”上發(fā)布，騰訊對(duì)產(chǎn)業(yè)互聯(lián)網(wǎng)的重視，可見(jiàn)一斑。某種意義上說(shuō)，已在C端擁有數(shù)個(gè)覆蓋10億級(jí)用戶的騰訊，未來(lái)能否再造一個(gè)騰訊，系于B端。

事實(shí)上，在人們的新鮮勁過(guò)后，年初爆火的ChatGPT自今年6月起便陷入了流量瓶頸。根據(jù)SimilarWeb的監(jiān)測(cè)數(shù)據(jù)，其用戶數(shù)量從5月最高的19億人下滑至7月的15億人。這也讓大模型在C端直接以產(chǎn)品形式落地的商業(yè)前景蒙上陰影。

相比較下，數(shù)字化轉(zhuǎn)型需求更為明確的產(chǎn)業(yè)客戶，對(duì)大模型出色的語(yǔ)言理解、內(nèi)容生成等能力，有著更強(qiáng)的付費(fèi)意愿。因此，在To C或To B的路線選擇上，騰訊從商業(yè)模式的角度出發(fā)，選擇率先從后者發(fā)力。

在騰訊云副總裁吳運(yùn)聲眼中，產(chǎn)業(yè)場(chǎng)景是大模型的最佳練兵場(chǎng)，而大模型也可以為騰訊To B業(yè)務(wù)的商業(yè)模式拓展提供新的思考?！爱?dāng)前，企業(yè)客戶在應(yīng)用大模型時(shí)，會(huì)面臨計(jì)算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗(yàn)少等現(xiàn)實(shí)問(wèn)題的挑戰(zhàn)。拆解客戶所遇到的問(wèn)題，也會(huì)為我們帶來(lái)很多業(yè)務(wù)契機(jī)?！?/p>

同時(shí)，借力大模型，打破騰訊云長(zhǎng)期面臨的“增收不增利”的局面，或也是另一種期待。

圖1：騰訊金融科技及企業(yè)服務(wù)業(yè)務(wù)收入

數(shù)據(jù)來(lái)源：Wind，新財(cái)富整理

自2018年進(jìn)軍產(chǎn)業(yè)互聯(lián)網(wǎng)以來(lái)，騰訊面向B端客戶的金融科技與企業(yè)服務(wù)業(yè)務(wù)收入在不斷增長(zhǎng)，2019-2022 年從1013.55 億元增至1770.64億元，占營(yíng)收的比例從26.9%提升至31.9%（圖1），但一份券商研究報(bào)告顯示，2020至2022年，騰訊云的毛利率均為負(fù)值。

以至于在主打“ 降本增效”的2022 年，騰訊云與智慧產(chǎn)業(yè)事業(yè)群（CSIG）明確各業(yè)務(wù)要全面提升利潤(rùn)率更高的自研產(chǎn)品比例，并將業(yè)績(jī)考核重點(diǎn)轉(zhuǎn)為業(yè)務(wù)的利潤(rùn)水平。

“我們始終認(rèn)為，大模型需要基于產(chǎn)業(yè)場(chǎng)景，與企業(yè)數(shù)據(jù)融合，才能釋放出最大的價(jià)值?！彬v訊集團(tuán)高級(jí)執(zhí)行副總裁、CSIG負(fù)責(zé)人湯道生稱。

那么，當(dāng)混元大模型正式亮相，騰訊云MaaS能力完成升級(jí)迭代，騰訊To B業(yè)務(wù)的發(fā)展又將產(chǎn)生什么樣的變化？

商業(yè)鏈路：從技術(shù)底座到智能應(yīng)用

“騰訊會(huì)議基于混元大模型打造的AI小助手，已經(jīng)能夠通過(guò)簡(jiǎn)單的自然語(yǔ)言指令，完成會(huì)議信息提取、內(nèi)容分析等復(fù)雜任務(wù)，會(huì)后還能生成智能總結(jié)紀(jì)要。”在2023騰訊全球數(shù)字生態(tài)大會(huì)上，騰訊集團(tuán)副總裁蔣杰分享的案例顯示，擁有超3億用戶數(shù)的騰訊會(huì)議，已開(kāi)始應(yīng)用大模型的能力。

大模型本身并非一個(gè)新的事物。在吳運(yùn)聲看來(lái)，大模型的本質(zhì)是深度學(xué)習(xí)，而騰訊早在十幾年前便已開(kāi)始對(duì)深度學(xué)習(xí)進(jìn)行布局。只是當(dāng)2017年谷歌提出神經(jīng)網(wǎng)絡(luò)模型Transformer，驅(qū)動(dòng)深度學(xué)習(xí)模型參數(shù)從過(guò)去的以千為單位，發(fā)展至如今超過(guò)千億級(jí)別的大模型，并在2022年底爆發(fā)時(shí)，才闖入了人們的視野。

拆解騰訊在大模型領(lǐng)域的布局，可分為三大模塊。第一塊是騰訊云過(guò)去研發(fā)、積累的算力、算法、數(shù)據(jù)等基礎(chǔ)設(shè)施及AI工具，這是大模型訓(xùn)練的前提條件。

“ 在ChatGPT爆火后，CSIG內(nèi)部甚至沒(méi)有專門(mén)針對(duì)行業(yè)大模型的立項(xiàng)。各個(gè)團(tuán)隊(duì)最大的變化是在日常溝通時(shí)增加了很多與大模型相關(guān)的深入探討，包括與現(xiàn)有產(chǎn)品的結(jié)合，以及未來(lái)商業(yè)路徑的選擇?！眳沁\(yùn)聲稱。

第二塊，基于各類基礎(chǔ)設(shè)施及工具，騰訊全鏈路自研出了基礎(chǔ)大模型“混元”。所謂基礎(chǔ)模型，是在大量無(wú)標(biāo)簽數(shù)據(jù)集上訓(xùn)練的AI神經(jīng)網(wǎng)絡(luò)，可處理從翻譯文本到分析醫(yī)學(xué)影像等各種工作。

第三塊，是以混元大模型為基礎(chǔ)模型所衍生的各類應(yīng)用及服務(wù)。典型如面向企業(yè)客戶的“騰訊云MaaS服務(wù)”，即是將混元大模型與騰訊云過(guò)去積累的行業(yè)解決方案、企業(yè)級(jí)應(yīng)用結(jié)合后的一類業(yè)務(wù)模式。而騰訊會(huì)議上的“AI小助手”則是混元大模型與騰訊企業(yè)級(jí)應(yīng)用的融合案例。

騰訊圍繞大模型所構(gòu)建的新的商業(yè)模式，也大抵延著以上三大模塊而展開(kāi)。例如，騰訊在利用HCC高性能計(jì)算集群、星脈高性能計(jì)算網(wǎng)絡(luò)、向量數(shù)據(jù)庫(kù)等基礎(chǔ)設(shè)施訓(xùn)練混元大模型時(shí)，也同樣可將這些基礎(chǔ)設(shè)施提供給在軟、硬件設(shè)施上有短板，但同樣有大模型訓(xùn)練需求的客戶。

據(jù)騰訊集團(tuán)副總裁、政企業(yè)務(wù)總裁李強(qiáng)透露，近期MiniMax、百川智能旗下的大模型都使用了騰訊的算力。MiniMax是由前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人閆俊杰成立的大模型初創(chuàng)公司。

而在算力層面，騰訊云先是2023年4 月發(fā)布的新一代HCC高性能計(jì)算集群，即是專為大模型訓(xùn)練所設(shè)計(jì)，能夠提供高性能、高帶寬、低延遲的智算能力支撐。而后是在7 月，基于每日處理千億次檢索的向量引擎（OLAMA），推出向量數(shù)據(jù)庫(kù)（Tencent Cloud VectorDB），使數(shù)據(jù)接入AI的效率較傳統(tǒng)方案提升10倍?！爱?dāng)你想在大模型中找到一張帶‘貓的圖片，騰訊云向量數(shù)據(jù)庫(kù)能在100毫秒內(nèi)，從10億張向量化的圖片中，返回查詢結(jié)果?！睖郎硎?。

此外，在工具層面，騰訊混元大模型在訓(xùn)練數(shù)據(jù)時(shí)采用的，同樣是自研的訓(xùn)練框架AngelPTM。這一框架使騰訊混元大模型的訓(xùn)練速度相比業(yè)界主流框架提升1倍，推理速度比業(yè)界主流框架提升1.3倍。

騰訊在大模型領(lǐng)域的布局，包括騰訊云積累的基礎(chǔ)設(shè)施、AI工具，以及基礎(chǔ)大模型“混元”和其衍生的應(yīng)用及服務(wù)。

一方面，AngelPTM源源不斷提供引擎動(dòng)力；另一方面，騰訊云TI平臺(tái)的工具鏈也包括TI-ONE訓(xùn)練平臺(tái)、TI-Matrix應(yīng)用平臺(tái)等，可為客戶提供大模型訓(xùn)練、精調(diào)工具鏈，以快速生成更有針對(duì)性的專屬大模型，滿足企業(yè)個(gè)性化需求。

據(jù)湯道生介紹，作為基礎(chǔ)大模型的“混元”，如今擁有超千億參數(shù)規(guī)模，預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens（可被認(rèn)為是詞語(yǔ)的片段），具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力，以及可靠的任務(wù)執(zhí)行能力。

而基于混元大模型所構(gòu)建的行業(yè)大模型精選商店“騰訊云MaaS服務(wù)”，即是將騰訊云在基礎(chǔ)設(shè)施、行業(yè)解決方案、企業(yè)級(jí)應(yīng)用等領(lǐng)域的積累升級(jí)打包所形成的一站式服務(wù)。

“在騰訊云行業(yè)大模型精選商店中，我們不僅提供混元大模型，還上架了20多種行業(yè)最新、最流行的開(kāi)源通用大模型，以及覆蓋金融、文旅、零售、政務(wù)、醫(yī)療、教育等20多個(gè)領(lǐng)域的行業(yè)大模型。企業(yè)可以根據(jù)需要，選擇合適的模型，然后借助騰訊云智能的TI平臺(tái)，導(dǎo)入企業(yè)專有數(shù)據(jù)，做進(jìn)一步的訓(xùn)練與精調(diào)，快速生成更有針對(duì)性的專屬大模型，滿足企業(yè)個(gè)性化需求。同時(shí)，我們也將大模型與騰訊的行業(yè)解決方案、企業(yè)級(jí)應(yīng)用結(jié)合，在生產(chǎn)、營(yíng)銷、售后服務(wù)、辦公等多個(gè)環(huán)節(jié)，實(shí)現(xiàn)能力提升，達(dá)至降本增效?！睖郎Q。

可以看到，基于混元大模型，以及騰訊過(guò)去在人工智能領(lǐng)域的積累，已經(jīng)針對(duì)B端客戶對(duì)大模型的各類需求設(shè)計(jì)出了一條極長(zhǎng)的商業(yè)鏈路。

在拆解騰訊大模型商業(yè)路徑的同時(shí)，吳運(yùn)聲反復(fù)強(qiáng)調(diào)，推出“騰訊云MaaS服務(wù)”的初衷，是從多個(gè)角度解決B端客戶需求。除降本增效外，其需求還包括賦能傳統(tǒng)產(chǎn)業(yè)跨界融合、實(shí)現(xiàn)創(chuàng)新升級(jí)等。

吳運(yùn)聲在騰訊集團(tuán)內(nèi)部身兼多職，除了擔(dān)任騰訊云副總裁外，他還是騰訊云智能負(fù)責(zé)人以及優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人，其工作重心之一便是強(qiáng)化AI技術(shù)與騰訊云的底層融合。

例如由其負(fù)責(zé)的優(yōu)圖實(shí)驗(yàn)室成立于2012年，如今已通過(guò)計(jì)算機(jī)視覺(jué)算法的迭代，實(shí)現(xiàn)對(duì)人臉識(shí)別、圖像識(shí)別、視頻特效等功能的持續(xù)優(yōu)化，其應(yīng)用落地場(chǎng)景從最初的QQ空間的“面孔墻”、微眾銀行的“人臉遠(yuǎn)程開(kāi)戶”，到如今，已深入教育、金融、工業(yè)等領(lǐng)域，構(gòu)建了超過(guò)50個(gè)行業(yè)應(yīng)用。而在2021年成立的騰訊云智能品牌，則將騰訊分散于優(yōu)圖等實(shí)驗(yàn)室的AI能力進(jìn)一步深度融合，目的是形成一條完整的AI產(chǎn)業(yè)落地鏈條。

據(jù)吳運(yùn)聲透露，如今騰訊云團(tuán)隊(duì)從對(duì)接企業(yè)大模型需求，至行業(yè)大模型方案的最終落地，通?？煞譃樗膫€(gè)步驟。

第一步是了解客戶需求。例如，有客戶想做基于語(yǔ)音識(shí)別的大模型，那么，騰訊云便需要了解客戶擁有的語(yǔ)音文件的數(shù)量、規(guī)模，以及語(yǔ)音中的專業(yè)化術(shù)語(yǔ)等，這一環(huán)節(jié)考驗(yàn)的是團(tuán)隊(duì)對(duì)行業(yè)及企業(yè)的理解。

第二步是結(jié)合客戶需求、預(yù)算，以及所掌握的訓(xùn)練數(shù)據(jù)量等，推薦基底模型?！巴ǔ＃覀儠?huì)推薦3-5 個(gè)基底模型做實(shí)驗(yàn)，最終選擇一個(gè)最為合適的?！眳沁\(yùn)聲稱。

第三步是基于基底模型進(jìn)行數(shù)據(jù)訓(xùn)練，其中涉及TI機(jī)器學(xué)習(xí)平臺(tái)、HCC高性能計(jì)算集群等基礎(chǔ)設(shè)施的應(yīng)用。

第四步，當(dāng)模型正式上線，騰訊云還會(huì)負(fù)責(zé)數(shù)據(jù)存儲(chǔ)、算力資源部署等運(yùn)維工作，以及后期大模型的優(yōu)化及迭代。

如今，CSIG內(nèi)部涉及人工智能研究的產(chǎn)品團(tuán)隊(duì)，幾乎將一半的重心放在了大模型方向。湯道生稱，目前CSIG已和1.1 萬(wàn)家生態(tài)伙伴展開(kāi)合作，推出覆蓋100多個(gè)產(chǎn)業(yè)場(chǎng)景的行業(yè)解決方案，服務(wù)了60多萬(wàn)家制造企業(yè)。未來(lái)，在大模型加持下，騰訊云所創(chuàng)造的商業(yè)價(jià)值能否成為騰訊繼移動(dòng)社交、網(wǎng)絡(luò)游戲之外的第三大增長(zhǎng)極，值得關(guān)注。

應(yīng)用場(chǎng)景：無(wú)聲勝有聲

盡管不少人期待騰訊能基于大模型，推出一款如微信般的重量級(jí)產(chǎn)品，但目前，騰訊卻是將大模型能力更多地應(yīng)用于騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等多個(gè)騰訊內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。有騰訊內(nèi)部員工對(duì)新財(cái)富表示，未來(lái)大模型的能力將會(huì)無(wú)處不在，但人們?nèi)舴鞘钟眯?，甚至可能都感受不到?/p>

除騰訊會(huì)議外，大模型“潤(rùn)物細(xì)無(wú)聲”的特性還出現(xiàn)在諸多騰訊內(nèi)部的產(chǎn)品之中。典型如已接入包括廣汽在內(nèi)的15家車企、超300萬(wàn)臺(tái)汽車的騰訊云車載助手，過(guò)去曾存在上下文理解準(zhǔn)確率低、復(fù)雜場(chǎng)景下語(yǔ)義理解問(wèn)題不理想等問(wèn)題，如今，行業(yè)大模型的應(yīng)用，正提升其理解車主復(fù)雜意圖的能力及應(yīng)答能力，最終用戶感受到的，是更自然的人機(jī)對(duì)話、更合理的行程規(guī)劃，甚至是通用知識(shí)問(wèn)答能力。

與此同時(shí)，行業(yè)大模型對(duì)于企業(yè)“降本增效”的作用也在逐步顯現(xiàn)。騰訊云分享了一個(gè)服務(wù)稅務(wù)部門(mén)的案例?過(guò)去，當(dāng)傳統(tǒng)智能客服遇到不在知識(shí)庫(kù)的問(wèn)題時(shí)，常常無(wú)法答復(fù)或答非所問(wèn)，最終依舊需要稅務(wù)部門(mén)鋪設(shè)人力去完成服務(wù)。此外，政策法規(guī)、辦事指南持續(xù)迭代，需不斷投入人力梳理。問(wèn)題攔截率、覆蓋率低，急需擴(kuò)展客服的問(wèn)答邊界等問(wèn)題，導(dǎo)致智能客服讓人感覺(jué)不智能。

而2023 年后，基于MaaS能力，騰訊云打造的專屬政務(wù)大模型，從知識(shí)采集到知識(shí)運(yùn)營(yíng)均實(shí)現(xiàn)了智能化升級(jí)，業(yè)務(wù)咨詢的解答率大幅提升。盡管這極大提升了稅務(wù)部門(mén)的服務(wù)效率，節(jié)約了人力成本，但不常跑稅務(wù)部門(mén)的人，并不容易察覺(jué)這一變化。

據(jù)透露，騰訊云MaaS能力已在騰訊企點(diǎn)客服、騰訊企點(diǎn)分析、數(shù)智人、車載助手、AI繪畫(huà)、文案創(chuàng)作等超50個(gè)產(chǎn)品中進(jìn)行了模型可用性、易用性等方面驗(yàn)證。

除了服務(wù)企業(yè)，混元大模型亦落地于面向C端群體的騰訊廣告系統(tǒng)升級(jí)，提升了系統(tǒng)在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的能力，在為騰訊廣告帶來(lái)大幅GMV提升的同時(shí)，也初步驗(yàn)證了大模型在C端場(chǎng)景的商業(yè)化潛力。2023 年上半年，騰訊的網(wǎng)絡(luò)廣告業(yè)務(wù)同比增長(zhǎng)25.5%，較2022年同期增收93億元。

發(fā)力大模型投資

圖2：2018 年至今騰訊在各領(lǐng)域的投資筆數(shù)

數(shù)據(jù)來(lái)源：執(zhí)中數(shù)據(jù)，新財(cái)富整理

對(duì)于大模型這樣一個(gè)被馬化騰視為幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇，騰訊在投資層面也在加緊布局。

執(zhí)中數(shù)據(jù)顯示，2023年以來(lái)，騰訊分別在4月、6月投資了深言科技、MiniMax兩家大模型創(chuàng)業(yè)企業(yè)。

深言科技創(chuàng)始人兼CEO豈凡超，是清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系2017級(jí)博士畢業(yè)生，主要研究方向?yàn)樽匀徽Z(yǔ)言處理（NLP），曾在EMNLP等頂會(huì)發(fā)表論文30 多篇。據(jù)公開(kāi)資料，深言科技團(tuán)隊(duì)孵化自清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室和北京智源人工智能研究院，由歐洲科學(xué)院院士、清華大學(xué)計(jì)算機(jī)系教授孫茂松領(lǐng)銜，并出任首席科學(xué)家。

在2023 年舉行的第三屆“清華大學(xué)國(guó)強(qiáng)研究院杯”雙創(chuàng)大賽的路演環(huán)節(jié)中，豈凡超稱，深言科技的大規(guī)模預(yù)訓(xùn)練模型在續(xù)寫(xiě)、改寫(xiě)、擴(kuò)寫(xiě)、摘要4類文本生成任務(wù)和6個(gè)數(shù)據(jù)集上，均超過(guò)現(xiàn)有其他中文模型，達(dá)到了當(dāng)前最好的中文文本生成效果。這次大賽，深言科技的“基于超大模型的新一代語(yǔ)言理解與生成平臺(tái)”項(xiàng)目斬獲技術(shù)創(chuàng)新賽初創(chuàng)組一等獎(jiǎng)。

在獲得騰訊投資后，深言科技估值為1億美元。據(jù)執(zhí)中數(shù)據(jù)，與騰訊共同投資的機(jī)構(gòu)還包括紅杉中國(guó)、好未來(lái)、英諾天使基金等，其他輪次的知名投資方包括水木清華校友基金、奇績(jī)創(chuàng)壇等。

相較深言科技，MiniMax的來(lái)頭更大。在騰訊投資之前，MiniMax已完成兩輪融資，投資方包括米哈游、IDG資本、高瓴創(chuàng)投、云啟資本、明勢(shì)資本等。而在騰訊投資之后，MiniMax的估值已高達(dá)12億美元。

根據(jù)公開(kāi)資料，MiniMax直接從底層的基礎(chǔ)模型做起，自研了三個(gè)基礎(chǔ)模型，其法定代表人、技術(shù)合伙人楊斌曾在今年初表示，MiniMax可能是國(guó)內(nèi)第一家同時(shí)擁有三個(gè)模態(tài)大模型能力的創(chuàng)業(yè)公司。值得一提的是，在大模型對(duì)戰(zhàn)平臺(tái)SuperCLUE發(fā)布的中文大語(yǔ)言模型排行榜上，MiniMax的模型在國(guó)內(nèi)企業(yè)中排在第7名。

除投資大模型初創(chuàng)企業(yè)之外，近年間騰訊對(duì)B端生態(tài)的加速布局，或?yàn)槠湓诖竽Ｐ皖I(lǐng)域的突破積累了更多的籌碼。根據(jù)執(zhí)中數(shù)據(jù)，自2018年騰訊入局產(chǎn)業(yè)互聯(lián)網(wǎng)以來(lái)，其在企業(yè)服務(wù)領(lǐng)域的投資事件已達(dá)到178起，僅次于文化娛樂(lè)領(lǐng)域的221起，且對(duì)人工智能的投資也達(dá)到38起（圖2）。

可以想見(jiàn)，在騰訊云MaaS服務(wù)的加持下，騰訊的To B戰(zhàn)事才剛剛開(kāi)始。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看