張?zhí)靷?/p>
面對(duì)大模型這樣一個(gè)被馬化騰視為幾百年不遇、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇,騰訊終于公布了其在這一領(lǐng)域的全面布局。
一方面,騰訊通過(guò)混元大模型、騰訊云MaaS,將大模型能力應(yīng)用于內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。另一方面,騰訊在企業(yè)服務(wù)、人工智能領(lǐng)域的投資已累計(jì)超過(guò)280起,其中包括估值達(dá)到12.5億美元的大模型初創(chuàng)企業(yè)MiniMax。
種種跡象表明,騰訊的大模型故事將著重從B端市場(chǎng)展開(kāi)。
從6月18日在國(guó)內(nèi)率先推出行業(yè)大模型解決方案騰訊云MaaS(Modelas-a-Service,模型即服務(wù)),到9月7日將混元大模型放到其在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域最具影響力的“全球數(shù)字生態(tài)大會(huì)”上發(fā)布,騰訊對(duì)產(chǎn)業(yè)互聯(lián)網(wǎng)的重視,可見(jiàn)一斑。某種意義上說(shuō),已在C端擁有數(shù)個(gè)覆蓋10億級(jí)用戶的騰訊,未來(lái)能否再造一個(gè)騰訊,系于B端。
事實(shí)上,在人們的新鮮勁過(guò)后,年初爆火的ChatGPT自今年6月起便陷入了流量瓶頸。根據(jù)SimilarWeb的監(jiān)測(cè)數(shù)據(jù),其用戶數(shù)量從5月最高的19億人下滑至7月的15億人。這也讓大模型在C端直接以產(chǎn)品形式落地的商業(yè)前景蒙上陰影。
相比較下,數(shù)字化轉(zhuǎn)型需求更為明確的產(chǎn)業(yè)客戶,對(duì)大模型出色的語(yǔ)言理解、內(nèi)容生成等能力,有著更強(qiáng)的付費(fèi)意愿。因此,在To C或To B的路線選擇上,騰訊從商業(yè)模式的角度出發(fā),選擇率先從后者發(fā)力。
在騰訊云副總裁吳運(yùn)聲眼中,產(chǎn)業(yè)場(chǎng)景是大模型的最佳練兵場(chǎng),而大模型也可以為騰訊To B業(yè)務(wù)的商業(yè)模式拓展提供新的思考?!爱?dāng)前,企業(yè)客戶在應(yīng)用大模型時(shí),會(huì)面臨計(jì)算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗(yàn)少等現(xiàn)實(shí)問(wèn)題的挑戰(zhàn)。拆解客戶所遇到的問(wèn)題,也會(huì)為我們帶來(lái)很多業(yè)務(wù)契機(jī)?!?/p>
同時(shí),借力大模型,打破騰訊云長(zhǎng)期面臨的“增收不增利”的局面,或也是另一種期待。
數(shù)據(jù)來(lái)源:Wind,新財(cái)富整理
自2018年進(jìn)軍產(chǎn)業(yè)互聯(lián)網(wǎng)以來(lái),騰訊面向B端客戶的金融科技與企業(yè)服務(wù)業(yè)務(wù)收入在不斷增長(zhǎng),2019-2022 年從1013.55 億元增至1770.64億元,占營(yíng)收的比例從26.9%提升至31.9%(圖1),但一份券商研究報(bào)告顯示,2020至2022年,騰訊云的毛利率均為負(fù)值。
以至于在主打“ 降本增效”的2022 年,騰訊云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)明確各業(yè)務(wù)要全面提升利潤(rùn)率更高的自研產(chǎn)品比例,并將業(yè)績(jī)考核重點(diǎn)轉(zhuǎn)為業(yè)務(wù)的利潤(rùn)水平。
“我們始終認(rèn)為,大模型需要基于產(chǎn)業(yè)場(chǎng)景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價(jià)值?!彬v訊集團(tuán)高級(jí)執(zhí)行副總裁、CSIG負(fù)責(zé)人湯道生稱。
那么,當(dāng)混元大模型正式亮相,騰訊云MaaS能力完成升級(jí)迭代,騰訊To B業(yè)務(wù)的發(fā)展又將產(chǎn)生什么樣的變化?
“騰訊會(huì)議基于混元大模型打造的AI小助手,已經(jīng)能夠通過(guò)簡(jiǎn)單的自然語(yǔ)言指令,完成會(huì)議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會(huì)后還能生成智能總結(jié)紀(jì)要。”在2023騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊集團(tuán)副總裁蔣杰分享的案例顯示,擁有超3億用戶數(shù)的騰訊會(huì)議,已開(kāi)始應(yīng)用大模型的能力。
大模型本身并非一個(gè)新的事物。在吳運(yùn)聲看來(lái),大模型的本質(zhì)是深度學(xué)習(xí),而騰訊早在十幾年前便已開(kāi)始對(duì)深度學(xué)習(xí)進(jìn)行布局。只是當(dāng)2017年谷歌提出神經(jīng)網(wǎng)絡(luò)模型Transformer,驅(qū)動(dòng)深度學(xué)習(xí)模型參數(shù)從過(guò)去的以千為單位,發(fā)展至如今超過(guò)千億級(jí)別的大模型,并在2022年底爆發(fā)時(shí),才闖入了人們的視野。
拆解騰訊在大模型領(lǐng)域的布局,可分為三大模塊。第一塊是騰訊云過(guò)去研發(fā)、積累的算力、算法、數(shù)據(jù)等基礎(chǔ)設(shè)施及AI工具,這是大模型訓(xùn)練的前提條件。
“ 在ChatGPT爆火后,CSIG內(nèi)部甚至沒(méi)有專門(mén)針對(duì)行業(yè)大模型的立項(xiàng)。各個(gè)團(tuán)隊(duì)最大的變化是在日常溝通時(shí)增加了很多與大模型相關(guān)的深入探討,包括與現(xiàn)有產(chǎn)品的結(jié)合,以及未來(lái)商業(yè)路徑的選擇?!眳沁\(yùn)聲稱。
第二塊,基于各類基礎(chǔ)設(shè)施及工具,騰訊全鏈路自研出了基礎(chǔ)大模型“混元”。所謂基礎(chǔ)模型,是在大量無(wú)標(biāo)簽數(shù)據(jù)集上訓(xùn)練的AI神經(jīng)網(wǎng)絡(luò),可處理從翻譯文本到分析醫(yī)學(xué)影像等各種工作。
第三塊,是以混元大模型為基礎(chǔ)模型所衍生的各類應(yīng)用及服務(wù)。典型如面向企業(yè)客戶的“騰訊云MaaS服務(wù)”,即是將混元大模型與騰訊云過(guò)去積累的行業(yè)解決方案、企業(yè)級(jí)應(yīng)用結(jié)合后的一類業(yè)務(wù)模式。而騰訊會(huì)議上的“AI小助手”則是混元大模型與騰訊企業(yè)級(jí)應(yīng)用的融合案例。
騰訊圍繞大模型所構(gòu)建的新的商業(yè)模式,也大抵延著以上三大模塊而展開(kāi)。例如,騰訊在利用HCC高性能計(jì)算集群、星脈高性能計(jì)算網(wǎng)絡(luò)、向量數(shù)據(jù)庫(kù)等基礎(chǔ)設(shè)施訓(xùn)練混元大模型時(shí),也同樣可將這些基礎(chǔ)設(shè)施提供給在軟、硬件設(shè)施上有短板,但同樣有大模型訓(xùn)練需求的客戶。
據(jù)騰訊集團(tuán)副總裁、政企業(yè)務(wù)總裁李強(qiáng)透露,近期MiniMax、百川智能旗下的大模型都使用了騰訊的算力。MiniMax是由前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人閆俊杰成立的大模型初創(chuàng)公司。
而在算力層面,騰訊云先是2023年4 月發(fā)布的新一代HCC高性能計(jì)算集群,即是專為大模型訓(xùn)練所設(shè)計(jì),能夠提供高性能、高帶寬、低延遲的智算能力支撐。而后是在7 月,基于每日處理千億次檢索的向量引擎(OLAMA),推出向量數(shù)據(jù)庫(kù)(Tencent Cloud VectorDB),使數(shù)據(jù)接入AI的效率較傳統(tǒng)方案提升10倍?!爱?dāng)你想在大模型中找到一張帶‘貓的圖片,騰訊云向量數(shù)據(jù)庫(kù)能在100毫秒內(nèi),從10億張向量化的圖片中,返回查詢結(jié)果?!睖郎硎?。
此外,在工具層面,騰訊混元大模型在訓(xùn)練數(shù)據(jù)時(shí)采用的,同樣是自研的訓(xùn)練框架AngelPTM。這一框架使騰訊混元大模型的訓(xùn)練速度相比業(yè)界主流框架提升1倍,推理速度比業(yè)界主流框架提升1.3倍。
騰訊在大模型領(lǐng)域的布局,包括騰訊云積累的基礎(chǔ)設(shè)施、AI工具,以及基礎(chǔ)大模型“混元”和其衍生的應(yīng)用及服務(wù)。
一方面,AngelPTM源源不斷提供引擎動(dòng)力;另一方面,騰訊云TI平臺(tái)的工具鏈也包括TI-ONE訓(xùn)練平臺(tái)、TI-Matrix應(yīng)用平臺(tái)等,可為客戶提供大模型訓(xùn)練、精調(diào)工具鏈,以快速生成更有針對(duì)性的專屬大模型,滿足企業(yè)個(gè)性化需求。
據(jù)湯道生介紹,作為基礎(chǔ)大模型的“混元”,如今擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens(可被認(rèn)為是詞語(yǔ)的片段),具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
而基于混元大模型所構(gòu)建的行業(yè)大模型精選商店“騰訊云MaaS服務(wù)”,即是將騰訊云在基礎(chǔ)設(shè)施、行業(yè)解決方案、企業(yè)級(jí)應(yīng)用等領(lǐng)域的積累升級(jí)打包所形成的一站式服務(wù)。
“在騰訊云行業(yè)大模型精選商店中,我們不僅提供混元大模型,還上架了20多種行業(yè)最新、最流行的開(kāi)源通用大模型,以及覆蓋金融、文旅、零售、政務(wù)、醫(yī)療、教育等20多個(gè)領(lǐng)域的行業(yè)大模型。企業(yè)可以根據(jù)需要,選擇合適的模型,然后借助騰訊云智能的TI平臺(tái),導(dǎo)入企業(yè)專有數(shù)據(jù),做進(jìn)一步的訓(xùn)練與精調(diào),快速生成更有針對(duì)性的專屬大模型,滿足企業(yè)個(gè)性化需求。同時(shí),我們也將大模型與騰訊的行業(yè)解決方案、企業(yè)級(jí)應(yīng)用結(jié)合,在生產(chǎn)、營(yíng)銷、售后服務(wù)、辦公等多個(gè)環(huán)節(jié),實(shí)現(xiàn)能力提升,達(dá)至降本增效?!睖郎Q。
可以看到,基于混元大模型,以及騰訊過(guò)去在人工智能領(lǐng)域的積累,已經(jīng)針對(duì)B端客戶對(duì)大模型的各類需求設(shè)計(jì)出了一條極長(zhǎng)的商業(yè)鏈路。
在拆解騰訊大模型商業(yè)路徑的同時(shí),吳運(yùn)聲反復(fù)強(qiáng)調(diào),推出“騰訊云MaaS服務(wù)”的初衷,是從多個(gè)角度解決B端客戶需求。除降本增效外,其需求還包括賦能傳統(tǒng)產(chǎn)業(yè)跨界融合、實(shí)現(xiàn)創(chuàng)新升級(jí)等。
吳運(yùn)聲在騰訊集團(tuán)內(nèi)部身兼多職,除了擔(dān)任騰訊云副總裁外,他還是騰訊云智能負(fù)責(zé)人以及優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人,其工作重心之一便是強(qiáng)化AI技術(shù)與騰訊云的底層融合。
例如由其負(fù)責(zé)的優(yōu)圖實(shí)驗(yàn)室成立于2012年,如今已通過(guò)計(jì)算機(jī)視覺(jué)算法的迭代,實(shí)現(xiàn)對(duì)人臉識(shí)別、圖像識(shí)別、視頻特效等功能的持續(xù)優(yōu)化,其應(yīng)用落地場(chǎng)景從最初的QQ空間的“面孔墻”、微眾銀行的“人臉遠(yuǎn)程開(kāi)戶”,到如今,已深入教育、金融、工業(yè)等領(lǐng)域,構(gòu)建了超過(guò)50個(gè)行業(yè)應(yīng)用。而在2021年成立的騰訊云智能品牌,則將騰訊分散于優(yōu)圖等實(shí)驗(yàn)室的AI能力進(jìn)一步深度融合,目的是形成一條完整的AI產(chǎn)業(yè)落地鏈條。
據(jù)吳運(yùn)聲透露,如今騰訊云團(tuán)隊(duì)從對(duì)接企業(yè)大模型需求,至行業(yè)大模型方案的最終落地,通??煞譃樗膫€(gè)步驟。
第一步是了解客戶需求。例如,有客戶想做基于語(yǔ)音識(shí)別的大模型,那么,騰訊云便需要了解客戶擁有的語(yǔ)音文件的數(shù)量、規(guī)模,以及語(yǔ)音中的專業(yè)化術(shù)語(yǔ)等,這一環(huán)節(jié)考驗(yàn)的是團(tuán)隊(duì)對(duì)行業(yè)及企業(yè)的理解。
第二步是結(jié)合客戶需求、預(yù)算,以及所掌握的訓(xùn)練數(shù)據(jù)量等,推薦基底模型?!巴ǔ#覀儠?huì)推薦3-5 個(gè)基底模型做實(shí)驗(yàn),最終選擇一個(gè)最為合適的?!眳沁\(yùn)聲稱。
第三步是基于基底模型進(jìn)行數(shù)據(jù)訓(xùn)練,其中涉及TI機(jī)器學(xué)習(xí)平臺(tái)、HCC高性能計(jì)算集群等基礎(chǔ)設(shè)施的應(yīng)用。
第四步,當(dāng)模型正式上線,騰訊云還會(huì)負(fù)責(zé)數(shù)據(jù)存儲(chǔ)、算力資源部署等運(yùn)維工作,以及后期大模型的優(yōu)化及迭代。
如今,CSIG內(nèi)部涉及人工智能研究的產(chǎn)品團(tuán)隊(duì),幾乎將一半的重心放在了大模型方向。湯道生稱,目前CSIG已和1.1 萬(wàn)家生態(tài)伙伴展開(kāi)合作,推出覆蓋100多個(gè)產(chǎn)業(yè)場(chǎng)景的行業(yè)解決方案,服務(wù)了60多萬(wàn)家制造企業(yè)。未來(lái),在大模型加持下,騰訊云所創(chuàng)造的商業(yè)價(jià)值能否成為騰訊繼移動(dòng)社交、網(wǎng)絡(luò)游戲之外的第三大增長(zhǎng)極,值得關(guān)注。
盡管不少人期待騰訊能基于大模型,推出一款如微信般的重量級(jí)產(chǎn)品,但目前,騰訊卻是將大模型能力更多地應(yīng)用于騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等多個(gè)騰訊內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。有騰訊內(nèi)部員工對(duì)新財(cái)富表示,未來(lái)大模型的能力將會(huì)無(wú)處不在,但人們?nèi)舴鞘钟眯?,甚至可能都感受不到?/p>
除騰訊會(huì)議外,大模型“潤(rùn)物細(xì)無(wú)聲”的特性還出現(xiàn)在諸多騰訊內(nèi)部的產(chǎn)品之中。典型如已接入包括廣汽在內(nèi)的15家車企、超300萬(wàn)臺(tái)汽車的騰訊云車載助手,過(guò)去曾存在上下文理解準(zhǔn)確率低、復(fù)雜場(chǎng)景下語(yǔ)義理解問(wèn)題不理想等問(wèn)題,如今,行業(yè)大模型的應(yīng)用,正提升其理解車主復(fù)雜意圖的能力及應(yīng)答能力,最終用戶感受到的,是更自然的人機(jī)對(duì)話、更合理的行程規(guī)劃,甚至是通用知識(shí)問(wèn)答能力。
與此同時(shí),行業(yè)大模型對(duì)于企業(yè)“降本增效”的作用也在逐步顯現(xiàn)。騰訊云分享了一個(gè)服務(wù)稅務(wù)部門(mén)的案例?過(guò)去,當(dāng)傳統(tǒng)智能客服遇到不在知識(shí)庫(kù)的問(wèn)題時(shí),常常無(wú)法答復(fù)或答非所問(wèn),最終依舊需要稅務(wù)部門(mén)鋪設(shè)人力去完成服務(wù)。此外,政策法規(guī)、辦事指南持續(xù)迭代,需不斷投入人力梳理。問(wèn)題攔截率、覆蓋率低,急需擴(kuò)展客服的問(wèn)答邊界等問(wèn)題,導(dǎo)致智能客服讓人感覺(jué)不智能。
而2023 年后,基于MaaS能力,騰訊云打造的專屬政務(wù)大模型,從知識(shí)采集到知識(shí)運(yùn)營(yíng)均實(shí)現(xiàn)了智能化升級(jí),業(yè)務(wù)咨詢的解答率大幅提升。盡管這極大提升了稅務(wù)部門(mén)的服務(wù)效率,節(jié)約了人力成本,但不常跑稅務(wù)部門(mén)的人,并不容易察覺(jué)這一變化。
據(jù)透露,騰訊云MaaS能力已在騰訊企點(diǎn)客服、騰訊企點(diǎn)分析、數(shù)智人、車載助手、AI繪畫(huà)、文案創(chuàng)作等超50個(gè)產(chǎn)品中進(jìn)行了模型可用性、易用性等方面驗(yàn)證。
除了服務(wù)企業(yè),混元大模型亦落地于面向C端群體的騰訊廣告系統(tǒng)升級(jí),提升了系統(tǒng)在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的能力,在為騰訊廣告帶來(lái)大幅GMV提升的同時(shí),也初步驗(yàn)證了大模型在C端場(chǎng)景的商業(yè)化潛力。2023 年上半年,騰訊的網(wǎng)絡(luò)廣告業(yè)務(wù)同比增長(zhǎng)25.5%,較2022年同期增收93億元。
數(shù)據(jù)來(lái)源:執(zhí)中數(shù)據(jù),新財(cái)富整理
對(duì)于大模型這樣一個(gè)被馬化騰視為幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇,騰訊在投資層面也在加緊布局。
執(zhí)中數(shù)據(jù)顯示,2023年以來(lái),騰訊分別在4月、6月投資了深言科技、MiniMax兩家大模型創(chuàng)業(yè)企業(yè)。
深言科技創(chuàng)始人兼CEO豈凡超,是清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系2017級(jí)博士畢業(yè)生,主要研究方向?yàn)樽匀徽Z(yǔ)言處理(NLP),曾在EMNLP等頂會(huì)發(fā)表論文30 多篇。據(jù)公開(kāi)資料,深言科技團(tuán)隊(duì)孵化自清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室和北京智源人工智能研究院,由歐洲科學(xué)院院士、清華大學(xué)計(jì)算機(jī)系教授孫茂松領(lǐng)銜,并出任首席科學(xué)家。
在2023 年舉行的第三屆“清華大學(xué)國(guó)強(qiáng)研究院杯”雙創(chuàng)大賽的路演環(huán)節(jié)中,豈凡超稱,深言科技的大規(guī)模預(yù)訓(xùn)練模型在續(xù)寫(xiě)、改寫(xiě)、擴(kuò)寫(xiě)、摘要4類文本生成任務(wù)和6個(gè)數(shù)據(jù)集上,均超過(guò)現(xiàn)有其他中文模型,達(dá)到了當(dāng)前最好的中文文本生成效果。這次大賽,深言科技的“基于超大模型的新一代語(yǔ)言理解與生成平臺(tái)”項(xiàng)目斬獲技術(shù)創(chuàng)新賽初創(chuàng)組一等獎(jiǎng)。
在獲得騰訊投資后,深言科技估值為1億美元。據(jù)執(zhí)中數(shù)據(jù),與騰訊共同投資的機(jī)構(gòu)還包括紅杉中國(guó)、好未來(lái)、英諾天使基金等,其他輪次的知名投資方包括水木清華校友基金、奇績(jī)創(chuàng)壇等。
相較深言科技,MiniMax的來(lái)頭更大。在騰訊投資之前,MiniMax已完成兩輪融資,投資方包括米哈游、IDG資本、高瓴創(chuàng)投、云啟資本、明勢(shì)資本等。而在騰訊投資之后,MiniMax的估值已高達(dá)12億美元。
根據(jù)公開(kāi)資料,MiniMax直接從底層的基礎(chǔ)模型做起,自研了三個(gè)基礎(chǔ)模型,其法定代表人、技術(shù)合伙人楊斌曾在今年初表示,MiniMax可能是國(guó)內(nèi)第一家同時(shí)擁有三個(gè)模態(tài)大模型能力的創(chuàng)業(yè)公司。值得一提的是,在大模型對(duì)戰(zhàn)平臺(tái)SuperCLUE發(fā)布的中文大語(yǔ)言模型排行榜上,MiniMax的模型在國(guó)內(nèi)企業(yè)中排在第7名。
除投資大模型初創(chuàng)企業(yè)之外,近年間騰訊對(duì)B端生態(tài)的加速布局,或?yàn)槠湓诖竽P皖I(lǐng)域的突破積累了更多的籌碼。根據(jù)執(zhí)中數(shù)據(jù),自2018年騰訊入局產(chǎn)業(yè)互聯(lián)網(wǎng)以來(lái),其在企業(yè)服務(wù)領(lǐng)域的投資事件已達(dá)到178起,僅次于文化娛樂(lè)領(lǐng)域的221起,且對(duì)人工智能的投資也達(dá)到38起(圖2)。
可以想見(jiàn),在騰訊云MaaS服務(wù)的加持下,騰訊的To B戰(zhàn)事才剛剛開(kāi)始。