馬冬
“我是誰?”“從哪里來?”“要到哪里去?”哲學(xué)史上,柏拉圖提出的靈魂三問,是人們深刻、簡明把握事物發(fā)展方向的思考路徑。
當(dāng)下,AI大模型熱度比酷暑的熱浪還高。在AIGC、ChatGPT的帶動下,大模型概念開始被廣泛討論。2023年還未過半,就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對大模型展開探索。
但在眾多大模型里,開一場發(fā)布會,講清楚“我是誰”的居多,關(guān)于AI大模型“從哪里來,到哪里去”,或者說“做什么,為誰做”的進(jìn)一步思考,卻很少見得到。
如果把大模型的全球比拼,看成一場賽馬,這場比賽早就從小型的速度賽,變成了大型的耐力賽?,F(xiàn)在的重要問題已經(jīng)變成,要培育自己的粉絲,種植一片自己的草原。
在AIGC和ChatGPT等熱詞帶動下,大模型概念逐漸被關(guān)注。不過,大模型到底是什么,又能做什么,對很多人來說,這個問題的答案似乎很模糊。
一位中國傳媒大學(xué)計算機技術(shù)碩士,在知乎上這樣描述了大模型:如果說模型是一個盒子,那么普通模型就是一個小盒子,因為容量有限,所以其處理和存儲的數(shù)據(jù)、信息也有限。因此,普通模型可以完成分類、預(yù)測、生成等簡單任務(wù)。相較之下,大模型就是一個超級大倉庫,往往需要數(shù)十億,甚至上百億個參數(shù)組成,可以完成更高級的思考和決策。比如,自然語言理解、語音識別、圖像識別等。
而這個大模型,到底有多“大”?
舉例來說,GPT-4使用了1 750億規(guī)模的參數(shù),微軟推出的Turing-NLG有1 000億參數(shù),谷歌則推出號稱有1.6萬億模型參數(shù)的Switch transformer。而作為對照,我們?nèi)粘J褂玫闹悄苷Z音通常只有幾個億的參數(shù)。
從數(shù)據(jù)上看,大模型的底層建設(shè),就不是一般企業(yè)可以勝任的。
率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1 000億參數(shù)。不過,過去的幾個月,陸續(xù)加速布局大模型的國內(nèi)公司卻如雨后春筍,其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等。
他們都通過自己平臺沉淀的數(shù)據(jù),來完成自家大模型的第一次迭代。
像是以搜索引擎為所長的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。
華為的盤古大模型則更加專注于自己比較有優(yōu)勢的TO B業(yè)務(wù)。在發(fā)布會上,華為也表示,在過去的2022年,華為盤古大模型主要是AI for Industry(AI賦能產(chǎn)業(yè)),為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價值,其中CV大模型早就有了許多用武之地。
比如在與能源公司合作的盤古礦山大模型案例中,礦井現(xiàn)場是一個40米長的采掘機,寬度僅2米左右,傳統(tǒng)相機很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過“5G+AI”全景視頻拼接綜采畫面卷,傳輸?shù)降孛?,地面工作人員將來可以實現(xiàn)地面控制機器進(jìn)行采礦,實現(xiàn)礦下無人、少人的安全作業(yè)。
但從目前國內(nèi)推出的幾款大模型產(chǎn)品來看,我們似乎仍在等待和尋找自己的“iPhone時刻”。即,無論是百度的文心一言、華為的盤古大模型,還是科大訊飛的訊飛星火,似乎仍停留在從自己原本的優(yōu)勢入手的“集大成者”,相對缺少更多的創(chuàng)新,也缺少對整個行業(yè)的顛覆性產(chǎn)品。這就導(dǎo)致,大模型的應(yīng)用,始終停留在“術(shù)”的層面而不能帶來整個技術(shù)生態(tài)的變革。
行業(yè)媒體在報告《ChatGPT浪潮下,看中國大語言模型產(chǎn)業(yè)發(fā)展》中討論過中外大模型研發(fā)的差距,其中,對百度等國內(nèi)大廠而言,在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板,短期內(nèi)難以對國外領(lǐng)先大模型實現(xiàn)趕超,為跟隨者角色,長期更需要國內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化。
要補充短板,一個重要的因素,就是人才。因此,大廠也都紛紛行動起來。
BOSS直聘上,百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中,百度以25~40k/月招聘AI大模型算法工程師、20~40k/月招聘模型構(gòu)架工程師;螞蟻集團(tuán)以45~75k/月招聘深度學(xué)習(xí)大模型GPT工程師;阿里以40~70k/月招聘大模型訓(xùn)練及算法工程師;騰訊則以30~60k/月招聘大模型預(yù)訓(xùn)練方向的工程師……
值得注意的是,這些崗位幾乎都在一日內(nèi)被回復(fù)了超過10次,負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見,求職者對于大模型相關(guān)崗位充滿信心,且招聘者也正在如火如荼地爭奪人才。
而從脈脈發(fā)布的《趨勢報告》中可以看出,自O(shè)pen AI推出的2021年以來,對于AIGC相關(guān)的人才爭奪就已經(jīng)開始了。2021年1-2月,AIGC相關(guān)崗位招聘同比上升281.88%。
誠然,人才的爭奪只是第一步。對不少大廠來說,積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個路徑方向——對于C端來說,以GPT為例,通過開源方式將用戶和數(shù)據(jù)引進(jìn)來,再逐漸轉(zhuǎn)化成訂閱制;而就B端而言,比如Open AI與微軟Azure的合作,間接實現(xiàn)“模型即服務(wù)”,小B開發(fā)者可以調(diào)用其大模型API。
商業(yè)模式上,ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作(嵌入微軟Bing、Office等軟件)3種營收方式,且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先;Google雖有意追趕,但由于聊天機器人這樣的產(chǎn)品形態(tài)對于其主營的搜索引擎業(yè)務(wù)的助益有限,因此在與搜索引擎結(jié)合方面較為審慎,更希望借助大模型能力開展“模型即服務(wù)”范式,開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場空間。
國內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度文心一言更傾向于C端市場的探索,而“文心千帆”產(chǎn)品則劍指B端市場,意圖進(jìn)一步帶動云服務(wù)營收。
不過無論是靠哪一條“腿”走路,想要實現(xiàn)商業(yè)化,大模型產(chǎn)品仍需要解決幾個緊迫的問題。
比如,信息準(zhǔn)確性和版權(quán)。在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上,如何保證原創(chuàng)性也成了一個關(guān)鍵問題,這可能會牽扯原創(chuàng)的道德問題,以及更實際的,涉及版權(quán)的問題。
最重要的是,大模型是一個實打?qū)嵉?,沒有終點的“吞金獸”。由于所需要的數(shù)據(jù)規(guī)模巨大,因此對算法、算力、數(shù)據(jù)存儲空間都有極大的要求,需要大量的資金。
當(dāng)大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。
據(jù)網(wǎng)絡(luò)數(shù)據(jù)顯示,去年中國云計算市場同比增長10%,前四大云計算廠商阿里云、華為云、騰訊云和百度智能云,合計增長9%,占云服務(wù)客戶支出總額的79%。
對于應(yīng)用而言,“對話即平臺”成為現(xiàn)實,對話可以解決多模態(tài)的問題。例如,把ChatGPT的API接上以后,大模型就可以畫圖、做平面設(shè)計、寫文案等等。
“算力是競爭的基礎(chǔ)”,一個典型的例子是,作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá),市值一度突破萬億美元。據(jù)估算,GPT-3的單次訓(xùn)練成本就高達(dá)140萬美元,對于一些更大的LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1 200萬美元之間。在其中,大部分費用是電費,計算機專家吳軍曾提到,“大概是3 000輛特斯拉的電動汽車,每輛跑到20萬英里(約32.19萬公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓(xùn)練一次”。
在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭相入場。不可否認(rèn)的是,未來的互聯(lián)網(wǎng)競爭,幾乎都要建立在大模型基礎(chǔ)上。
很多人將現(xiàn)在比喻為大模型的戰(zhàn)國時代。
首先,各大廠商都在運用自己的數(shù)據(jù)資產(chǎn)跑馬圈地。
比如騰訊提出不做非聊天式應(yīng)用,而是面向企業(yè)的行業(yè)大模型。實際上,在騰訊云公布行業(yè)大模型解決方案之前,各垂直領(lǐng)域的行業(yè)大模型早已被多家企業(yè)先后推出。騰訊不做通用的、聊天式的大模型,也是揚長避短。不過,從騰訊的企業(yè)特點上去推測,或許很多人會覺得其做通用聊天更具優(yōu)勢。反而在行業(yè)大模型上,更多創(chuàng)業(yè)企業(yè)遠(yuǎn)比騰訊更處于細(xì)分行業(yè)一線,如推出自動駕駛、醫(yī)療、地產(chǎn)、安全、智能物聯(lián)等行業(yè)大模型的諸多背后企業(yè)。
而美圖集中于視覺創(chuàng)作、商業(yè)攝影、專業(yè)視頻編輯、商業(yè)設(shè)計等領(lǐng)域,試圖將美圖需求從C端生活場景向B端生產(chǎn)力場景進(jìn)階,將AI與影像生產(chǎn)力工具緊密結(jié)合。
360也認(rèn)為GPT等通用大模型無法覆蓋世界上太多的領(lǐng)域,這也正是行業(yè)大模型的機遇所在,“百模大戰(zhàn)”最終比拼的將是各家應(yīng)用場景落地能力。
其次,大模型還在成長初期,跑得快不代表跑得贏。
從目前來看,大模型從概念到落地的幾年中,各個層面不斷有突破。但大模型最終會成長為什么樣子,至今沒有公論。在這個前提下,各大廠商都在自己的領(lǐng)域不斷探索,處在大模型的摸索和試錯階段。這個階段的主要特質(zhì)就是,跑得快、跑得早的,不一定跑得到最后或者跑得贏。就如ChatGPT出來之前,大家印象中最深的還是數(shù)年之前的阿爾法狗一樣。而ChatGPT也并非大廠出來的產(chǎn)品。
某種意義上說,大模型的未來,需要喬布斯一樣的人,來給這個行業(yè)帶來顛覆性的改變。
在這點上,任何人都有機會。
大模型的應(yīng)用未來里面,提出問題比解決問題更體現(xiàn)人的能力。這也是科技引發(fā)的新一輪革命的前提。
發(fā)生在歐洲的第一次工業(yè)革命,助力英國工業(yè)制造及商業(yè)運輸?shù)妊杆籴绕?,并帶來國運逆襲。發(fā)生在美國等國家的第二次工業(yè)革命浪潮,則誕生了通用電氣、福特汽車、AT&T等大批知名企業(yè)。
可見,時代浪潮越大,對企業(yè)、產(chǎn)業(yè)乃至國家實力躍遷的紅利也會更大。
無論是大模型在辦公場景的落地,還是此前掀起熱潮的ChatGPT形態(tài)的聊天機器人,這些都只是剛剛開始。比爾·蓋茨在《人工智能時代已經(jīng)開啟》中表示,自1980年首次看到圖形用戶界面以來,OpenAI的GPT人工智能模型是他所見過的最具革命性的技術(shù)進(jìn)步。王小川在用完ChatGPT之后,斷言“通用人工智能時代已經(jīng)到了”。這些稍顯激進(jìn)的判斷,都在極大地擴(kuò)充大模型應(yīng)用的想象空間。
相關(guān)從業(yè)者表示,大模型將作為基礎(chǔ)平臺支持無數(shù)智能應(yīng)用。浪潮將催生三類機會:一是原有產(chǎn)品因AI的加入變得能力更強,好比電商因為加入推薦引擎而獲得突破;二是因新技術(shù)的產(chǎn)生,很多產(chǎn)品有機會重做一遍,類似于從PC到移動互聯(lián)網(wǎng)的變化;三是更好的模型和更低的成本解鎖了全新場景,催生此前未曾想過的應(yīng)用。
目前,海外的應(yīng)用切入點主要分為幾類:以New Bing代表的下一代搜索,以Midjourney、Stability.AI為代表的AI繪畫,Runway所代表的視頻生成產(chǎn)品,Jasper.ai代表的行業(yè)工具。此外,代碼生成、個人助手、社交社區(qū)也是目前較受關(guān)注的應(yīng)用方向。
相比之下,國內(nèi)雖有各種嘗試,但標(biāo)志性的大模型應(yīng)用還在醞釀中。
現(xiàn)在是通用人工智能的奇點時刻,也是商業(yè)化應(yīng)用的前夜。AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓(xùn)練,需要從業(yè)者像園藝師一樣去修剪,形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。
大模型承載了很多期待。以困擾許多廠商的“標(biāo)準(zhǔn)化-定制化”平衡難題為例,在阿里云的設(shè)想中,預(yù)訓(xùn)練大模型帶來的新可能表現(xiàn)為,企業(yè)只需將數(shù)據(jù)放在專屬數(shù)據(jù)空間,用于大模型自動學(xué)習(xí),然后就能生成企業(yè)專屬的大模型。
相比原本“什么都要從頭做”的業(yè)務(wù)模式,大模型提供了效率更高的選擇。
但這些變化目前還處于展望階段,依然有很多問題等待解答——應(yīng)用本身給客戶、用戶帶來的是顛覆性的體驗升級,還是只是疊加優(yōu)化?大模型成本高,在習(xí)慣了免費或低價的競爭環(huán)境里,To B應(yīng)用如何建立健康可持續(xù)的收入模式?要先“有”再“優(yōu)”,廠商自己乃至整個大模型生態(tài),需要進(jìn)一步突破的是什么?
種種問題,都需要一個成功的落地應(yīng)用來給出答案。