大模型的小時代

2023-10-01 00:12:18馬冬

商界 2023年8期

關(guān)鍵詞：百度模型

馬冬

“我是誰？”“從哪里來？”“要到哪里去？”哲學(xué)史上，柏拉圖提出的靈魂三問，是人們深刻、簡明把握事物發(fā)展方向的思考路徑。

當(dāng)下，AI大模型熱度比酷暑的熱浪還高。在AIGC、ChatGPT的帶動下，大模型概念開始被廣泛討論。2023年還未過半，就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對大模型展開探索。

但在眾多大模型里，開一場發(fā)布會，講清楚“我是誰”的居多，關(guān)于AI大模型“從哪里來，到哪里去”，或者說“做什么，為誰做”的進(jìn)一步思考，卻很少見得到。

如果把大模型的全球比拼，看成一場賽馬，這場比賽早就從小型的速度賽，變成了大型的耐力賽?，F(xiàn)在的重要問題已經(jīng)變成，要培育自己的粉絲，種植一片自己的草原。

在AIGC和ChatGPT等熱詞帶動下，大模型概念逐漸被關(guān)注。不過，大模型到底是什么，又能做什么，對很多人來說，這個問題的答案似乎很模糊。

一位中國傳媒大學(xué)計算機技術(shù)碩士，在知乎上這樣描述了大模型：如果說模型是一個盒子，那么普通模型就是一個小盒子，因為容量有限，所以其處理和存儲的數(shù)據(jù)、信息也有限。因此，普通模型可以完成分類、預(yù)測、生成等簡單任務(wù)。相較之下，大模型就是一個超級大倉庫，往往需要數(shù)十億，甚至上百億個參數(shù)組成，可以完成更高級的思考和決策。比如，自然語言理解、語音識別、圖像識別等。

而這個大模型，到底有多“大”？

舉例來說，GPT-4使用了1 750億規(guī)模的參數(shù)，微軟推出的Turing-NLG有1 000億參數(shù)，谷歌則推出號稱有1.6萬億模型參數(shù)的Switch transformer。而作為對照，我們?nèi)粘Ｊ褂玫闹悄苷Z音通常只有幾個億的參數(shù)。

從數(shù)據(jù)上看，大模型的底層建設(shè)，就不是一般企業(yè)可以勝任的。

率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1 000億參數(shù)。不過，過去的幾個月，陸續(xù)加速布局大模型的國內(nèi)公司卻如雨后春筍，其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等。

他們都通過自己平臺沉淀的數(shù)據(jù)，來完成自家大模型的第一次迭代。

像是以搜索引擎為所長的百度，推出了類似GPT-3這樣具備搜索屬性的文心一言。

華為的盤古大模型則更加專注于自己比較有優(yōu)勢的TO B業(yè)務(wù)。在發(fā)布會上，華為也表示，在過去的2022年，華為盤古大模型主要是AI for Industry（AI賦能產(chǎn)業(yè)），為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價值，其中CV大模型早就有了許多用武之地。

比如在與能源公司合作的盤古礦山大模型案例中，礦井現(xiàn)場是一個40米長的采掘機，寬度僅2米左右，傳統(tǒng)相機很難一下子捕捉到全部畫面，只能用圖中的九宮格視頻畫面。而通過“5G+AI”全景視頻拼接綜采畫面卷，傳輸?shù)降孛?，地面工作人員將來可以實現(xiàn)地面控制機器進(jìn)行采礦，實現(xiàn)礦下無人、少人的安全作業(yè)。

但從目前國內(nèi)推出的幾款大模型產(chǎn)品來看，我們似乎仍在等待和尋找自己的“iPhone時刻”。即，無論是百度的文心一言、華為的盤古大模型，還是科大訊飛的訊飛星火，似乎仍停留在從自己原本的優(yōu)勢入手的“集大成者”，相對缺少更多的創(chuàng)新，也缺少對整個行業(yè)的顛覆性產(chǎn)品。這就導(dǎo)致，大模型的應(yīng)用，始終停留在“術(shù)”的層面而不能帶來整個技術(shù)生態(tài)的變革。

行業(yè)媒體在報告《ChatGPT浪潮下，看中國大語言模型產(chǎn)業(yè)發(fā)展》中討論過中外大模型研發(fā)的差距，其中，對百度等國內(nèi)大廠而言，在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板，短期內(nèi)難以對國外領(lǐng)先大模型實現(xiàn)趕超，為跟隨者角色，長期更需要國內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化。

要補充短板，一個重要的因素，就是人才。因此，大廠也都紛紛行動起來。

BOSS直聘上，百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中，百度以25～40k/月招聘AI大模型算法工程師、20～40k/月招聘模型構(gòu)架工程師；螞蟻集團(tuán)以45～75k/月招聘深度學(xué)習(xí)大模型GPT工程師；阿里以40～70k/月招聘大模型訓(xùn)練及算法工程師；騰訊則以30～60k/月招聘大模型預(yù)訓(xùn)練方向的工程師……

值得注意的是，這些崗位幾乎都在一日內(nèi)被回復(fù)了超過10次，負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見，求職者對于大模型相關(guān)崗位充滿信心，且招聘者也正在如火如荼地爭奪人才。

而從脈脈發(fā)布的《趨勢報告》中可以看出，自O(shè)pen AI推出的2021年以來，對于AIGC相關(guān)的人才爭奪就已經(jīng)開始了。2021年1-2月，AIGC相關(guān)崗位招聘同比上升281.88%。

誠然，人才的爭奪只是第一步。對不少大廠來說，積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個路徑方向——對于C端來說，以GPT為例，通過開源方式將用戶和數(shù)據(jù)引進(jìn)來，再逐漸轉(zhuǎn)化成訂閱制；而就B端而言，比如Open AI與微軟Azure的合作，間接實現(xiàn)“模型即服務(wù)”，小B開發(fā)者可以調(diào)用其大模型API。

商業(yè)模式上，ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作（嵌入微軟Bing、Office等軟件）3種營收方式，且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先；Google雖有意追趕，但由于聊天機器人這樣的產(chǎn)品形態(tài)對于其主營的搜索引擎業(yè)務(wù)的助益有限，因此在與搜索引擎結(jié)合方面較為審慎，更希望借助大模型能力開展“模型即服務(wù)”范式，開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場空間。

國內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度文心一言更傾向于C端市場的探索，而“文心千帆”產(chǎn)品則劍指B端市場，意圖進(jìn)一步帶動云服務(wù)營收。

不過無論是靠哪一條“腿”走路，想要實現(xiàn)商業(yè)化，大模型產(chǎn)品仍需要解決幾個緊迫的問題。

比如，信息準(zhǔn)確性和版權(quán)。在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上，如何保證原創(chuàng)性也成了一個關(guān)鍵問題，這可能會牽扯原創(chuàng)的道德問題，以及更實際的，涉及版權(quán)的問題。

最重要的是，大模型是一個實打?qū)嵉?，沒有終點的“吞金獸”。由于所需要的數(shù)據(jù)規(guī)模巨大，因此對算法、算力、數(shù)據(jù)存儲空間都有極大的要求，需要大量的資金。

當(dāng)大語言模型出現(xiàn)以后，云端就開始被開發(fā)出來，云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。

據(jù)網(wǎng)絡(luò)數(shù)據(jù)顯示，去年中國云計算市場同比增長10%，前四大云計算廠商阿里云、華為云、騰訊云和百度智能云，合計增長9%，占云服務(wù)客戶支出總額的79%。

對于應(yīng)用而言，“對話即平臺”成為現(xiàn)實，對話可以解決多模態(tài)的問題。例如，把ChatGPT的API接上以后，大模型就可以畫圖、做平面設(shè)計、寫文案等等。

“算力是競爭的基礎(chǔ)”，一個典型的例子是，作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá)，市值一度突破萬億美元。據(jù)估算，GPT-3的單次訓(xùn)練成本就高達(dá)140萬美元，對于一些更大的LLM（大型語言模型），訓(xùn)練成本介于200萬美元至1 200萬美元之間。在其中，大部分費用是電費，計算機專家吳軍曾提到，“大概是3 000輛特斯拉的電動汽車，每輛跑到20萬英里（約32.19萬公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓(xùn)練一次”。

在如此高昂成本之下，各互聯(lián)網(wǎng)大廠也爭相入場。不可否認(rèn)的是，未來的互聯(lián)網(wǎng)競爭，幾乎都要建立在大模型基礎(chǔ)上。

很多人將現(xiàn)在比喻為大模型的戰(zhàn)國時代。

首先，各大廠商都在運用自己的數(shù)據(jù)資產(chǎn)跑馬圈地。

比如騰訊提出不做非聊天式應(yīng)用，而是面向企業(yè)的行業(yè)大模型。實際上，在騰訊云公布行業(yè)大模型解決方案之前，各垂直領(lǐng)域的行業(yè)大模型早已被多家企業(yè)先后推出。騰訊不做通用的、聊天式的大模型，也是揚長避短。不過，從騰訊的企業(yè)特點上去推測，或許很多人會覺得其做通用聊天更具優(yōu)勢。反而在行業(yè)大模型上，更多創(chuàng)業(yè)企業(yè)遠(yuǎn)比騰訊更處于細(xì)分行業(yè)一線，如推出自動駕駛、醫(yī)療、地產(chǎn)、安全、智能物聯(lián)等行業(yè)大模型的諸多背后企業(yè)。

而美圖集中于視覺創(chuàng)作、商業(yè)攝影、專業(yè)視頻編輯、商業(yè)設(shè)計等領(lǐng)域，試圖將美圖需求從C端生活場景向B端生產(chǎn)力場景進(jìn)階，將AI與影像生產(chǎn)力工具緊密結(jié)合。

360也認(rèn)為GPT等通用大模型無法覆蓋世界上太多的領(lǐng)域，這也正是行業(yè)大模型的機遇所在，“百模大戰(zhàn)”最終比拼的將是各家應(yīng)用場景落地能力。

其次，大模型還在成長初期，跑得快不代表跑得贏。

從目前來看，大模型從概念到落地的幾年中，各個層面不斷有突破。但大模型最終會成長為什么樣子，至今沒有公論。在這個前提下，各大廠商都在自己的領(lǐng)域不斷探索，處在大模型的摸索和試錯階段。這個階段的主要特質(zhì)就是，跑得快、跑得早的，不一定跑得到最后或者跑得贏。就如ChatGPT出來之前，大家印象中最深的還是數(shù)年之前的阿爾法狗一樣。而ChatGPT也并非大廠出來的產(chǎn)品。

某種意義上說，大模型的未來，需要喬布斯一樣的人，來給這個行業(yè)帶來顛覆性的改變。

在這點上，任何人都有機會。

大模型的應(yīng)用未來里面，提出問題比解決問題更體現(xiàn)人的能力。這也是科技引發(fā)的新一輪革命的前提。

發(fā)生在歐洲的第一次工業(yè)革命，助力英國工業(yè)制造及商業(yè)運輸?shù)妊杆籴绕?，并帶來國運逆襲。發(fā)生在美國等國家的第二次工業(yè)革命浪潮，則誕生了通用電氣、福特汽車、AT&T等大批知名企業(yè)。

可見，時代浪潮越大，對企業(yè)、產(chǎn)業(yè)乃至國家實力躍遷的紅利也會更大。

無論是大模型在辦公場景的落地，還是此前掀起熱潮的ChatGPT形態(tài)的聊天機器人，這些都只是剛剛開始。比爾·蓋茨在《人工智能時代已經(jīng)開啟》中表示，自1980年首次看到圖形用戶界面以來，OpenAI的GPT人工智能模型是他所見過的最具革命性的技術(shù)進(jìn)步。王小川在用完ChatGPT之后，斷言“通用人工智能時代已經(jīng)到了”。這些稍顯激進(jìn)的判斷，都在極大地擴(kuò)充大模型應(yīng)用的想象空間。

相關(guān)從業(yè)者表示，大模型將作為基礎(chǔ)平臺支持無數(shù)智能應(yīng)用。浪潮將催生三類機會：一是原有產(chǎn)品因AI的加入變得能力更強，好比電商因為加入推薦引擎而獲得突破；二是因新技術(shù)的產(chǎn)生，很多產(chǎn)品有機會重做一遍，類似于從PC到移動互聯(lián)網(wǎng)的變化；三是更好的模型和更低的成本解鎖了全新場景，催生此前未曾想過的應(yīng)用。

目前，海外的應(yīng)用切入點主要分為幾類：以New Bing代表的下一代搜索，以Midjourney、Stability.AI為代表的AI繪畫，Runway所代表的視頻生成產(chǎn)品，Jasper.ai代表的行業(yè)工具。此外，代碼生成、個人助手、社交社區(qū)也是目前較受關(guān)注的應(yīng)用方向。

相比之下，國內(nèi)雖有各種嘗試，但標(biāo)志性的大模型應(yīng)用還在醞釀中。

現(xiàn)在是通用人工智能的奇點時刻，也是商業(yè)化應(yīng)用的前夜。AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓(xùn)練，需要從業(yè)者像園藝師一樣去修剪，形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。

大模型承載了很多期待。以困擾許多廠商的“標(biāo)準(zhǔn)化-定制化”平衡難題為例，在阿里云的設(shè)想中，預(yù)訓(xùn)練大模型帶來的新可能表現(xiàn)為，企業(yè)只需將數(shù)據(jù)放在專屬數(shù)據(jù)空間，用于大模型自動學(xué)習(xí)，然后就能生成企業(yè)專屬的大模型。

相比原本“什么都要從頭做”的業(yè)務(wù)模式，大模型提供了效率更高的選擇。

但這些變化目前還處于展望階段，依然有很多問題等待解答——應(yīng)用本身給客戶、用戶帶來的是顛覆性的體驗升級，還是只是疊加優(yōu)化？大模型成本高，在習(xí)慣了免費或低價的競爭環(huán)境里，To B應(yīng)用如何建立健康可持續(xù)的收入模式？要先“有”再“優(yōu)”，廠商自己乃至整個大模型生態(tài)，需要進(jìn)一步突破的是什么？

種種問題，都需要一個成功的落地應(yīng)用來給出答案。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

大模型的小時代