• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大模型的小時代

      2023-10-01 00:12:18馬冬
      商界 2023年8期
      關(guān)鍵詞:百度模型

      馬冬

      “我是誰?”“從哪里來?”“要到哪里去?”哲學(xué)史上,柏拉圖提出的靈魂三問,是人們深刻、簡明把握事物發(fā)展方向的思考路徑。

      當(dāng)下,AI大模型熱度比酷暑的熱浪還高。在AIGC、ChatGPT的帶動下,大模型概念開始被廣泛討論。2023年還未過半,就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對大模型展開探索。

      但在眾多大模型里,開一場發(fā)布會,講清楚“我是誰”的居多,關(guān)于AI大模型“從哪里來,到哪里去”,或者說“做什么,為誰做”的進(jìn)一步思考,卻很少見得到。

      如果把大模型的全球比拼,看成一場賽馬,這場比賽早就從小型的速度賽,變成了大型的耐力賽?,F(xiàn)在的重要問題已經(jīng)變成,要培育自己的粉絲,種植一片自己的草原。

      在AIGC和ChatGPT等熱詞帶動下,大模型概念逐漸被關(guān)注。不過,大模型到底是什么,又能做什么,對很多人來說,這個問題的答案似乎很模糊。

      一位中國傳媒大學(xué)計算機技術(shù)碩士,在知乎上這樣描述了大模型:如果說模型是一個盒子,那么普通模型就是一個小盒子,因為容量有限,所以其處理和存儲的數(shù)據(jù)、信息也有限。因此,普通模型可以完成分類、預(yù)測、生成等簡單任務(wù)。相較之下,大模型就是一個超級大倉庫,往往需要數(shù)十億,甚至上百億個參數(shù)組成,可以完成更高級的思考和決策。比如,自然語言理解、語音識別、圖像識別等。

      而這個大模型,到底有多“大”?

      舉例來說,GPT-4使用了1 750億規(guī)模的參數(shù),微軟推出的Turing-NLG有1 000億參數(shù),谷歌則推出號稱有1.6萬億模型參數(shù)的Switch transformer。而作為對照,我們?nèi)粘J褂玫闹悄苷Z音通常只有幾個億的參數(shù)。

      從數(shù)據(jù)上看,大模型的底層建設(shè),就不是一般企業(yè)可以勝任的。

      率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1 000億參數(shù)。不過,過去的幾個月,陸續(xù)加速布局大模型的國內(nèi)公司卻如雨后春筍,其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等。

      他們都通過自己平臺沉淀的數(shù)據(jù),來完成自家大模型的第一次迭代。

      像是以搜索引擎為所長的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。

      華為的盤古大模型則更加專注于自己比較有優(yōu)勢的TO B業(yè)務(wù)。在發(fā)布會上,華為也表示,在過去的2022年,華為盤古大模型主要是AI for Industry(AI賦能產(chǎn)業(yè)),為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價值,其中CV大模型早就有了許多用武之地。

      比如在與能源公司合作的盤古礦山大模型案例中,礦井現(xiàn)場是一個40米長的采掘機,寬度僅2米左右,傳統(tǒng)相機很難一下子捕捉到全部畫面,只能用圖中的九宮格視頻畫面。而通過“5G+AI”全景視頻拼接綜采畫面卷,傳輸?shù)降孛?,地面工作人員將來可以實現(xiàn)地面控制機器進(jìn)行采礦,實現(xiàn)礦下無人、少人的安全作業(yè)。

      但從目前國內(nèi)推出的幾款大模型產(chǎn)品來看,我們似乎仍在等待和尋找自己的“iPhone時刻”。即,無論是百度的文心一言、華為的盤古大模型,還是科大訊飛的訊飛星火,似乎仍停留在從自己原本的優(yōu)勢入手的“集大成者”,相對缺少更多的創(chuàng)新,也缺少對整個行業(yè)的顛覆性產(chǎn)品。這就導(dǎo)致,大模型的應(yīng)用,始終停留在“術(shù)”的層面而不能帶來整個技術(shù)生態(tài)的變革。

      行業(yè)媒體在報告《ChatGPT浪潮下,看中國大語言模型產(chǎn)業(yè)發(fā)展》中討論過中外大模型研發(fā)的差距,其中,對百度等國內(nèi)大廠而言,在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板,短期內(nèi)難以對國外領(lǐng)先大模型實現(xiàn)趕超,為跟隨者角色,長期更需要國內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化。

      要補充短板,一個重要的因素,就是人才。因此,大廠也都紛紛行動起來。

      BOSS直聘上,百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中,百度以25~40k/月招聘AI大模型算法工程師、20~40k/月招聘模型構(gòu)架工程師;螞蟻集團(tuán)以45~75k/月招聘深度學(xué)習(xí)大模型GPT工程師;阿里以40~70k/月招聘大模型訓(xùn)練及算法工程師;騰訊則以30~60k/月招聘大模型預(yù)訓(xùn)練方向的工程師……

      值得注意的是,這些崗位幾乎都在一日內(nèi)被回復(fù)了超過10次,負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見,求職者對于大模型相關(guān)崗位充滿信心,且招聘者也正在如火如荼地爭奪人才。

      而從脈脈發(fā)布的《趨勢報告》中可以看出,自O(shè)pen AI推出的2021年以來,對于AIGC相關(guān)的人才爭奪就已經(jīng)開始了。2021年1-2月,AIGC相關(guān)崗位招聘同比上升281.88%。

      誠然,人才的爭奪只是第一步。對不少大廠來說,積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個路徑方向——對于C端來說,以GPT為例,通過開源方式將用戶和數(shù)據(jù)引進(jìn)來,再逐漸轉(zhuǎn)化成訂閱制;而就B端而言,比如Open AI與微軟Azure的合作,間接實現(xiàn)“模型即服務(wù)”,小B開發(fā)者可以調(diào)用其大模型API。

      商業(yè)模式上,ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作(嵌入微軟Bing、Office等軟件)3種營收方式,且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先;Google雖有意追趕,但由于聊天機器人這樣的產(chǎn)品形態(tài)對于其主營的搜索引擎業(yè)務(wù)的助益有限,因此在與搜索引擎結(jié)合方面較為審慎,更希望借助大模型能力開展“模型即服務(wù)”范式,開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場空間。

      國內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度文心一言更傾向于C端市場的探索,而“文心千帆”產(chǎn)品則劍指B端市場,意圖進(jìn)一步帶動云服務(wù)營收。

      不過無論是靠哪一條“腿”走路,想要實現(xiàn)商業(yè)化,大模型產(chǎn)品仍需要解決幾個緊迫的問題。

      比如,信息準(zhǔn)確性和版權(quán)。在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上,如何保證原創(chuàng)性也成了一個關(guān)鍵問題,這可能會牽扯原創(chuàng)的道德問題,以及更實際的,涉及版權(quán)的問題。

      最重要的是,大模型是一個實打?qū)嵉?,沒有終點的“吞金獸”。由于所需要的數(shù)據(jù)規(guī)模巨大,因此對算法、算力、數(shù)據(jù)存儲空間都有極大的要求,需要大量的資金。

      當(dāng)大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。

      據(jù)網(wǎng)絡(luò)數(shù)據(jù)顯示,去年中國云計算市場同比增長10%,前四大云計算廠商阿里云、華為云、騰訊云和百度智能云,合計增長9%,占云服務(wù)客戶支出總額的79%。

      對于應(yīng)用而言,“對話即平臺”成為現(xiàn)實,對話可以解決多模態(tài)的問題。例如,把ChatGPT的API接上以后,大模型就可以畫圖、做平面設(shè)計、寫文案等等。

      “算力是競爭的基礎(chǔ)”,一個典型的例子是,作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá),市值一度突破萬億美元。據(jù)估算,GPT-3的單次訓(xùn)練成本就高達(dá)140萬美元,對于一些更大的LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1 200萬美元之間。在其中,大部分費用是電費,計算機專家吳軍曾提到,“大概是3 000輛特斯拉的電動汽車,每輛跑到20萬英里(約32.19萬公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓(xùn)練一次”。

      在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭相入場。不可否認(rèn)的是,未來的互聯(lián)網(wǎng)競爭,幾乎都要建立在大模型基礎(chǔ)上。

      很多人將現(xiàn)在比喻為大模型的戰(zhàn)國時代。

      首先,各大廠商都在運用自己的數(shù)據(jù)資產(chǎn)跑馬圈地。

      比如騰訊提出不做非聊天式應(yīng)用,而是面向企業(yè)的行業(yè)大模型。實際上,在騰訊云公布行業(yè)大模型解決方案之前,各垂直領(lǐng)域的行業(yè)大模型早已被多家企業(yè)先后推出。騰訊不做通用的、聊天式的大模型,也是揚長避短。不過,從騰訊的企業(yè)特點上去推測,或許很多人會覺得其做通用聊天更具優(yōu)勢。反而在行業(yè)大模型上,更多創(chuàng)業(yè)企業(yè)遠(yuǎn)比騰訊更處于細(xì)分行業(yè)一線,如推出自動駕駛、醫(yī)療、地產(chǎn)、安全、智能物聯(lián)等行業(yè)大模型的諸多背后企業(yè)。

      而美圖集中于視覺創(chuàng)作、商業(yè)攝影、專業(yè)視頻編輯、商業(yè)設(shè)計等領(lǐng)域,試圖將美圖需求從C端生活場景向B端生產(chǎn)力場景進(jìn)階,將AI與影像生產(chǎn)力工具緊密結(jié)合。

      360也認(rèn)為GPT等通用大模型無法覆蓋世界上太多的領(lǐng)域,這也正是行業(yè)大模型的機遇所在,“百模大戰(zhàn)”最終比拼的將是各家應(yīng)用場景落地能力。

      其次,大模型還在成長初期,跑得快不代表跑得贏。

      從目前來看,大模型從概念到落地的幾年中,各個層面不斷有突破。但大模型最終會成長為什么樣子,至今沒有公論。在這個前提下,各大廠商都在自己的領(lǐng)域不斷探索,處在大模型的摸索和試錯階段。這個階段的主要特質(zhì)就是,跑得快、跑得早的,不一定跑得到最后或者跑得贏。就如ChatGPT出來之前,大家印象中最深的還是數(shù)年之前的阿爾法狗一樣。而ChatGPT也并非大廠出來的產(chǎn)品。

      某種意義上說,大模型的未來,需要喬布斯一樣的人,來給這個行業(yè)帶來顛覆性的改變。

      在這點上,任何人都有機會。

      大模型的應(yīng)用未來里面,提出問題比解決問題更體現(xiàn)人的能力。這也是科技引發(fā)的新一輪革命的前提。

      發(fā)生在歐洲的第一次工業(yè)革命,助力英國工業(yè)制造及商業(yè)運輸?shù)妊杆籴绕?,并帶來國運逆襲。發(fā)生在美國等國家的第二次工業(yè)革命浪潮,則誕生了通用電氣、福特汽車、AT&T等大批知名企業(yè)。

      可見,時代浪潮越大,對企業(yè)、產(chǎn)業(yè)乃至國家實力躍遷的紅利也會更大。

      無論是大模型在辦公場景的落地,還是此前掀起熱潮的ChatGPT形態(tài)的聊天機器人,這些都只是剛剛開始。比爾·蓋茨在《人工智能時代已經(jīng)開啟》中表示,自1980年首次看到圖形用戶界面以來,OpenAI的GPT人工智能模型是他所見過的最具革命性的技術(shù)進(jìn)步。王小川在用完ChatGPT之后,斷言“通用人工智能時代已經(jīng)到了”。這些稍顯激進(jìn)的判斷,都在極大地擴(kuò)充大模型應(yīng)用的想象空間。

      相關(guān)從業(yè)者表示,大模型將作為基礎(chǔ)平臺支持無數(shù)智能應(yīng)用。浪潮將催生三類機會:一是原有產(chǎn)品因AI的加入變得能力更強,好比電商因為加入推薦引擎而獲得突破;二是因新技術(shù)的產(chǎn)生,很多產(chǎn)品有機會重做一遍,類似于從PC到移動互聯(lián)網(wǎng)的變化;三是更好的模型和更低的成本解鎖了全新場景,催生此前未曾想過的應(yīng)用。

      目前,海外的應(yīng)用切入點主要分為幾類:以New Bing代表的下一代搜索,以Midjourney、Stability.AI為代表的AI繪畫,Runway所代表的視頻生成產(chǎn)品,Jasper.ai代表的行業(yè)工具。此外,代碼生成、個人助手、社交社區(qū)也是目前較受關(guān)注的應(yīng)用方向。

      相比之下,國內(nèi)雖有各種嘗試,但標(biāo)志性的大模型應(yīng)用還在醞釀中。

      現(xiàn)在是通用人工智能的奇點時刻,也是商業(yè)化應(yīng)用的前夜。AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓(xùn)練,需要從業(yè)者像園藝師一樣去修剪,形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。

      大模型承載了很多期待。以困擾許多廠商的“標(biāo)準(zhǔn)化-定制化”平衡難題為例,在阿里云的設(shè)想中,預(yù)訓(xùn)練大模型帶來的新可能表現(xiàn)為,企業(yè)只需將數(shù)據(jù)放在專屬數(shù)據(jù)空間,用于大模型自動學(xué)習(xí),然后就能生成企業(yè)專屬的大模型。

      相比原本“什么都要從頭做”的業(yè)務(wù)模式,大模型提供了效率更高的選擇。

      但這些變化目前還處于展望階段,依然有很多問題等待解答——應(yīng)用本身給客戶、用戶帶來的是顛覆性的體驗升級,還是只是疊加優(yōu)化?大模型成本高,在習(xí)慣了免費或低價的競爭環(huán)境里,To B應(yīng)用如何建立健康可持續(xù)的收入模式?要先“有”再“優(yōu)”,廠商自己乃至整個大模型生態(tài),需要進(jìn)一步突破的是什么?

      種種問題,都需要一個成功的落地應(yīng)用來給出答案。

      猜你喜歡
      百度模型
      一半模型
      p150Glued在帕金森病模型中的表達(dá)及分布
      重要模型『一線三等角』
      Robust adaptive UKF based on SVR for inertial based integrated navigation
      重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
      百度年度熱搜榜
      青年與社會(2018年2期)2018-01-25 15:37:06
      3D打印中的模型分割與打包
      做一個“百度”不知道的老師
      百度遭投行下調(diào)評級
      IT時代周刊(2015年8期)2015-11-11 05:50:22
      FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
      澎湖县| 临城县| 高邑县| 常州市| 宝坻区| 长丰县| 正镶白旗| 商水县| 农安县| 将乐县| 长乐市| 大埔县| 沅江市| 昔阳县| 江达县| 滨州市| 朝阳市| 天峨县| 化隆| 新田县| 库尔勒市| 鱼台县| 吉安县| 遂宁市| 玉树县| 饶河县| 乐至县| 读书| 泗洪县| 富源县| 保德县| 资溪县| 池州市| 图们市| 元谋县| 上高县| 东安县| 瑞丽市| 阳曲县| 婺源县| 马鞍山市|