王詩涵
Sora發(fā)布的同一晚,谷歌也發(fā)布了多模態(tài)AI大模型Gemini。
Sora橫空出世的當(dāng)夜,AI圈集體失眠。有人認(rèn)為這是“降維打擊”,也有人樂壞了。
“我們特別開心。過去的一年,我們始終堅(jiān)信視頻生成是件大事,認(rèn)為它會(huì)對(duì)整個(gè)世界產(chǎn)生巨大沖擊和影響,但是沒有多少人信我們,我們花費(fèi)了很多唇舌去教育市場(chǎng)。”愛詩科技創(chuàng)始人、CEO王長虎對(duì)《中國新聞周刊》說。
距離OpenAI發(fā)布Sora已近一個(gè)月,中國玩家當(dāng)前表現(xiàn)如何?據(jù)不完全統(tǒng)計(jì),至少已有15家中國大廠和創(chuàng)業(yè)公司陸續(xù)推出了AI視頻工具,其中有諸多產(chǎn)品已面向全球市場(chǎng)發(fā)行。
涉及Sora核心技術(shù)的相關(guān)論文,早在2022年就已發(fā)布。Sora出現(xiàn)前,視頻生成領(lǐng)域投資環(huán)境的冷遇已久;Sora出現(xiàn)后,創(chuàng)業(yè)者們?cè)隍?yàn)證技術(shù)信仰的同時(shí),也將面臨更殘酷的市場(chǎng)競(jìng)爭(zhēng)。與此同時(shí),AI創(chuàng)投圈對(duì)大模型的觀點(diǎn)爭(zhēng)論仍在持續(xù),興奮與謹(jǐn)慎的心態(tài)始終交織。
但顯然,AI視頻的融資風(fēng)口期已經(jīng)到來了。3月11日,愛詩科技宣布完成億級(jí)人民幣A1輪融資,由達(dá)晨財(cái)智領(lǐng)投;同時(shí)國內(nèi)版文生視頻產(chǎn)品“愛詩視頻大模型”上線內(nèi)測(cè)。
“作為最前沿的探索者,要嘗試很多技術(shù)路線,Sora的出現(xiàn)減少了我們的試錯(cuò)成本。”王長虎說道。
所謂差距變小,在受訪者看來,是因?yàn)楫?dāng)規(guī)模定律成為行業(yè)的公開秘密,文生視頻大模型的競(jìng)賽也變成了“明牌游戲”,在未來,是否能持續(xù)具備足夠的資源,將成為牌桌上的重要籌碼。接下來留給中國企業(yè)的最大未知數(shù)在于:中國的大廠和創(chuàng)新企業(yè),誰能跑出中國Sora?誰最有希望成為這條賽道上的頭部企業(yè)?
在眾多創(chuàng)業(yè)者眼里,繼ChatGPT后,Sora再次開啟了人類通往AGI(通用人工智能)道路的一扇門。
“AI本質(zhì)上是創(chuàng)造另一個(gè)生命和文明,人類正處于創(chuàng)造它的前夜。Sora意味著人類可能剛找到它的眼睛,嘗試著把它拼上去。”創(chuàng)業(yè)者M(jìn)ax向《中國新聞周刊》解釋,具備自我意識(shí)的AGI需要多模態(tài),目前,相較于語言模型的讀寫能力,AI在“眼睛(圖像視頻)”和“耳朵(音頻)”兩方面的發(fā)展相對(duì)滯后。
北京時(shí)間2月16日凌晨,OpenAI發(fā)布文生視頻大模型Sora,樣片顯示出Sora在基本視頻生成、多模態(tài)生成、視頻編輯、世界模擬等能力項(xiàng)上的超越式成果,也驗(yàn)證了時(shí)空編碼(spacetime patches)和DiT模型(Diffusion與Transformer模型結(jié)合)技術(shù)路線的成功。
帶來“降維打擊”的Sora,樹立了文生視頻大模型領(lǐng)域的技術(shù)標(biāo)桿,引發(fā)市場(chǎng)關(guān)注的同時(shí),也將加速視頻生成賽道的技術(shù)發(fā)展與產(chǎn)品進(jìn)度。對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)來說,則意味著此前苦苦堅(jiān)持的技術(shù)信仰得以驗(yàn)證。
“此前,用戶數(shù)量的快速增長已經(jīng)讓我們感知到了判斷的正確,Sora再添了一把火,更加驗(yàn)證了我們一開始的信仰?!蓖蹰L虎感嘆。
Sora發(fā)布的同一晚,谷歌也發(fā)布了多模態(tài)AI大模型Gemini,可實(shí)現(xiàn)100萬token(詞元)上下文能力?!拔耶?dāng)時(shí)很激動(dòng)。兩個(gè)消息一起出來,說明規(guī)模定律還在起作用。我們不知道大模型明年還會(huì)跳到什么樣,但只要繼續(xù)成長,對(duì)投資人都是一種利好,我們手里項(xiàng)目的能力會(huì)更強(qiáng),可以做更多的事情。”峰瑞資本投資合伙人陳石回憶道。
規(guī)模定律是屬于OpenAI的“暴力美學(xué)”。從語言模型到多模態(tài)模型,OpenAI相信scale(規(guī)模)的力量,認(rèn)為遵循“大模型、大數(shù)據(jù)、大算力”的法則,模型性能會(huì)持續(xù)提升,根據(jù)特定算法,則產(chǎn)生智能“涌現(xiàn)”的能力。
在過去,在AI領(lǐng)域,創(chuàng)業(yè)的門檻和難度高于其他賽道:海內(nèi)外的無數(shù)創(chuàng)業(yè)者不懈地在這一領(lǐng)域堆疊技術(shù)與靈感,尋找技術(shù)理想與商業(yè)可能的交匯點(diǎn),他們隨時(shí)可能向世界突然丟下一顆炸彈,再度引爆一場(chǎng)顛覆性的科技革命。
而當(dāng)下,這些“炸彈”來得更密集和猛烈了。
“這輪AI行情有個(gè)突出的特點(diǎn),就是‘天底下沒有秘密?!标愂硎荆瑥腉PT-3、GPT-3.5到GPT-4以及Sora,產(chǎn)品發(fā)布不久后,其原理和算法很快就被大致猜中或主動(dòng)公開,最后都?xì)w因于規(guī)模定律,而這并不具備強(qiáng)大壁壘,前提是有錢買GPU卡,也需要人才、數(shù)據(jù)和工程方面的積累。
此前,海內(nèi)外大廠與創(chuàng)企已經(jīng)跑出諸多AI視頻大模型產(chǎn)品。海外團(tuán)隊(duì)方面,有Runway的Gen-1和2、Pika Labs的Pika、Stability AI的Stable Video Diffusion、Meta的Emu Video、李飛飛團(tuán)隊(duì)和谷歌合作的W.A.L.T等。國內(nèi)創(chuàng)企方面,則有愛詩科技的PixVerse、MewXAI的藝映AI、右腦科技的Vega AI等;國內(nèi)大廠則有阿里、百度、騰訊、字節(jié)等入局。
可預(yù)見的是,接下來這場(chǎng)“明牌游戲”里,AI視頻大模型的競(jìng)爭(zhēng)也將愈加“殘酷”。“大家都意識(shí)到需要更多的資源,留在牌桌上的價(jià)碼越來越高。在前一階段未能及時(shí)拿到融資的團(tuán)隊(duì),未必就有機(jī)會(huì)留下了。”王長虎說。
陳石認(rèn)為,當(dāng)前,做大模型的公司需要重新思考定位:倘若繼續(xù)探索基礎(chǔ)引擎,需要在跟隨技術(shù)路線的同時(shí)找到與Sora不同的切入點(diǎn);倘若轉(zhuǎn)向垂類模型或商業(yè)應(yīng)用場(chǎng)景,則需要構(gòu)建自己的技術(shù)壁壘或業(yè)務(wù)壁壘。
“去年成立團(tuán)隊(duì)的時(shí)候,整個(gè)投資環(huán)境對(duì)視頻生成沒有太大信心。我們把嘴皮子磨破后發(fā)現(xiàn),想說服投資人很不容易,很少的投資人認(rèn)可并投入了我們。Sora出來之后,我們也有遺憾,如果在過去一年拿到了更多的資源,也許Sora會(huì)是我們自己做出來的。”王長虎坦言。
“投不投大模型?”或是2023年甚至2022年以來投資人們一直在思考的問題。而投資觀點(diǎn)的分野,并未在Sora出現(xiàn)后發(fā)生改變。近日,騰訊新聞《潛望》發(fā)布的兩篇人物訪談引起了AI創(chuàng)投圈的普遍共鳴,月之暗面創(chuàng)始人、CEO楊植麟和金沙江創(chuàng)投主管合伙人朱嘯虎的觀點(diǎn),分別被認(rèn)為是“技術(shù)信仰派”和“市場(chǎng)信仰派”的代表。
2023年7月6日,2023世界人工智能大會(huì)上,工作人員向參觀者介紹AI藝術(shù)和創(chuàng)意輔助平臺(tái)。圖/新華
多家大模型初創(chuàng)企業(yè)公布自去年第二季度以來完成的融資信息。2023年4月,HiDream.ai智象未來完成種子輪融資,于12月完成由科大訊飛領(lǐng)投的天使輪融資。5月,Morph Studio完成數(shù)百萬美元種子輪融資,由BV百度風(fēng)投單獨(dú)投資。6月,右腦科技完成數(shù)千萬元天使輪融資,由光速光合領(lǐng)投,奇績創(chuàng)壇等跟投。
新一輪融資已在今年加速。愛詩科技于去年8月完成數(shù)千萬元人民幣天使輪融資;今年3月11日,完成億級(jí)人民幣A1輪融資,由達(dá)晨財(cái)智領(lǐng)投。生數(shù)科技分別于去年6月和8月完成天使輪和天使+輪融資;今年3月12日,再完成新一輪數(shù)億元融資,由啟明創(chuàng)投領(lǐng)投,達(dá)泰資本、智譜AI、BV百度風(fēng)投等繼續(xù)跟投。
“在一年前本次AI浪潮涌現(xiàn)之時(shí),我們就相信AI視頻生成將成為新的巨大機(jī)會(huì),斷定它將對(duì)內(nèi)容生產(chǎn)和消費(fèi)的全部相關(guān)行業(yè)產(chǎn)生顛覆性的影響,中國也將涌現(xiàn)出具備奠基意義的AI產(chǎn)業(yè)企業(yè)?!惫庠促Y本創(chuàng)始人、CEO鄭烜樂說。該機(jī)構(gòu)參與了愛詩科技的早期孵化。
“當(dāng)投資界不認(rèn)為這是大事或能短期做成的時(shí)候,我們有自己信仰和堅(jiān)信的東西。一年前倘若被不同的聲音所左右,我們做不出來PixVerse,也無法走到現(xiàn)在?!蓖蹰L虎認(rèn)為,“創(chuàng)業(yè)需要有長期的視角。創(chuàng)業(yè)者要做的,是非共識(shí)而正確的事?!?/p>
但投資人有自己看問題的視角。由于每只基金的投向受到資金來源、項(xiàng)目退出和收益要求、現(xiàn)實(shí)情況等因素影響,投資人有各自的立場(chǎng):大手筆投向大模型的仍是少數(shù),大多數(shù)投資人對(duì)模型層項(xiàng)目的態(tài)度相對(duì)謹(jǐn)慎,更傾向于尋找已經(jīng)找到或看到落地場(chǎng)景的應(yīng)用端項(xiàng)目?!白鐾ㄓ么竽P偷钠髽I(yè)在商業(yè)化上可能是很難找到合理路徑的,這一點(diǎn)連OpenAI自己都沒有解決。”創(chuàng)業(yè)者M(jìn)ax說道。
為此,創(chuàng)企都在尋找自己的路徑。以愛詩科技為例,公司在未來計(jì)劃分兩步走:在第一階段面向創(chuàng)作者,提供優(yōu)質(zhì)視頻生成服務(wù),更好地理解創(chuàng)作者動(dòng)機(jī),同時(shí)直接面向用戶,接受用戶反饋進(jìn)行迭代;在第二階段則面向消費(fèi)者,在提供工具的基礎(chǔ)上,打通創(chuàng)作和消費(fèi)全流程,提供AI原生的可消費(fèi)內(nèi)容。
事實(shí)上,Sora類的底層通用大模型與應(yīng)用層的垂類模型或應(yīng)用之間的根本區(qū)別在于,前者是“0~1”,需要跨越科技進(jìn)步的早期高門檻,專注核心技術(shù)的突破;后者則是“1~10”,是在通用大模型的基礎(chǔ)上找到具體的應(yīng)用,更注重商業(yè)場(chǎng)景的認(rèn)知與建設(shè)。
“去年我們看了很多文生圖、文生視頻、文生3D的項(xiàng)目,但通用大模型我們都沒有投。多模態(tài)的輸入輸出,看起來不一定是創(chuàng)業(yè)公司能做的,因?yàn)檫@是大模型公司的必經(jīng)之路?!狈迦鹳Y本投資合伙人陳石回憶道。
Morning Trail Investment 合伙人周欣華則認(rèn)為,大模型競(jìng)爭(zhēng)激烈,用戶黏性低,壟斷可能性低而成本太高,還是重復(fù)造輪子,可能剛造出來就被迭代了?!熬揞^扔出王炸、創(chuàng)企一夜團(tuán)滅的情況并非第一次,往往會(huì)對(duì)創(chuàng)業(yè)項(xiàng)目和投資人帶來致命打擊?!彼J(rèn)為,Sora橫空出世,顯得Pika就很雞肋;而谷歌的Gemini 1.5、Meta楊立昆的V-JEPA架構(gòu)、Stability AI的Stable Diffusion 3,也是當(dāng)前潛在的Sora圍剿勢(shì)力。
“重復(fù)造輪子”后被迭代的高風(fēng)險(xiǎn),是投資人對(duì)模型端的普遍擔(dān)憂?!白畲蟮谋Э赡苁牵覀?cè)燧喿釉斐龅拈]源模型比不過別人的開源模型?!标愂a(bǔ)充說道。
“要想在底層投資上走到最后,確實(shí)需要龐大的資金、人才和資源,資源則包括算力、數(shù)據(jù)和場(chǎng)景,所以硅谷大廠都在投大模型公司。在當(dāng)前國內(nèi)的資本環(huán)境下,互聯(lián)網(wǎng)大廠或市場(chǎng)化VC基金都不一定能有做散財(cái)童子的底氣,很難在商業(yè)模式不清晰、投資成功概率不高的情況下把大模型投資進(jìn)行到底?!敝苄廊A說。
從大環(huán)境看,資本謹(jǐn)慎的趨勢(shì)已久。CVSource投中數(shù)據(jù)顯示,截至2024年2月,中國VC/PE市場(chǎng)投資規(guī)??傔_(dá)67.74億美元,同比下降28.83%;近3個(gè)月的投資案例數(shù)量和規(guī)模整體均呈現(xiàn)下跌趨勢(shì)。
不過,在創(chuàng)投寒冬中,AI領(lǐng)域的投資規(guī)模在細(xì)分領(lǐng)域中仍最為突出,在2月高達(dá)11.06億美元。“Sora的話題度引爆了關(guān)注,文生視頻的團(tuán)隊(duì)普遍受到熱捧,但整體來講其他AI項(xiàng)目融資的難度可能還是和以前差不多?!眲?chuàng)業(yè)者M(jìn)ax表示。
對(duì)于普通創(chuàng)業(yè)者來說,提高自身造血能力,存活下來是當(dāng)前的首要目標(biāo)。“先在不確定性中找到一些商業(yè)上的確定性,可以再去追求產(chǎn)品長遠(yuǎn)的價(jià)值。在變動(dòng)期,先上車是最重要的事情?!蹦壳罢谧鯝I視頻創(chuàng)業(yè)項(xiàng)目的Fimmo分享道。
上述投資人都更傾向于看好商業(yè)模式清晰、落地場(chǎng)景明確的應(yīng)用層項(xiàng)目。陳石表示,團(tuán)隊(duì)投資的應(yīng)用項(xiàng)目同商業(yè)實(shí)踐結(jié)合緊密,并具有自己的業(yè)務(wù)縱深。
“但是,當(dāng)前很多應(yīng)用層的項(xiàng)目用AI炫技的成分居多,可能觸及了用戶的癢點(diǎn),卻不是痛點(diǎn)?!敝苄廊A指出,在無法一步到位的情況下,一些過渡狀態(tài)可能存在機(jī)會(huì)。她總結(jié)了當(dāng)前應(yīng)用層項(xiàng)目的幾大優(yōu)勢(shì)方向:其一,商業(yè)場(chǎng)景用AI嵌入工作流,用AI參與過程,從而更容易落地項(xiàng)目;其二,善用大模型在用戶交互方面、小模型在私密性和垂直領(lǐng)域Know-how把握方面的優(yōu)勢(shì),將大、小模型結(jié)合的垂類應(yīng)用項(xiàng)目;其三,利用AI的能力,使出海拓展更加高效可行的項(xiàng)目。
“應(yīng)用層項(xiàng)目還有一點(diǎn)利好在于,頭部的大模型還在追求AGI的星辰大海,暫時(shí)不會(huì)花過多時(shí)間去做過多的商業(yè)場(chǎng)景定制?!标愂治?,“因此,應(yīng)用層創(chuàng)業(yè)者還是要找到自己的生態(tài)位,要跟大語言模型保持‘安全距離,不要迎面撞向它的必經(jīng)之路,要找到自己技術(shù)或業(yè)務(wù)的縱深?!?p>
“這個(gè)事情還是挺燒錢的,大廠抬升了大模型項(xiàng)目的估值,他們最終可以找到人去買單,我們?nèi)绻读耍艺l來買單,這是最大的問題?!蓖顿Y人李童表示。
模型競(jìng)賽的主力軍,必然是擁有算力、資金、數(shù)據(jù)和人力優(yōu)勢(shì)的大廠。業(yè)內(nèi)人士普遍認(rèn)為,底層投資需要龐大的資金量和資源,而大廠有實(shí)力也有責(zé)任重視這場(chǎng)競(jìng)賽。
去年以來,中國大廠已然動(dòng)作頻頻,在推進(jìn)語言模型的同時(shí)布局視頻生成模型業(yè)務(wù)。尤其在歲末年初,步伐加速顯著。2024年1月17日,騰訊AI Lab再推出VideoCrafter2,實(shí)現(xiàn)文生視頻和圖生視頻。1月19日,百度推出視頻生成模型UnivG,支持文字和圖像組合輸入,針對(duì)高自由度和低自由度兩種任務(wù)分別采用不同的生成方式,項(xiàng)目由百度文心一格總架構(gòu)師肖欣延領(lǐng)銜。阿里巴巴通義實(shí)驗(yàn)室則開發(fā)了開源視頻生成模型和代碼系列 VGen。2023年11月,阿里在論文中宣布開源圖生視頻模型 I2VGen-XL;12月,推出文生視頻開源大模型ModelScopeT2V,模型和代碼完全開源。
字節(jié)跳動(dòng)也緊跟步伐。今年1月,字節(jié)跳動(dòng)發(fā)布文生視頻大模型MagicVideo-V2。2月20日左右,字節(jié)低調(diào)推出視頻模型產(chǎn)品Boximator,可通過文本控制生成視頻中人物或物體的動(dòng)作,但字節(jié)方面很快回應(yīng)稱,“Boximator目前還無法作為完善的產(chǎn)品落地,距離國外領(lǐng)先的視頻生成模型還有很大差距”。
2月7日,抖音集團(tuán)CEO張楠辭任,表示未來將聚焦剪映業(yè)務(wù)押注生成式AI。2月23日,字節(jié)在海外版剪映Capcut推出了有獨(dú)立主頁的AI視頻生成功能,短暫釋出后下線。而近日,剪映旗下AI創(chuàng)作平臺(tái)Dreamina的視頻生成功能也已開放內(nèi)測(cè)邀請(qǐng)。
此外,上市公司所推出的產(chǎn)品還包括萬興科技的萬興“天幕”大模型、美圖的MiracleVision的奇想智能大模型等等。
當(dāng)規(guī)模定律成為行業(yè)共識(shí),大廠的重視程度,以及在算力、模型、數(shù)據(jù)上的資源投入和堆疊能力,成為了衡量成功可能性的重要因素。
基于此,部分AI創(chuàng)業(yè)者看好字節(jié)跳動(dòng)。據(jù)財(cái)聯(lián)社報(bào)道,截至去年9月,字節(jié)已建立超過一萬張英偉達(dá)Ampere架構(gòu)GPU集群,目前正在建設(shè)Hopper架構(gòu)的集群?!白止?jié)是國內(nèi)為數(shù)不多有‘萬卡集群算力資源優(yōu)勢(shì)的公司?!眲?chuàng)業(yè)者M(jìn)ax認(rèn)為,字節(jié)的視頻數(shù)據(jù)量在世界范圍內(nèi)處于領(lǐng)先地位,也是相對(duì)年輕的大廠,看好其對(duì)戰(zhàn)略布局的敏感度?!坝屑粲臣捌浜M獍娴募映郑止?jié)在短視頻和個(gè)人生產(chǎn)力工具上有優(yōu)勢(shì)地位,至少它不會(huì)是國內(nèi)大廠中做得最差的?!眲?chuàng)業(yè)者Fimmo補(bǔ)充。
不同于在互聯(lián)網(wǎng)時(shí)代找準(zhǔn)生態(tài)位、創(chuàng)造出現(xiàn)象級(jí)應(yīng)用的輝煌,字節(jié)在大模型時(shí)代仍然處于追隨者的位置。1月底,字節(jié)跳動(dòng)CEO梁汝波在全員會(huì)的發(fā)言中多次提到“危機(jī)感”,“字節(jié)跳動(dòng)目前的業(yè)務(wù)有非常大的慣性,哪怕團(tuán)隊(duì)不額外努力,公司仍然可以依賴慣性滑行很長一段時(shí)間,但這是很危險(xiǎn)的。”他說。
陳石認(rèn)為,輕易地作出判斷有些“想當(dāng)然”。盡管當(dāng)前每家大廠都很重視,“出牌”策略也不盡相同,但畢竟先是一個(gè)做“復(fù)制”的過程,最終可能都會(huì)趨同,“中國的大廠可能本質(zhì)區(qū)別不大,主要的差距和限制是能買到多少張GPU卡”。據(jù)他預(yù)測(cè),在2024年末或2025年初,或就能見證大廠對(duì)Sora的復(fù)現(xiàn)。
但他也同時(shí)強(qiáng)調(diào),大廠“必須要跟,要超越”?!坝袥Q心、有實(shí)力的大廠需要足夠重視。頭部的公司首先要具備閉源的能力,不能依賴于開源,在這一基礎(chǔ)上把生態(tài)堆起來??梢栽谶@個(gè)位置等一等,當(dāng)未來的算力成本越來越低的時(shí)候,繼續(xù)挑戰(zhàn)往上走,這樣的情況就比較理想?!标愂f。
關(guān)于生成式AI,手機(jī)大廠的思路則與互聯(lián)網(wǎng)大廠有所不同。“作為智能終端廠商,我們不能將互聯(lián)網(wǎng)應(yīng)用服務(wù)廠商的事情作為自己的方向,而是要用AI重構(gòu)操作系統(tǒng)。未來在手機(jī)上可以有各種各樣大模型出現(xiàn),手機(jī)提供算力接口,幫助更多的‘Sora高效運(yùn)行。”榮耀CEO趙明對(duì)《中國新聞周刊》表示。
MagicVideo-V2文生視頻大模型的部分作品展示。
PixVerse文生視頻展示的部分作品。
那么,倘若中國大廠和創(chuàng)企都“鉚足了勁”追平或超越Sora,誰能搶先為之?
“中國的大模型現(xiàn)階段還處于跟隨狀態(tài),且參與者眾多,未來的分化與進(jìn)展并不好預(yù)測(cè)。不過,初創(chuàng)公司仍然會(huì)稍微難一些,大模型不需要大家都做,但大廠或國央企、政府的意志還是要有的?!标愂硎?。
在李童看來,除了在資金、算力、數(shù)據(jù)等方面的資源優(yōu)勢(shì),“大廠也投資了很多大模型和算力公司,本身也是為所有下游應(yīng)用服務(wù)的,符合其整體戰(zhàn)略布局,它賺的是整個(gè)行業(yè)鏈的錢”。
“未來在AIGC視頻生成領(lǐng)域的算法層、平臺(tái)層和算力層中,大廠適合進(jìn)行全產(chǎn)業(yè)鏈布局,初創(chuàng)企業(yè)適合介入應(yīng)用層或中間層某一細(xì)分領(lǐng)域,央國企則適合從基礎(chǔ)設(shè)施開始布局?!奔鬃庸饽曛菐煊^點(diǎn)認(rèn)為。
因此,初創(chuàng)公司并非沒有機(jī)會(huì)。李童認(rèn)為,“在創(chuàng)意方面,所有人都是在同一個(gè)起跑線上競(jìng)爭(zhēng)。”王長虎則表示,“大廠具備資源、數(shù)據(jù)、流量方面的優(yōu)勢(shì),使得創(chuàng)業(yè)公司一定要想著創(chuàng)新,尋求差異化,這是創(chuàng)業(yè)公司尋求成功的重要方面?!睆腁I產(chǎn)品榜統(tǒng)計(jì)的2月數(shù)據(jù)看,PixVerse的用戶訪問量規(guī)模已經(jīng)與國內(nèi)頭部的AI語言大模型和應(yīng)用工具在相同量級(jí)上競(jìng)爭(zhēng)。“這正得益于我們一年前的判斷和認(rèn)知所帶來的先發(fā)優(yōu)勢(shì),在大家做大語言模型的時(shí)候差異化選擇了視頻模型,提前積累了技術(shù)。”
“創(chuàng)企和大廠之間,也絕不是非此即彼的關(guān)系。”王長虎認(rèn)為,OpenAI和微軟的合作就是“共贏”的典型代表,創(chuàng)企和大廠應(yīng)在合作共贏中做出差異化發(fā)展。“不僅能在存量市場(chǎng)中看到這種可能,當(dāng)所有用戶都能玩起視頻生成的時(shí)候,還將有巨大的增量市場(chǎng)?!?p>
開源視頻生成模型VGen的部分作品展示。
HiDream.ai的部分作品展示。
VideoCrafter2的部分作品展示。
放眼全球,中國視頻生成大模型的未來幾何?陳石提出了“模型跟隨+應(yīng)用生態(tài)”的設(shè)想。他認(rèn)為,目前中國企業(yè)在AI領(lǐng)域的機(jī)會(huì)主要在應(yīng)用層,“中國是數(shù)字經(jīng)濟(jì)時(shí)代應(yīng)用的優(yōu)秀生,很多應(yīng)用的實(shí)用程度、開發(fā)能力、易用性都是全球第一?!痹谒磥恚磥泶罅Πl(fā)展AI應(yīng)用,最終利用在應(yīng)用生態(tài)上的優(yōu)勢(shì)反向進(jìn)行技術(shù)突破,是屬于中國的AI技術(shù)解法之一。
身在局中,在王長虎看來,相比于語言和圖片生成領(lǐng)域,面向全球,中國在視頻生成大模型上跟海外是沒有差距的。一方面,誕生于視頻生成領(lǐng)域早期的團(tuán)隊(duì),已接住了全球化的機(jī)會(huì);另一方面,中國公司在UGC時(shí)代創(chuàng)造了世界級(jí)的視頻應(yīng)用,意味著中國團(tuán)隊(duì)將有更加豐富的產(chǎn)品經(jīng)驗(yàn)和場(chǎng)景認(rèn)知,而這些優(yōu)勢(shì)都能反哺視頻生成技術(shù)的發(fā)展本身。
當(dāng)前,Sora尚未面向大眾測(cè)試,用戶實(shí)際體驗(yàn)是否能與官方發(fā)布的視頻效果保持一致,這一點(diǎn)仍然未知。AI視頻大模型究竟走到了GPT-2還是GPT-3時(shí)刻,還有待世界共同見證Sora的正式面世。
“我們可以大膽想象,當(dāng)視頻生成技術(shù)發(fā)展成熟,秒級(jí)實(shí)時(shí)的視頻生成、視頻編輯、視頻交互成為現(xiàn)實(shí),所有視頻創(chuàng)作者的生產(chǎn)模式、所有人對(duì)視頻內(nèi)容的消費(fèi)模式都將有翻天覆地的變化?!蓖蹰L虎預(yù)測(cè)道。
(文中李童、Max、Fimmo為化名)