大廠和創(chuàng)企，誰能跑出中國Sora？

2024-04-25 09:32:02王詩涵

中國新聞周刊 2024年10期

王詩涵

Sora發(fā)布的同一晚，谷歌也發(fā)布了多模態(tài)AI大模型Gemini。

Sora橫空出世的當(dāng)夜，AI圈集體失眠。有人認(rèn)為這是“降維打擊”，也有人樂壞了。

“我們特別開心。過去的一年，我們始終堅(jiān)信視頻生成是件大事，認(rèn)為它會(huì)對(duì)整個(gè)世界產(chǎn)生巨大沖擊和影響，但是沒有多少人信我們，我們花費(fèi)了很多唇舌去教育市場(chǎng)。”愛詩科技創(chuàng)始人、CEO王長虎對(duì)《中國新聞周刊》說。

距離OpenAI發(fā)布Sora已近一個(gè)月，中國玩家當(dāng)前表現(xiàn)如何？據(jù)不完全統(tǒng)計(jì)，至少已有15家中國大廠和創(chuàng)業(yè)公司陸續(xù)推出了AI視頻工具，其中有諸多產(chǎn)品已面向全球市場(chǎng)發(fā)行。

涉及Sora核心技術(shù)的相關(guān)論文，早在2022年就已發(fā)布。Sora出現(xiàn)前，視頻生成領(lǐng)域投資環(huán)境的冷遇已久；Sora出現(xiàn)后，創(chuàng)業(yè)者們?cè)隍?yàn)證技術(shù)信仰的同時(shí)，也將面臨更殘酷的市場(chǎng)競(jìng)爭(zhēng)。與此同時(shí)，AI創(chuàng)投圈對(duì)大模型的觀點(diǎn)爭(zhēng)論仍在持續(xù)，興奮與謹(jǐn)慎的心態(tài)始終交織。

但顯然，AI視頻的融資風(fēng)口期已經(jīng)到來了。3月11日，愛詩科技宣布完成億級(jí)人民幣A1輪融資，由達(dá)晨財(cái)智領(lǐng)投；同時(shí)國內(nèi)版文生視頻產(chǎn)品“愛詩視頻大模型”上線內(nèi)測(cè)。

“作為最前沿的探索者，要嘗試很多技術(shù)路線，Sora的出現(xiàn)減少了我們的試錯(cuò)成本。”王長虎說道。

所謂差距變小，在受訪者看來，是因?yàn)楫?dāng)規(guī)模定律成為行業(yè)的公開秘密，文生視頻大模型的競(jìng)賽也變成了“明牌游戲”，在未來，是否能持續(xù)具備足夠的資源，將成為牌桌上的重要籌碼。接下來留給中國企業(yè)的最大未知數(shù)在于：中國的大廠和創(chuàng)新企業(yè)，誰能跑出中國Sora？誰最有希望成為這條賽道上的頭部企業(yè)？

創(chuàng)業(yè)者們的技術(shù)信仰被驗(yàn)證了

在眾多創(chuàng)業(yè)者眼里，繼ChatGPT后，Sora再次開啟了人類通往AGI（通用人工智能）道路的一扇門。

“AI本質(zhì)上是創(chuàng)造另一個(gè)生命和文明，人類正處于創(chuàng)造它的前夜。Sora意味著人類可能剛找到它的眼睛，嘗試著把它拼上去。”創(chuàng)業(yè)者M(jìn)ax向《中國新聞周刊》解釋，具備自我意識(shí)的AGI需要多模態(tài)，目前，相較于語言模型的讀寫能力，AI在“眼睛（圖像視頻）”和“耳朵（音頻）”兩方面的發(fā)展相對(duì)滯后。

北京時(shí)間2月16日凌晨，OpenAI發(fā)布文生視頻大模型Sora，樣片顯示出Sora在基本視頻生成、多模態(tài)生成、視頻編輯、世界模擬等能力項(xiàng)上的超越式成果，也驗(yàn)證了時(shí)空編碼（spacetime patches）和DiT模型（Diffusion與Transformer模型結(jié)合）技術(shù)路線的成功。

帶來“降維打擊”的Sora，樹立了文生視頻大模型領(lǐng)域的技術(shù)標(biāo)桿，引發(fā)市場(chǎng)關(guān)注的同時(shí)，也將加速視頻生成賽道的技術(shù)發(fā)展與產(chǎn)品進(jìn)度。對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)來說，則意味著此前苦苦堅(jiān)持的技術(shù)信仰得以驗(yàn)證。

“此前，用戶數(shù)量的快速增長已經(jīng)讓我們感知到了判斷的正確，Sora再添了一把火，更加驗(yàn)證了我們一開始的信仰?！蓖蹰L虎感嘆。

Sora發(fā)布的同一晚，谷歌也發(fā)布了多模態(tài)AI大模型Gemini，可實(shí)現(xiàn)100萬token（詞元）上下文能力?！拔耶?dāng)時(shí)很激動(dòng)。兩個(gè)消息一起出來，說明規(guī)模定律還在起作用。我們不知道大模型明年還會(huì)跳到什么樣，但只要繼續(xù)成長，對(duì)投資人都是一種利好，我們手里項(xiàng)目的能力會(huì)更強(qiáng)，可以做更多的事情。”峰瑞資本投資合伙人陳石回憶道。

規(guī)模定律是屬于OpenAI的“暴力美學(xué)”。從語言模型到多模態(tài)模型，OpenAI相信scale（規(guī)模）的力量，認(rèn)為遵循“大模型、大數(shù)據(jù)、大算力”的法則，模型性能會(huì)持續(xù)提升，根據(jù)特定算法，則產(chǎn)生智能“涌現(xiàn)”的能力。

在過去，在AI領(lǐng)域，創(chuàng)業(yè)的門檻和難度高于其他賽道：海內(nèi)外的無數(shù)創(chuàng)業(yè)者不懈地在這一領(lǐng)域堆疊技術(shù)與靈感，尋找技術(shù)理想與商業(yè)可能的交匯點(diǎn)，他們隨時(shí)可能向世界突然丟下一顆炸彈，再度引爆一場(chǎng)顛覆性的科技革命。

而當(dāng)下，這些“炸彈”來得更密集和猛烈了。

“這輪AI行情有個(gè)突出的特點(diǎn)，就是‘天底下沒有秘密?！标愂硎荆瑥腉PT-3、GPT-3.5到GPT-4以及Sora，產(chǎn)品發(fā)布不久后，其原理和算法很快就被大致猜中或主動(dòng)公開，最后都?xì)w因于規(guī)模定律，而這并不具備強(qiáng)大壁壘，前提是有錢買GPU卡，也需要人才、數(shù)據(jù)和工程方面的積累。

此前，海內(nèi)外大廠與創(chuàng)企已經(jīng)跑出諸多AI視頻大模型產(chǎn)品。海外團(tuán)隊(duì)方面，有Runway的Gen-1和2、Pika Labs的Pika、Stability AI的Stable Video Diffusion、Meta的Emu Video、李飛飛團(tuán)隊(duì)和谷歌合作的W.A.L.T等。國內(nèi)創(chuàng)企方面，則有愛詩科技的PixVerse、MewXAI的藝映AI、右腦科技的Vega AI等；國內(nèi)大廠則有阿里、百度、騰訊、字節(jié)等入局。

可預(yù)見的是，接下來這場(chǎng)“明牌游戲”里，AI視頻大模型的競(jìng)爭(zhēng)也將愈加“殘酷”。“大家都意識(shí)到需要更多的資源，留在牌桌上的價(jià)碼越來越高。在前一階段未能及時(shí)拿到融資的團(tuán)隊(duì)，未必就有機(jī)會(huì)留下了。”王長虎說。

陳石認(rèn)為，當(dāng)前，做大模型的公司需要重新思考定位：倘若繼續(xù)探索基礎(chǔ)引擎，需要在跟隨技術(shù)路線的同時(shí)找到與Sora不同的切入點(diǎn)；倘若轉(zhuǎn)向垂類模型或商業(yè)應(yīng)用場(chǎng)景，則需要構(gòu)建自己的技術(shù)壁壘或業(yè)務(wù)壁壘。

“投不投大模型？”

“去年成立團(tuán)隊(duì)的時(shí)候，整個(gè)投資環(huán)境對(duì)視頻生成沒有太大信心。我們把嘴皮子磨破后發(fā)現(xiàn)，想說服投資人很不容易，很少的投資人認(rèn)可并投入了我們。Sora出來之后，我們也有遺憾，如果在過去一年拿到了更多的資源，也許Sora會(huì)是我們自己做出來的。”王長虎坦言。

“投不投大模型？”或是2023年甚至2022年以來投資人們一直在思考的問題。而投資觀點(diǎn)的分野，并未在Sora出現(xiàn)后發(fā)生改變。近日，騰訊新聞《潛望》發(fā)布的兩篇人物訪談引起了AI創(chuàng)投圈的普遍共鳴，月之暗面創(chuàng)始人、CEO楊植麟和金沙江創(chuàng)投主管合伙人朱嘯虎的觀點(diǎn)，分別被認(rèn)為是“技術(shù)信仰派”和“市場(chǎng)信仰派”的代表。

2023年7月6日，2023世界人工智能大會(huì)上，工作人員向參觀者介紹AI藝術(shù)和創(chuàng)意輔助平臺(tái)。圖/新華

多家大模型初創(chuàng)企業(yè)公布自去年第二季度以來完成的融資信息。2023年4月，HiDream.ai智象未來完成種子輪融資，于12月完成由科大訊飛領(lǐng)投的天使輪融資。5月，Morph Studio完成數(shù)百萬美元種子輪融資，由BV百度風(fēng)投單獨(dú)投資。6月，右腦科技完成數(shù)千萬元天使輪融資，由光速光合領(lǐng)投，奇績創(chuàng)壇等跟投。

新一輪融資已在今年加速。愛詩科技于去年8月完成數(shù)千萬元人民幣天使輪融資；今年3月11日，完成億級(jí)人民幣A1輪融資，由達(dá)晨財(cái)智領(lǐng)投。生數(shù)科技分別于去年6月和8月完成天使輪和天使+輪融資；今年3月12日，再完成新一輪數(shù)億元融資，由啟明創(chuàng)投領(lǐng)投，達(dá)泰資本、智譜AI、BV百度風(fēng)投等繼續(xù)跟投。

“在一年前本次AI浪潮涌現(xiàn)之時(shí)，我們就相信AI視頻生成將成為新的巨大機(jī)會(huì)，斷定它將對(duì)內(nèi)容生產(chǎn)和消費(fèi)的全部相關(guān)行業(yè)產(chǎn)生顛覆性的影響，中國也將涌現(xiàn)出具備奠基意義的AI產(chǎn)業(yè)企業(yè)?！惫庠促Y本創(chuàng)始人、CEO鄭烜樂說。該機(jī)構(gòu)參與了愛詩科技的早期孵化。

“當(dāng)投資界不認(rèn)為這是大事或能短期做成的時(shí)候，我們有自己信仰和堅(jiān)信的東西。一年前倘若被不同的聲音所左右，我們做不出來PixVerse，也無法走到現(xiàn)在?！蓖蹰L虎認(rèn)為，“創(chuàng)業(yè)需要有長期的視角。創(chuàng)業(yè)者要做的，是非共識(shí)而正確的事?！?/p>

但投資人有自己看問題的視角。由于每只基金的投向受到資金來源、項(xiàng)目退出和收益要求、現(xiàn)實(shí)情況等因素影響，投資人有各自的立場(chǎng)：大手筆投向大模型的仍是少數(shù)，大多數(shù)投資人對(duì)模型層項(xiàng)目的態(tài)度相對(duì)謹(jǐn)慎，更傾向于尋找已經(jīng)找到或看到落地場(chǎng)景的應(yīng)用端項(xiàng)目?！白鐾ㄓ么竽Ｐ偷钠髽I(yè)在商業(yè)化上可能是很難找到合理路徑的，這一點(diǎn)連OpenAI自己都沒有解決。”創(chuàng)業(yè)者M(jìn)ax說道。

為此，創(chuàng)企都在尋找自己的路徑。以愛詩科技為例，公司在未來計(jì)劃分兩步走：在第一階段面向創(chuàng)作者，提供優(yōu)質(zhì)視頻生成服務(wù)，更好地理解創(chuàng)作者動(dòng)機(jī)，同時(shí)直接面向用戶，接受用戶反饋進(jìn)行迭代；在第二階段則面向消費(fèi)者，在提供工具的基礎(chǔ)上，打通創(chuàng)作和消費(fèi)全流程，提供AI原生的可消費(fèi)內(nèi)容。

事實(shí)上，Sora類的底層通用大模型與應(yīng)用層的垂類模型或應(yīng)用之間的根本區(qū)別在于，前者是“0～1”，需要跨越科技進(jìn)步的早期高門檻，專注核心技術(shù)的突破；后者則是“1～10”，是在通用大模型的基礎(chǔ)上找到具體的應(yīng)用，更注重商業(yè)場(chǎng)景的認(rèn)知與建設(shè)。

“去年我們看了很多文生圖、文生視頻、文生3D的項(xiàng)目，但通用大模型我們都沒有投。多模態(tài)的輸入輸出，看起來不一定是創(chuàng)業(yè)公司能做的，因?yàn)檫@是大模型公司的必經(jīng)之路?！狈迦鹳Y本投資合伙人陳石回憶道。

Morning Trail Investment 合伙人周欣華則認(rèn)為，大模型競(jìng)爭(zhēng)激烈，用戶黏性低，壟斷可能性低而成本太高，還是重復(fù)造輪子，可能剛造出來就被迭代了?！熬揞^扔出王炸、創(chuàng)企一夜團(tuán)滅的情況并非第一次，往往會(huì)對(duì)創(chuàng)業(yè)項(xiàng)目和投資人帶來致命打擊?！彼J(rèn)為，Sora橫空出世，顯得Pika就很雞肋；而谷歌的Gemini 1.5、Meta楊立昆的V-JEPA架構(gòu)、Stability AI的Stable Diffusion 3，也是當(dāng)前潛在的Sora圍剿勢(shì)力。

“重復(fù)造輪子”后被迭代的高風(fēng)險(xiǎn)，是投資人對(duì)模型端的普遍擔(dān)憂?！白畲蟮谋Э赡苁牵覀?cè)燧喿釉斐龅拈]源模型比不過別人的開源模型?！标愂a(bǔ)充說道。

“要想在底層投資上走到最后，確實(shí)需要龐大的資金、人才和資源，資源則包括算力、數(shù)據(jù)和場(chǎng)景，所以硅谷大廠都在投大模型公司。在當(dāng)前國內(nèi)的資本環(huán)境下，互聯(lián)網(wǎng)大廠或市場(chǎng)化VC基金都不一定能有做散財(cái)童子的底氣，很難在商業(yè)模式不清晰、投資成功概率不高的情況下把大模型投資進(jìn)行到底?！敝苄廊A說。

從大環(huán)境看，資本謹(jǐn)慎的趨勢(shì)已久。CVSource投中數(shù)據(jù)顯示，截至2024年2月，中國VC/PE市場(chǎng)投資規(guī)?？傔_(dá)67.74億美元，同比下降28.83％；近3個(gè)月的投資案例數(shù)量和規(guī)模整體均呈現(xiàn)下跌趨勢(shì)。

不過，在創(chuàng)投寒冬中，AI領(lǐng)域的投資規(guī)模在細(xì)分領(lǐng)域中仍最為突出，在2月高達(dá)11.06億美元。“Sora的話題度引爆了關(guān)注，文生視頻的團(tuán)隊(duì)普遍受到熱捧，但整體來講其他AI項(xiàng)目融資的難度可能還是和以前差不多?！眲?chuàng)業(yè)者M(jìn)ax表示。

對(duì)于普通創(chuàng)業(yè)者來說，提高自身造血能力，存活下來是當(dāng)前的首要目標(biāo)。“先在不確定性中找到一些商業(yè)上的確定性，可以再去追求產(chǎn)品長遠(yuǎn)的價(jià)值。在變動(dòng)期，先上車是最重要的事情?！蹦壳罢谧鯝I視頻創(chuàng)業(yè)項(xiàng)目的Fimmo分享道。

上述投資人都更傾向于看好商業(yè)模式清晰、落地場(chǎng)景明確的應(yīng)用層項(xiàng)目。陳石表示，團(tuán)隊(duì)投資的應(yīng)用項(xiàng)目同商業(yè)實(shí)踐結(jié)合緊密，并具有自己的業(yè)務(wù)縱深。

“但是，當(dāng)前很多應(yīng)用層的項(xiàng)目用AI炫技的成分居多，可能觸及了用戶的癢點(diǎn)，卻不是痛點(diǎn)?！敝苄廊A指出，在無法一步到位的情況下，一些過渡狀態(tài)可能存在機(jī)會(huì)。她總結(jié)了當(dāng)前應(yīng)用層項(xiàng)目的幾大優(yōu)勢(shì)方向：其一，商業(yè)場(chǎng)景用AI嵌入工作流，用AI參與過程，從而更容易落地項(xiàng)目；其二，善用大模型在用戶交互方面、小模型在私密性和垂直領(lǐng)域Know-how把握方面的優(yōu)勢(shì)，將大、小模型結(jié)合的垂類應(yīng)用項(xiàng)目；其三，利用AI的能力，使出海拓展更加高效可行的項(xiàng)目。

“應(yīng)用層項(xiàng)目還有一點(diǎn)利好在于，頭部的大模型還在追求AGI的星辰大海，暫時(shí)不會(huì)花過多時(shí)間去做過多的商業(yè)場(chǎng)景定制?！标愂治?，“因此，應(yīng)用層創(chuàng)業(yè)者還是要找到自己的生態(tài)位，要跟大語言模型保持‘安全距離，不要迎面撞向它的必經(jīng)之路，要找到自己技術(shù)或業(yè)務(wù)的縱深?！?p>

大廠“低調(diào)”布局

“這個(gè)事情還是挺燒錢的，大廠抬升了大模型項(xiàng)目的估值，他們最終可以找到人去買單，我們?nèi)绻读耍艺l來買單，這是最大的問題?！蓖顿Y人李童表示。

模型競(jìng)賽的主力軍，必然是擁有算力、資金、數(shù)據(jù)和人力優(yōu)勢(shì)的大廠。業(yè)內(nèi)人士普遍認(rèn)為，底層投資需要龐大的資金量和資源，而大廠有實(shí)力也有責(zé)任重視這場(chǎng)競(jìng)賽。

去年以來，中國大廠已然動(dòng)作頻頻，在推進(jìn)語言模型的同時(shí)布局視頻生成模型業(yè)務(wù)。尤其在歲末年初，步伐加速顯著。2024年1月17日，騰訊AI Lab再推出VideoCrafter2，實(shí)現(xiàn)文生視頻和圖生視頻。1月19日，百度推出視頻生成模型UnivG，支持文字和圖像組合輸入，針對(duì)高自由度和低自由度兩種任務(wù)分別采用不同的生成方式，項(xiàng)目由百度文心一格總架構(gòu)師肖欣延領(lǐng)銜。阿里巴巴通義實(shí)驗(yàn)室則開發(fā)了開源視頻生成模型和代碼系列 VGen。2023年11月，阿里在論文中宣布開源圖生視頻模型 I2VGen-XL；12月，推出文生視頻開源大模型ModelScopeT2V，模型和代碼完全開源。

字節(jié)跳動(dòng)也緊跟步伐。今年1月，字節(jié)跳動(dòng)發(fā)布文生視頻大模型MagicVideo-V2。2月20日左右，字節(jié)低調(diào)推出視頻模型產(chǎn)品Boximator，可通過文本控制生成視頻中人物或物體的動(dòng)作，但字節(jié)方面很快回應(yīng)稱，“Boximator目前還無法作為完善的產(chǎn)品落地，距離國外領(lǐng)先的視頻生成模型還有很大差距”。

2月7日，抖音集團(tuán)CEO張楠辭任，表示未來將聚焦剪映業(yè)務(wù)押注生成式AI。2月23日，字節(jié)在海外版剪映Capcut推出了有獨(dú)立主頁的AI視頻生成功能，短暫釋出后下線。而近日，剪映旗下AI創(chuàng)作平臺(tái)Dreamina的視頻生成功能也已開放內(nèi)測(cè)邀請(qǐng)。

此外，上市公司所推出的產(chǎn)品還包括萬興科技的萬興“天幕”大模型、美圖的MiracleVision的奇想智能大模型等等。

當(dāng)規(guī)模定律成為行業(yè)共識(shí)，大廠的重視程度，以及在算力、模型、數(shù)據(jù)上的資源投入和堆疊能力，成為了衡量成功可能性的重要因素。

基于此，部分AI創(chuàng)業(yè)者看好字節(jié)跳動(dòng)。據(jù)財(cái)聯(lián)社報(bào)道，截至去年9月，字節(jié)已建立超過一萬張英偉達(dá)Ampere架構(gòu)GPU集群，目前正在建設(shè)Hopper架構(gòu)的集群?！白止?jié)是國內(nèi)為數(shù)不多有‘萬卡集群算力資源優(yōu)勢(shì)的公司?！眲?chuàng)業(yè)者M(jìn)ax認(rèn)為，字節(jié)的視頻數(shù)據(jù)量在世界范圍內(nèi)處于領(lǐng)先地位，也是相對(duì)年輕的大廠，看好其對(duì)戰(zhàn)略布局的敏感度?！坝屑粲臣捌浜Ｍ獍娴募映郑止?jié)在短視頻和個(gè)人生產(chǎn)力工具上有優(yōu)勢(shì)地位，至少它不會(huì)是國內(nèi)大廠中做得最差的?！眲?chuàng)業(yè)者Fimmo補(bǔ)充。

不同于在互聯(lián)網(wǎng)時(shí)代找準(zhǔn)生態(tài)位、創(chuàng)造出現(xiàn)象級(jí)應(yīng)用的輝煌，字節(jié)在大模型時(shí)代仍然處于追隨者的位置。1月底，字節(jié)跳動(dòng)CEO梁汝波在全員會(huì)的發(fā)言中多次提到“危機(jī)感”，“字節(jié)跳動(dòng)目前的業(yè)務(wù)有非常大的慣性，哪怕團(tuán)隊(duì)不額外努力，公司仍然可以依賴慣性滑行很長一段時(shí)間，但這是很危險(xiǎn)的。”他說。

陳石認(rèn)為，輕易地作出判斷有些“想當(dāng)然”。盡管當(dāng)前每家大廠都很重視，“出牌”策略也不盡相同，但畢竟先是一個(gè)做“復(fù)制”的過程，最終可能都會(huì)趨同，“中國的大廠可能本質(zhì)區(qū)別不大，主要的差距和限制是能買到多少張GPU卡”。據(jù)他預(yù)測(cè)，在2024年末或2025年初，或就能見證大廠對(duì)Sora的復(fù)現(xiàn)。

但他也同時(shí)強(qiáng)調(diào)，大廠“必須要跟，要超越”?！坝袥Q心、有實(shí)力的大廠需要足夠重視。頭部的公司首先要具備閉源的能力，不能依賴于開源，在這一基礎(chǔ)上把生態(tài)堆起來?？梢栽谶@個(gè)位置等一等，當(dāng)未來的算力成本越來越低的時(shí)候，繼續(xù)挑戰(zhàn)往上走，這樣的情況就比較理想?！标愂f。

關(guān)于生成式AI，手機(jī)大廠的思路則與互聯(lián)網(wǎng)大廠有所不同。“作為智能終端廠商，我們不能將互聯(lián)網(wǎng)應(yīng)用服務(wù)廠商的事情作為自己的方向，而是要用AI重構(gòu)操作系統(tǒng)。未來在手機(jī)上可以有各種各樣大模型出現(xiàn)，手機(jī)提供算力接口，幫助更多的‘Sora高效運(yùn)行。”榮耀CEO趙明對(duì)《中國新聞周刊》表示。

MagicVideo-V2文生視頻大模型的部分作品展示。

PixVerse文生視頻展示的部分作品。

中國Sora花落誰家？

那么，倘若中國大廠和創(chuàng)企都“鉚足了勁”追平或超越Sora，誰能搶先為之？

“中國的大模型現(xiàn)階段還處于跟隨狀態(tài)，且參與者眾多，未來的分化與進(jìn)展并不好預(yù)測(cè)。不過，初創(chuàng)公司仍然會(huì)稍微難一些，大模型不需要大家都做，但大廠或國央企、政府的意志還是要有的?！标愂硎?。

在李童看來，除了在資金、算力、數(shù)據(jù)等方面的資源優(yōu)勢(shì)，“大廠也投資了很多大模型和算力公司，本身也是為所有下游應(yīng)用服務(wù)的，符合其整體戰(zhàn)略布局，它賺的是整個(gè)行業(yè)鏈的錢”。

“未來在AIGC視頻生成領(lǐng)域的算法層、平臺(tái)層和算力層中，大廠適合進(jìn)行全產(chǎn)業(yè)鏈布局，初創(chuàng)企業(yè)適合介入應(yīng)用層或中間層某一細(xì)分領(lǐng)域，央國企則適合從基礎(chǔ)設(shè)施開始布局?！奔鬃庸饽曛菐煊^點(diǎn)認(rèn)為。

因此，初創(chuàng)公司并非沒有機(jī)會(huì)。李童認(rèn)為，“在創(chuàng)意方面，所有人都是在同一個(gè)起跑線上競(jìng)爭(zhēng)。”王長虎則表示，“大廠具備資源、數(shù)據(jù)、流量方面的優(yōu)勢(shì)，使得創(chuàng)業(yè)公司一定要想著創(chuàng)新，尋求差異化，這是創(chuàng)業(yè)公司尋求成功的重要方面?！睆腁I產(chǎn)品榜統(tǒng)計(jì)的2月數(shù)據(jù)看，PixVerse的用戶訪問量規(guī)模已經(jīng)與國內(nèi)頭部的AI語言大模型和應(yīng)用工具在相同量級(jí)上競(jìng)爭(zhēng)。“這正得益于我們一年前的判斷和認(rèn)知所帶來的先發(fā)優(yōu)勢(shì)，在大家做大語言模型的時(shí)候差異化選擇了視頻模型，提前積累了技術(shù)。”

“創(chuàng)企和大廠之間，也絕不是非此即彼的關(guān)系。”王長虎認(rèn)為，OpenAI和微軟的合作就是“共贏”的典型代表，創(chuàng)企和大廠應(yīng)在合作共贏中做出差異化發(fā)展。“不僅能在存量市場(chǎng)中看到這種可能，當(dāng)所有用戶都能玩起視頻生成的時(shí)候，還將有巨大的增量市場(chǎng)?！?p>

開源視頻生成模型VGen的部分作品展示。

HiDream.ai的部分作品展示。

VideoCrafter2的部分作品展示。

放眼全球，中國視頻生成大模型的未來幾何？陳石提出了“模型跟隨+應(yīng)用生態(tài)”的設(shè)想。他認(rèn)為，目前中國企業(yè)在AI領(lǐng)域的機(jī)會(huì)主要在應(yīng)用層，“中國是數(shù)字經(jīng)濟(jì)時(shí)代應(yīng)用的優(yōu)秀生，很多應(yīng)用的實(shí)用程度、開發(fā)能力、易用性都是全球第一?！痹谒磥恚磥泶罅Πl(fā)展AI應(yīng)用，最終利用在應(yīng)用生態(tài)上的優(yōu)勢(shì)反向進(jìn)行技術(shù)突破，是屬于中國的AI技術(shù)解法之一。

身在局中，在王長虎看來，相比于語言和圖片生成領(lǐng)域，面向全球，中國在視頻生成大模型上跟海外是沒有差距的。一方面，誕生于視頻生成領(lǐng)域早期的團(tuán)隊(duì)，已接住了全球化的機(jī)會(huì)；另一方面，中國公司在UGC時(shí)代創(chuàng)造了世界級(jí)的視頻應(yīng)用，意味著中國團(tuán)隊(duì)將有更加豐富的產(chǎn)品經(jīng)驗(yàn)和場(chǎng)景認(rèn)知，而這些優(yōu)勢(shì)都能反哺視頻生成技術(shù)的發(fā)展本身。

當(dāng)前，Sora尚未面向大眾測(cè)試，用戶實(shí)際體驗(yàn)是否能與官方發(fā)布的視頻效果保持一致，這一點(diǎn)仍然未知。AI視頻大模型究竟走到了GPT-2還是GPT-3時(shí)刻，還有待世界共同見證Sora的正式面世。

“我們可以大膽想象，當(dāng)視頻生成技術(shù)發(fā)展成熟，秒級(jí)實(shí)時(shí)的視頻生成、視頻編輯、視頻交互成為現(xiàn)實(shí)，所有視頻創(chuàng)作者的生產(chǎn)模式、所有人對(duì)視頻內(nèi)容的消費(fèi)模式都將有翻天覆地的變化?！蓖蹰L虎預(yù)測(cè)道。

（文中李童、Max、Fimmo為化名）

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

大廠和創(chuàng)企，誰能跑出中國Sora？

創(chuàng)業(yè)者們的技術(shù)信仰被驗(yàn)證了

“投不投大模型？”

大廠“低調(diào)”布局

中國Sora花落誰家？

大廠和創(chuàng)企，誰能跑出中國Sora？

中國Sora花落誰家？