陳永偉
摘要:作為一種新的技術(shù),生成式AI的興起既帶來了很多全新的機(jī)遇,也帶來了很多全新的問題。具體到競爭領(lǐng)域,生成式AI不僅會帶來新的市場力量來源,還會催生出很多新的壟斷行為,為了應(yīng)對這些問題,就必須對生成式AI市場的競爭規(guī)律有充分的了解。本文首先對生成式AI的競爭本質(zhì)進(jìn)行了歸納,指出這個市場的競爭其實(shí)是圍繞著模型、數(shù)據(jù)和算力展開的“三元競爭”。在此基礎(chǔ)上,本文進(jìn)一步分析了這三方面因素究竟如何為企業(yè)帶來了市場力量,又可能帶來哪些競爭問題。最后,本文還對如何應(yīng)對生成式AI造成的問題提出了一些可行的思路。
關(guān)鍵詞:生成式AI;模型;數(shù)據(jù);算力
2022年11月末,OpenAI發(fā)布了大型語言模型ChatGPT。這款A(yù)I模型不僅可以十分流暢地回答用戶的各種提問,還可以完成諸如資料整理、文本寫作,甚至程序編寫等工作。因而,ChatGPT發(fā)布之后,就廣受用戶好評,上線僅五天用戶量就突破了百萬,上線不到兩個月用戶就實(shí)現(xiàn)了破億。在此后的數(shù)月中,ChatGPT迅速實(shí)現(xiàn)了多次升級和迭代,不僅將其背后的模型從GPT-3.5升級為了GPT-4,還加入了多模態(tài)能力和插件功能。憑借著ChatGPT的優(yōu)越表現(xiàn),OpenAI的估值一舉突破了千億美元,成為全球估值第三的創(chuàng)業(yè)公司。
ChatGPT及其背后的基礎(chǔ)模型GPT僅僅是過去一年中涌現(xiàn)的無數(shù)“生成式AI”模型(Generative AI)的代表。不同于更早的“分析型AI”模型,生成式AI模型不僅可以幫助人們分析數(shù)據(jù)、預(yù)測趨勢,還可以生成新的文字、圖片、音頻和視頻信息。得益于這一特點(diǎn),這類模型被廣泛地應(yīng)用于各行各業(yè),成為新一代的“通用目的技術(shù)”(General Purpose Technology)。
不過,生成式AI在帶給人們諸多便利的同時,也引發(fā)了很多新的問題。其中,生成式AI模型對科技巨頭市場力量的強(qiáng)化,以及對市場競爭秩序的破壞,就是受關(guān)注程度較高的一類問題。目前,已有不少國家和地區(qū)的監(jiān)管部門對生成式AI領(lǐng)域存在的競爭問題表示了關(guān)切。例如,在2023年7月,美國聯(lián)邦貿(mào)易委員會(Federal Trade Commission,以下簡稱FTC)就對OpenAI損害消費(fèi)者權(quán)益等問題展開了調(diào)查;2024年1月,F(xiàn)TC又對谷歌、OpenAI等企業(yè)的投資狀況、與合作者的關(guān)系,以及它們對市場競爭的影響問題發(fā)起了調(diào)查;最近,歐盟委員會也對生成式AI可能產(chǎn)生的競爭問題表達(dá)了關(guān)切。
值得注意的是,盡管生成式AI對于競爭的影響是十分現(xiàn)實(shí)的,然而當(dāng)前關(guān)于這些問題的理論探討還非常有限。究竟在現(xiàn)實(shí)中,生成式AI的開發(fā)企業(yè)之間的競爭是怎樣展開的?在競爭過程中又會產(chǎn)生哪些競爭問題?對于這些問題,又該如何應(yīng)對?關(guān)于這些問題,我們依然所知甚少。因而,在制定相關(guān)的法律和政策時,也就存在著很多的困難。
在本文中,我們將對生成式AI的競爭特征、競爭模式進(jìn)行探討,并對競爭過程中可能存在的問題進(jìn)行揭示。在此基礎(chǔ)上,還將對這些問題的規(guī)制提出一些可供參考的思路。
一、生成式AI競爭的三要素
對于生成式AI公司而言,其市場優(yōu)勢來自三個方面:模型、數(shù)據(jù)和算力。某種意義上,生成式AI市場上的競爭其實(shí)是圍繞著這三方面展開的“三元競爭”(Triple competition)。在本節(jié)中,我們將對這三類關(guān)鍵要素分別進(jìn)行介紹。
1.模型
生成式AI依賴基于大數(shù)據(jù)集訓(xùn)練的深度學(xué)習(xí)模型來創(chuàng)建新內(nèi)容,因而從競爭角度看,模型對生成式AI公司來說是最為重要的。
在現(xiàn)有的技術(shù)條件下,模型的性能在很大程度上取決于其參數(shù)的數(shù)量。一般來說,模型的參數(shù)量越大,其學(xué)習(xí)的能力也會更強(qiáng),但與此同時,它們對算力和電力投入的需求也會更大,因而開發(fā)的成本也會更高。為了克服大模型的上述問題,很多企業(yè)試圖通過低秩自適應(yīng)、知識蒸餾等技術(shù)來推進(jìn)模型的小型化?,F(xiàn)在,已經(jīng)有一些參數(shù)量較小的模型實(shí)現(xiàn)了不錯的性能。
根據(jù)模型的開放程度,生成式AI模型可以分為兩大類——“閉源模型”(closed-source model)和“開源模型”(open-source model)。其中,閉源模型的源代碼和技術(shù)細(xì)節(jié)完全被其提供商控制,不對外進(jìn)行公開,也不允許用戶對這些模型本身進(jìn)行更改。例如,OpenAI的GPT、谷歌的Gemini、百度的文心一言等,都屬于閉源模型。開源模型的提供商則會將模型的源代碼和技術(shù)細(xì)節(jié)公開,并允許其用戶根據(jù)其自身需要對模型進(jìn)行任意的使用和修改。例如,Meta的LLaMA、Stability AI的Stable Diffusion等,就屬于開源模型的代表。
需要指出的是,在現(xiàn)實(shí)中,閉源模型和開源模型之間也未必涇渭分明,模型的提供商會根據(jù)具體情況對模型的開放程度進(jìn)行調(diào)整。一些模型的初期版本曾是開源的,但后續(xù)版本則進(jìn)行了閉源。比如,GPT在3.0版本之前都會通過論文公開其具體的技術(shù)細(xì)節(jié),但在3.5版本之后,則不再公開這一切。又如,阿里云的通義千問、智譜AI的GLM等,在早期是閉源模型,但隨后則逐漸進(jìn)行了開源。與之相對的,另一些模型早期則是開源模型,但隨后則逐漸進(jìn)行了閉源。比如,百川智能的Baichuan-7B、Baichuan-13B等模型在初期就是開源的,但后來提供商則對其采取了閉源。
在模型的性能方面,閉源模型和開源模型各有利弊。閉源模型通常由專業(yè)的團(tuán)隊(duì)加以研發(fā),其開發(fā)和維護(hù)的進(jìn)度更為穩(wěn)定,因而模型也會更為穩(wěn)定和優(yōu)質(zhì)。不過,由于閉源模型對其關(guān)鍵技術(shù)的保密性更強(qiáng),其包含的新技術(shù)的擴(kuò)散性會較弱。相比之下,開源模型則主要是社區(qū)維護(hù),未必可以很好確保對其開發(fā)和維護(hù)的支持,因而模型的穩(wěn)定性和質(zhì)量會略微遜色。但是,開源模型會大幅度降低模型的可得門檻,它們會比閉源模型更容易推廣和擴(kuò)散。并且,隨著模型使用人數(shù)的增加,它會更容易發(fā)展出相關(guān)的使用生態(tài),也會更容易實(shí)現(xiàn)模型的技術(shù)迭代。
在盈利模式上,開源模型和閉源模型存在著很大的差別。一般來說,閉源模型主要通過向用戶提供使用許可、訂閱服務(wù),以及云服務(wù)等方式來獲取收入。以GPT為例:個人用戶可以按月向OpenAI支付訂閱費(fèi)以獲得使用權(quán);企業(yè)用戶則可以向OpenAI申請API,并按照使用量向其支付費(fèi)用。除此之外,微軟的Office 365,以及Azure云也都搭載了GPT模型,用戶也可以通過購買云服務(wù)來使用該模型。相比之下,開源模型并不直接向用戶售賣或收費(fèi),而是通過提供服務(wù)或支持、雙授權(quán)(即同時授權(quán)模型的開源版本和閉源版本)等間接的方式來獲取收入。以Stable Diffusion為例:Stability AI主要通過向用戶提供咨詢,以及為用戶提供定制版的Stable Diffusion來獲取收益。
從競爭的角度看,AI模型的提供商需要考慮的問題將包括如下幾個方面:一是模型的開放性和兼容性,即應(yīng)該讓模型保持閉源還是將其開源;二是模型的質(zhì)量,即應(yīng)該投入多大的資源,將模型的性能改善到怎樣的程度;三是模型的定價(jià)方式及價(jià)格,即模型應(yīng)該用怎樣的方式來獲取收入,以及究竟應(yīng)該將價(jià)格定在怎樣的位置。
2.數(shù)據(jù)
無論是在模型的訓(xùn)練階段,還是在隨后的微調(diào)過程中,都會涉及數(shù)據(jù)的使用。只有投入的數(shù)據(jù)量足夠大、質(zhì)量足夠高,最終得到的模型性質(zhì)才能夠讓人滿意。在這種情況下,對數(shù)據(jù)集的占有就成為企業(yè)在生成式AI競爭中取得優(yōu)勢的關(guān)鍵因素之一。在對數(shù)據(jù)的競爭中,企業(yè)需要綜合考慮數(shù)據(jù)的規(guī)模、質(zhì)量,以及及時性等因素。
首先是數(shù)據(jù)的規(guī)模。有研究表明,相比于模型本身的結(jié)構(gòu),數(shù)據(jù)規(guī)模對模型表現(xiàn)的影響有時可能會更大。因而,要訓(xùn)練優(yōu)質(zhì)的模型,投入的數(shù)據(jù)規(guī)模就必須足夠大。在實(shí)踐中,企業(yè)用于模型訓(xùn)練的數(shù)據(jù)既包括公有數(shù)據(jù),也包括私有數(shù)據(jù)。其中,公有數(shù)據(jù)包括報(bào)刊、書籍上的文字信息,以及網(wǎng)絡(luò)上的各種新聞信息、社區(qū)對話材料等。例如,在ChatGPT的訓(xùn)練中,就大量使用了《紐約時報(bào)》等媒體的材料,以及維基百科等網(wǎng)站的信息。私有數(shù)據(jù)則包括企業(yè)自行構(gòu)建的數(shù)據(jù)集,以及來自其旗下應(yīng)用軟件的數(shù)據(jù)等。比如,DeepMind為了訓(xùn)練數(shù)據(jù)就專門構(gòu)建了MassiveText數(shù)據(jù)集。
其次是數(shù)據(jù)的質(zhì)量。對AI模型的訓(xùn)練而言,數(shù)據(jù)的質(zhì)量至少和數(shù)據(jù)的規(guī)模具有同樣的重要性。研究表明,當(dāng)投入的數(shù)據(jù)質(zhì)量更高時,不僅可以減少對訓(xùn)練數(shù)據(jù)規(guī)模和算力投入的要求,還可以有效改進(jìn)模型質(zhì)量?;谝陨显颍壳皵?shù)據(jù)競爭的重心已經(jīng)逐漸從對“量”的爭奪轉(zhuǎn)移到了對“質(zhì)”的爭奪上。
再次是數(shù)據(jù)的及時性。對于很多任務(wù)而言,數(shù)據(jù)的時效性是極為關(guān)鍵的。例如,當(dāng)人們與AI就一些時事話題進(jìn)行交互時,只有最新的數(shù)據(jù)才能保證AI回復(fù)的準(zhǔn)確性。在實(shí)踐中,AI公司為了保證數(shù)據(jù)的時效性,都投入了很大的努力。例如,包括微軟、谷歌、OpenAI在內(nèi)的很多機(jī)構(gòu)都會通過爬蟲抓取最新的數(shù)據(jù),然后讓自己的模型用這些數(shù)據(jù)進(jìn)行訓(xùn)練。
3.算力
無論是訓(xùn)練還是運(yùn)行生成式AI模型,都需要大量的算力資源作為支持。因而,在生成式AI的市場競爭中,對算力資源的獲取和掌握起著至關(guān)重要的作用。
現(xiàn)實(shí)中,不同的AI服務(wù)提供商會根據(jù)自身的特點(diǎn)來選擇究竟是使用自有的算力資源,或是租用云端的算力資源。一般來說,那些資金和技術(shù)實(shí)力較為雄厚的企業(yè)會更愿意選擇自行配置算力資源。例如,微軟及其商業(yè)盟友OpenAI、谷歌及其旗下的DeepMind,以及Meta等企業(yè)不僅會購置大量的GPU,甚至還會自行開發(fā)TPU、超級計(jì)算機(jī)等新型的算力技術(shù),用以支持AI模型的訓(xùn)練和運(yùn)行。相比之下,一些實(shí)力較弱的企業(yè)出于節(jié)省固定投資的考慮,則會更傾向于租用云端的資源。
二、生成式AI的市場力量來源
在生成式AI的競爭中,企業(yè)要獲得市場力量,就必須在模型、數(shù)據(jù)、算力這三要素中的至少一種上確立其優(yōu)勢。在本節(jié)中,我們將逐一分析每一種要素將會如何為企業(yè)貢獻(xiàn)市場力量。
1.模型與市場力量
模型帶給AI公司的市場力量主要是通過其規(guī)模經(jīng)濟(jì)和網(wǎng)絡(luò)效應(yīng)實(shí)現(xiàn)的。
先看規(guī)模經(jīng)濟(jì)。這主要是由生成式AI的成本特征決定的。眾所周知,對生成式AI模型進(jìn)行開發(fā)和訓(xùn)練是一項(xiàng)成本非常高的工作。它不僅需要大量的人力和設(shè)備,更需要投入海量的算力資源作為支持,由此會產(chǎn)生巨大的固定成本。以GPT-4的開發(fā)為例:其訓(xùn)練一次所需要的計(jì)算量約為2.1×1025FLOPS,大約需要在25000個A100型GPU上訓(xùn)練90—100天,所產(chǎn)生的成本約為6300萬美元。當(dāng)模型開發(fā)成功之后,它則可以以相對較低的邊際成本被調(diào)用。這樣,隨著用戶量的增長,前期產(chǎn)生的固定成本就可以不斷被攤銷,其平均成本就會越來越低。因而,相比于新開發(fā)的模型,那些擁有龐大用戶的在位AI公司將會擁有更低的平均成本,進(jìn)而在定價(jià)方面有更大的空間。
再看網(wǎng)絡(luò)效應(yīng)。和其他的網(wǎng)絡(luò)產(chǎn)品一樣,AI模型也具有十分顯著的網(wǎng)絡(luò)效應(yīng),即隨著模型用戶數(shù)量的增加,新用戶對其的評價(jià)將會更高。從本質(zhì)上講,AI模型的網(wǎng)絡(luò)效應(yīng)是由其技術(shù)特征決定的。AI模型只有不斷地與用戶交互、接受他們的反饋,才可能及時發(fā)現(xiàn)其自身存在的各種不足,從而及時對這些缺陷進(jìn)行修正。與此同時,模型還需要與用戶持續(xù)交互來發(fā)現(xiàn)用戶的使用習(xí)慣,從而為其提供個性化的服務(wù)。在這種情況下,那些面世更早、用戶量更大、迭代時間更久的模型將會比新的模型更容易改進(jìn)自己的性能,從而讓自己變得更有吸引力。反過來,這又會進(jìn)一步讓模型獲得更多的用戶,從而讓其獲得更多交互和反饋的機(jī)會。
在規(guī)模經(jīng)濟(jì)和網(wǎng)絡(luò)效應(yīng)的作用之下,在位的AI公司就可能比新進(jìn)入市場的競爭者具有更大的優(yōu)勢。由此,它們就可能確立自己的市場力量。
需要說明的是,技術(shù)和行業(yè)環(huán)境的變化可能會對AI模型的規(guī)模經(jīng)濟(jì)和網(wǎng)絡(luò)效應(yīng)產(chǎn)生很大的影響。例如,目前的模型小型化趨勢將會大幅度降低研發(fā)和訓(xùn)練模型的成本,這就可能在相當(dāng)程度上削弱在位模型的規(guī)模經(jīng)濟(jì)。又如,更為活躍的開源社群可以讓更多優(yōu)秀的人才投入到對開源模型的改進(jìn)和維護(hù)中來,并允許在社群內(nèi)部更好地分享技術(shù)進(jìn)步的成果,由此讓開源模型的迭代速度更快。這就可以在一定程度上抵消掉網(wǎng)絡(luò)效應(yīng)帶給某些在位AI企業(yè)的優(yōu)勢。
2.數(shù)據(jù)與市場力量
由于對AI模型而言,優(yōu)質(zhì)的數(shù)據(jù)是重要的投入品,因而對數(shù)據(jù)的掌握將有助于市場參與者確立其地位。
很多企業(yè)會通過購買數(shù)據(jù)源,或者與數(shù)據(jù)源簽訂獨(dú)家使用協(xié)議等方式來確保自己對于數(shù)據(jù)的獨(dú)占。比如,生成式AI要訓(xùn)練其編程能力,就需要從一些代碼托管平臺大量抓取和學(xué)習(xí)優(yōu)質(zhì)的代碼。然而,在近幾年,一些科技巨頭已經(jīng)著手對代碼托管平臺進(jìn)行收購。例如微軟就在2018年收購了全球最大的代碼托管平臺GitHub,并在隨后允許其盟友OpenAI將GitHub上的大量代碼應(yīng)用于GPT模型的訓(xùn)練。雖然目前微軟并沒有排斥其他的開發(fā)者使用GitHub的代碼,但從理論上講,它確實(shí)具有這樣的能力。很顯然,如果這樣的情況發(fā)生,那么其競爭對手研發(fā)AI模型的效率將會受到很大的損害。
另外,在生成式AI的市場參與者中,有一部分本身就是優(yōu)質(zhì)的數(shù)據(jù)所有者。例如谷歌、Meta等本身就有天然的數(shù)據(jù)優(yōu)勢。尤其需要指出的是,在移動互聯(lián)時代,有很多的應(yīng)用都構(gòu)建了相對封閉的生態(tài),利用外部的爬蟲技術(shù)很難對這些封閉的應(yīng)用進(jìn)行數(shù)據(jù)抓取。在這種情況下,這些生態(tài)中的數(shù)據(jù)就事實(shí)上成為這些應(yīng)用開發(fā)者的“私有”資源。因而,當(dāng)這些應(yīng)用的開發(fā)者開發(fā)AI模型時,就會先天擁有更多的優(yōu)質(zhì)數(shù)據(jù),這會讓它們更容易獲取市場力量。
3.算力與市場力量
要實(shí)現(xiàn)AI的訓(xùn)練,海量的算力投入是必不可少的。盡管從理論上講所有的市場參與者都擁有平等地獲取算力的機(jī)會,但在現(xiàn)實(shí)中,那些實(shí)力更為雄厚的參與者顯然會更容易獲取這種稀缺的資源。例如,現(xiàn)在的AI模型訓(xùn)練非常依賴于高質(zhì)量的GPU,因而英偉達(dá)的H100、A100等型號的GPU存在著嚴(yán)重的供不應(yīng)求。在這種市場格局之下,英偉達(dá)出于維護(hù)客戶資源的關(guān)系,就會優(yōu)先考慮微軟、谷歌等大客戶,讓自己的GPU優(yōu)先保證它們的供應(yīng)。這樣,優(yōu)先獲取GPU就可以擁有更多的算力資源,從而在市場上獲得更大的優(yōu)勢。
另外值得一提的是,很多AI市場的參與者本身還運(yùn)營云平臺,它們本身就是其他一些AI市場參與者的算力提供者。作為平臺運(yùn)營者,它們具有企業(yè)和市場管理者的兩重角色,因而對其用戶具有很強(qiáng)的控制能力。比如,亞馬遜、微軟、谷歌等企業(yè)都在云服務(wù)市場上擁有顯著的市場力量。因而,它們事實(shí)上就在一定程度上掌握了為其潛在的對手分配算力的能力,這無疑會有助于鞏固其在AI市場上的地位。
三、生成式AI的潛在競爭問題
和所有其他的市場一樣,在生成式AI的市場上也存在著很多潛在的競爭問題。表1對其中的一些問題進(jìn)行了總結(jié)。下面,我們將對這些問題分別進(jìn)行簡單的說明。
1.模型層面的競爭問題
在生成式AI的模型層面,存在著很多值得關(guān)注的問題。比如,在經(jīng)營者集中方面,以財(cái)務(wù)投資為掩護(hù)的新型合作關(guān)系以及扼殺式并購是十分值得注意的;在濫用市場支配地位方面,拒絕交易、捆綁銷售、掠奪性定價(jià)等問題都可能存在;而在壟斷協(xié)議方面,算法合謀將會是一個需要引起重視的問題。
(1)投資合作關(guān)系
在生成式AI市場上,有不少科技巨頭與具有強(qiáng)大研發(fā)能力的新創(chuàng)企業(yè)采取了一種新型的投資合作關(guān)系。對于科技巨頭而言,這種類型的合作不僅可以很好地規(guī)避企業(yè)制度對投資規(guī)模的限制,還可以有效地避免研發(fā)失敗所帶來的種種負(fù)面效應(yīng),因而非常具有吸引力。
以微軟和OpenAI為例,這兩家企業(yè)在對AI模型的研發(fā)過程中采取的合作關(guān)系非常新穎:微軟向OpenAI投資130億美元,以獲得其49%的股份和75%的利潤分成權(quán)。隨著微軟從OpenAI所獲利潤收入的增加,其在OpenAI的股份占比將逐漸減少。最終,當(dāng)微軟從OpenAI獲得的利潤超過1500億美元后,OpenAI將回收微軟手中的全部股份。從表面上看,微軟對OpenAI的投資是純粹的財(cái)務(wù)投資,并沒有對后者的控制權(quán)進(jìn)行圖謀和干預(yù)。因此,在名義上微軟和OpenAI依然是兩個獨(dú)立決策的個體?;谶@樣的原因,所以這次投資很好地躲過了很多國家的經(jīng)營者集中審查。但事實(shí)上,這種財(cái)務(wù)上的合作顯然是促成兩家共同行動的重要契機(jī)。在現(xiàn)實(shí)中,兩家企業(yè)在研發(fā)和產(chǎn)品推廣上都存在著非常緊密的合作。微軟不僅向OpenAI提供了極為寶貴的GPU資源,還在GPT等模型的研發(fā)過程中提供了很多的技術(shù)支持。作為回報(bào),OpenAI也允許微軟優(yōu)先使用其產(chǎn)品,甚至在GPT-4模型正式發(fā)布之前,微軟的必應(yīng)搜索和Office 365已經(jīng)搭載了這款模型。雖然從兩家企業(yè)的公開表態(tài)看,它們之間的合作關(guān)系與微軟的投資和占股并沒有直接的關(guān)系,但這似乎很難讓人信服。
客觀地說,上述這樣的投資合作關(guān)系可以很好地克服各種制度障礙,從而讓巨頭和新創(chuàng)企業(yè)都更好地發(fā)揮自己在技術(shù)創(chuàng)新過程中的積極作用,但與此同時,其負(fù)面的效果也是明顯的。例如,在微軟和OpenAI的合作案例中,微軟就在很多領(lǐng)域(比如SaaS辦公產(chǎn)品)獲得了GPT模型的獨(dú)家授權(quán),從而妨礙了其他競爭對手取得該模型的使用。容易看到,這可能會讓微軟在這些領(lǐng)域排除和限制競爭,進(jìn)一步鞏固其市場地位。
基于以上原因,很多國家和地區(qū)的反壟斷執(zhí)法機(jī)關(guān)已經(jīng)對這種新型的投資合作關(guān)系給予了重視。比如美國的FTC、歐盟委員會,以及英國的CMA都已經(jīng)分別對微軟和OpenAI之間的這種關(guān)系展開了調(diào)查,以明確微軟是否通過財(cái)務(wù)合作事實(shí)上獲取了OpenAI的控制權(quán)。不過,到目前為止,上述調(diào)查都還在進(jìn)行中,究竟對于這種合作關(guān)系如何進(jìn)行評價(jià)和規(guī)制,依然是一個開放性的問題。
(2)扼殺式并購
所謂“扼殺式并購”(Killer Acquisition),狹義上指的是“以停止目標(biāo)企業(yè)的創(chuàng)新項(xiàng)目,以規(guī)避未來競爭為目的”的并購;廣義上指的是針對具有潛在競爭威脅的新創(chuàng)企業(yè)的并購。
在AI模型的市場競爭中,扼殺式并購十分常見。比如,2014年谷歌對DeepMind的并購就經(jīng)常被視為扼殺式并購的典型;微軟在發(fā)展AI的過程中,曾經(jīng)并購過Maluuba、Builder.ai等大量的優(yōu)秀AI初創(chuàng)企業(yè);而據(jù)報(bào)道,蘋果僅在2023年,就并購了32家AI初創(chuàng)企業(yè)。
關(guān)于扼殺式并購的總體影響究竟如何,依然存在著很大爭議:一方面,它可以為優(yōu)秀的AI初創(chuàng)企業(yè)提供額外的退出渠道,從而更好地激發(fā)人們的創(chuàng)業(yè)熱情。但另一方面,它也可能讓在位的壟斷企業(yè)排除潛在競爭,鞏固其市場支配地位,從而破壞市場的競爭秩序。從競爭的角度看,這必須得到高度重視。值得指出的是,由于初創(chuàng)企業(yè)的估值通常較低,以它們?yōu)槟繕?biāo)的并購會更容易被經(jīng)營者集中審查所放行,而很多潛在的競爭風(fēng)險(xiǎn)則可能因此被忽視。從長期看,這對于市場環(huán)境造成的負(fù)面影響將可能是相當(dāng)顯著的。
(3)拒絕交易
在實(shí)踐當(dāng)中,一些AI模型企業(yè)會拒絕對特定的用戶群體提供服務(wù)。比如,OpenAI曾經(jīng)拒絕一些國家和地區(qū)的用戶進(jìn)行訪問,同時拒絕對這些國家和地區(qū)的開發(fā)者開放API。最近,它又禁止了字節(jié)跳動等與其具有潛在競爭關(guān)系的企業(yè)訪問GPT。類似這樣的情況,就可能構(gòu)成拒絕交易行為。
需要指出的是,從反壟斷的角度看,單純的拒絕交易未必會被認(rèn)定為違法。事實(shí)上,在當(dāng)前的市場上,存在著很多可以相互替代的AI模型,其中的相當(dāng)一部分模型甚至是開源的。這種情況下,某一家企業(yè)拒絕用戶使用其模型暫時難以構(gòu)成實(shí)質(zhì)上的競爭損害。
不過,從理論上講,這種風(fēng)險(xiǎn)依然是存在的。尤其是當(dāng)某些企業(yè)將AI和其先前的業(yè)務(wù)相結(jié)合后,這種風(fēng)險(xiǎn)還可能越來越大。舉例來說,目前谷歌對于為其Chrome瀏覽器開發(fā)AI應(yīng)用插件的開發(fā)者并沒有限制其調(diào)用的AI產(chǎn)品,所以開發(fā)者完全可以用OpenAI的GPT來進(jìn)行相關(guān)插件的開發(fā)。然而,在外來的某個時間,谷歌出于推廣其AI產(chǎn)品Gemini的需要,很可能會要求開發(fā)者只能用Gemini來開發(fā)插件,或者直接通過技術(shù)條件來直接實(shí)現(xiàn)這一點(diǎn)。在這種情況下,如果谷歌再拒絕對某些開發(fā)者開放Gemini的API,就可能造成非常直接的競爭損害。
(4)捆綁銷售
在當(dāng)前的生成式AI市場上,不少AI模型的推廣都是通過捆綁銷售來實(shí)現(xiàn)的。舉例來說,目前微軟在其辦公產(chǎn)品Office 365、協(xié)同辦公產(chǎn)品Teams、云產(chǎn)品Azure,以及搜索產(chǎn)品必應(yīng)當(dāng)中都搭載了其合作伙伴OpenAI出品的GPT模型。
捆綁銷售可能造成市場力量的杠桿傳導(dǎo),從而讓在某個市場上具有支配地位的企業(yè)將其市場力量傳導(dǎo)到其他市場。至少在微軟和OpenAI的案例中,這一點(diǎn)似乎是不可忽視的。眾所周知,微軟本來就在辦公軟件、云產(chǎn)品等多個市場上擁有相當(dāng)?shù)氖袌隽α?,因而將GPT模型與這些產(chǎn)品進(jìn)行捆綁無疑有助于增加GPT模型在市場上的競爭力,讓其可以更容易地占據(jù)更大份額的市場。反過來,GPT模型由于其優(yōu)秀的表現(xiàn),也在市場上獲得了相當(dāng)程度的認(rèn)可,因而將其捆綁到微軟的產(chǎn)品當(dāng)中也有助于鞏固微軟在這些市場上的地位。
很顯然,從反壟斷的角度看,上述這樣的效應(yīng)是不可忽視的。可以預(yù)見,捆綁銷售問題將成為生成式AI領(lǐng)域最需要重視的反壟斷問題之一。
(5)掠奪性定價(jià)
所謂掠奪性定價(jià),指的是企業(yè)通過在一定時期內(nèi)設(shè)定低價(jià),以排擠競爭對手,或者阻礙潛在競爭對手進(jìn)入的行為。這所謂“低價(jià)”,是相對于成本而言的。企業(yè)之所以采用掠奪性定價(jià)策略,是為了用低價(jià)先將對手逐出市場,讓自己成為市場上的壟斷者,然后再索取壟斷高價(jià)。
在生成式AI領(lǐng)域,掠奪性定價(jià)主要表現(xiàn)為企業(yè)的“先開源、后閉源”策略。如前所述,在市場上,有部分AI模型的提供商先通過開源策略獲取了很高的市場占有率,并通過大量的用戶反饋,對模型進(jìn)行了快速的迭代。此后,這些模型就轉(zhuǎn)向了閉源,按照訂閱或開放API的方式向用戶收費(fèi)。容易看到,這樣的策略就十分有可能涉嫌掠奪性定價(jià)問題。
當(dāng)然,要確定“先開源、后閉源”策略究竟是否真的構(gòu)成掠奪性定價(jià),還需要對其定價(jià)策略進(jìn)行進(jìn)一步地考察。一般認(rèn)為,掠奪性定價(jià)需要經(jīng)歷兩個階段:第一個階段,企業(yè)需要將價(jià)格定在其成本之下,從而造成虧損;第二階段,企業(yè)需要收取高價(jià),讓其利潤成功補(bǔ)償前期因低價(jià)造成的虧損。究竟“先開源、后閉源”的策略是否能和這兩個階段對應(yīng),是需要分析的。事實(shí)上,即使企業(yè)對模型進(jìn)行了開源,它依然可以通過提供咨詢、定制服務(wù)等方式獲取一定的收入,同時開源還分擔(dān)了模型的維護(hù)成本,因而在開源階段,它們也未必會虧損。如果是這樣,那么掠奪性定價(jià)的定性就不能成立。
(6)算法合謀
在AI興起之后,算法合謀就成為反壟斷學(xué)界重點(diǎn)關(guān)注的一個問題。人工智能不僅可以作為工具,幫助人們更容易達(dá)成合謀,還可能因算法設(shè)計(jì)上的相似性,在處理價(jià)格等市場變量時自發(fā)達(dá)成一致,從而形成事實(shí)上的合謀。這一切,都可能對市場的競爭秩序造成負(fù)面的影響。
具體到生成式AI,由于大批的用戶都可以調(diào)用同一模型進(jìn)行交互,通過共同使用的模型這個中介,不同的用戶之間將可以在一定程度上實(shí)現(xiàn)信息的交換,從而達(dá)到合謀的目的。關(guān)于通過模型進(jìn)行信息交換這個機(jī)制,現(xiàn)在已經(jīng)有了一些證據(jù)的佐證。比如,三星曾要求其員工停止使用GPT,其理由是GPT可能造成內(nèi)部敏感信息的外泄。如果三星表述的事實(shí)成立,那就說明不同用戶直接通過模型間接交換信息的機(jī)制是成立的,因而也就不能排除他們可以通過這種信息交互達(dá)成合謀的可能性。除此之外,一些模型本身包含的信息也可能誘發(fā)不同用戶之間的協(xié)同行為,這在事實(shí)上也會造成類似默契合謀的后果。在一些特殊的情況下,AI模型的提供商甚至可以控制模型向用戶們輸出誘導(dǎo)合謀的信息,從而促成合謀的達(dá)成。考慮到這些情況,在生成式AI領(lǐng)域,算法合謀問題將依然是一個需要十分重視的話題。
2.數(shù)據(jù)層面的競爭問題
在生成式AI的數(shù)據(jù)層面,同樣有很多潛在的競爭問題值得重視。比如,在經(jīng)營者集中方面,以爭奪數(shù)據(jù)源為目的的縱向并購將會是一個值得關(guān)注的問題;在濫用市場支配地位方面,限制互操作性和自我優(yōu)待將可能成為突出的問題。
(1)縱向并購
對于科技企業(yè)而言,數(shù)據(jù)是極為關(guān)鍵的投入品。為了對這種投入品進(jìn)行爭奪,企業(yè)會把對優(yōu)質(zhì)數(shù)據(jù)源的獲取作為并購的主要目標(biāo)之一。在過去的幾年中,已經(jīng)出現(xiàn)了不少相關(guān)的案例。比如,在蘋果并購Shazam、臉書并購WhatsApp、臉書并購Instagram、谷歌并購DoubleClick等案件背后,獲取數(shù)據(jù)都是驅(qū)動并購的主要目的之一。
在生成式AI的競爭中,市場上的在位企業(yè)對優(yōu)質(zhì)數(shù)據(jù)的渴求變得比過去更為強(qiáng)烈,這就使得它們發(fā)動了更多和數(shù)據(jù)相關(guān)的縱向并購,其中著名的案例就包括微軟并購GitHub、谷歌并購Kaggle等。當(dāng)這些企業(yè)實(shí)施了并購之后,可能會拒絕將原本開放的數(shù)據(jù)源提供給與之具有競爭關(guān)系的企業(yè)使用,由此阻斷對手對關(guān)鍵數(shù)據(jù)的獲取,或至少讓它們獲得數(shù)據(jù)的成本大幅上升。這樣的封鎖(foreclosure)行為可能會排除潛在的競爭,幫助AI市場上的在位企業(yè)進(jìn)一步鞏固其市場地位。
(2)限制互操作性
在生成式AI市場上,很多企業(yè)本身就是重要數(shù)據(jù)源的控制者。比如,Meta就掌握了臉書、Instagram等多個社交平臺,這些社交平臺每天都會生成大量的數(shù)據(jù)。很多AI的開發(fā)商為了獲取訓(xùn)練數(shù)據(jù)來訓(xùn)練模型,都需要向這些企業(yè)申請數(shù)據(jù)開放。不過,出于排除和限制競爭的考慮,這些掌握了數(shù)據(jù)源的企業(yè)很可能會限制對申請者的互操作性。比如,在2020年的FTC訴臉書案中,臉書就被指控拒絕向那些與其具有競爭關(guān)系的開發(fā)者們開放API。
如果相關(guān)數(shù)據(jù)是必須而不可替代的,那么上述的限制互操作行為將可能對競爭對手產(chǎn)生顯著的封鎖效應(yīng),由此可能會對市場的競爭秩序造成破壞。
(3)自我優(yōu)待
所謂“自我優(yōu)待”,指的是同時經(jīng)營多個市場的企業(yè)利用其中一個市場上的資源和優(yōu)勢來為另一個市場的競爭進(jìn)行服務(wù)。嚴(yán)格來說,自我優(yōu)待并不是一種獨(dú)立的壟斷行為,而是多種壟斷行為的合稱。在不同的語境當(dāng)中,包括搜索操控、顯著展示、預(yù)裝,甚至縱向并購、捆綁銷售等行為都曾被納入自我優(yōu)待的范疇。
具體到生成式AI競爭的數(shù)據(jù)層面,其涉及的自我優(yōu)待問題主要集中在“數(shù)據(jù)抓取”(data scraping)上。具體來說,很多AI模型的提供商本身也是平臺運(yùn)營商,為第三方商戶或開發(fā)者提供著服務(wù)。比如,微軟本身也運(yùn)營Azure云平臺;亞馬遜不僅運(yùn)營亞馬遜電商平臺,還運(yùn)營著亞馬遜云平臺;Meta運(yùn)營的臉書等平臺也允許第三方應(yīng)用軟件的接入。在現(xiàn)實(shí)中,有不少第三方的商戶和開發(fā)者也都提供AI服務(wù),因而會和上述這些平臺運(yùn)營者構(gòu)成競爭關(guān)系。然而,由于它們的開發(fā)或運(yùn)營都需要經(jīng)過平臺,所以平臺運(yùn)營者很容易獲取它們的這些數(shù)據(jù)。在這種情況下,云服務(wù)商就會比這些第三方商戶和開發(fā)商擁有更多的信息和數(shù)據(jù)優(yōu)勢,從而讓自己在競爭中占據(jù)更為有利的位置。
3.算力層面的競爭問題
在生成式AI競爭的算力層面,最主要的競爭問題有兩個:一是拒絕交易,二是鎖定客戶。
(1)拒絕交易
在生成式AI市場上,很多中小規(guī)模的模型開發(fā)商都沒有能力自行購置足夠的算力資源。為了開發(fā)和訓(xùn)練模型,它們通常需要租用云資源。然而,一些云服務(wù)的提供商本身也是AI模型的開發(fā)者。出于排除潛在競爭對手的需要,它們就可能拒絕為某些模型開發(fā)者提供服務(wù)。由于云服務(wù)市場的結(jié)構(gòu)十分集中,因而如果開發(fā)者被幾家主要的服務(wù)提供商拒絕交易,它就可能很難以相對低廉的價(jià)格獲取所需的算力。
值得注意的是,在AI日益成為國家間競爭焦點(diǎn)的大背景下,拒絕提供算力也正在成為一種新型的貿(mào)易封鎖策略。比如,不久之前,美國政府就要求本國的云服務(wù)商停止向中國的AI企業(yè)提供算力服務(wù)。由于美國企業(yè)在云服務(wù),尤其是AI算力的供應(yīng)方面占據(jù)非常高的份額,因而這項(xiàng)禁令很可能會對中國中小型AI企業(yè)的研發(fā)產(chǎn)生顯著的負(fù)面影響。
(2)鎖定客戶
實(shí)踐中,一些提供AI算力的云服務(wù)商為了鎖定自己的客戶,會想方設(shè)法為其遷移設(shè)置各種障礙。首先,在技術(shù)層面,不少云服務(wù)商會故意限制與其他云服務(wù)商之間的互操作性。這樣,如果有客戶要從一家云服務(wù)商遷移到另一家,它們將會需要負(fù)擔(dān)很大的遷移成本。其次,在規(guī)則層面,一些云服務(wù)商會在服務(wù)合同中設(shè)置“退出費(fèi)”(egress fee)條款。這樣,如果有客戶要求終止服務(wù)合同,就可能需要支付一筆不菲的費(fèi)用。再次,云服務(wù)商還會嘗試用生態(tài)策略來對客戶進(jìn)行鎖定。具體來說,很多云服務(wù)商在提供算力供應(yīng)時,還會為客戶提供很多開發(fā)工具以及其他互補(bǔ)產(chǎn)品。這樣,如果客戶試圖進(jìn)行遷移,它就必須同時放棄對這些工具和產(chǎn)品的使用。在一定程度上,這也增加了它們的遷移成本。
四、相關(guān)政策探討
雖然生成式AI的發(fā)展會帶來很多新的創(chuàng)新機(jī)會,從而在相當(dāng)程度上促進(jìn)生產(chǎn)力的提升,但與此同時,它也會帶來很多新的競爭問題。那些在生成式AI的研發(fā)上取得先機(jī)的企業(yè)很可能會成為新的壟斷者,或者用它們在AI方面的優(yōu)勢進(jìn)一步鞏固其在其他市場上的優(yōu)勢。面對這樣的情況,為了維護(hù)生成式AI市場的持續(xù)穩(wěn)定發(fā)展,保證廣大開發(fā)者都有公平參與市場競爭、分享市場機(jī)遇的權(quán)利,就必須未雨綢繆,對這些問題提前做好準(zhǔn)備。具體來說,如下幾方面工作是值得重視的:
第一,應(yīng)加強(qiáng)和生成式AI相關(guān)的研究,為制定相關(guān)的政策提供理論基礎(chǔ)。
生成式AI是一種全新的技術(shù),在這個市場上,競爭表現(xiàn)出了很多新的方式。究竟這些新的競爭方式會帶來怎樣的后果,又會對市場的競爭秩序和運(yùn)行效率產(chǎn)生怎樣的影響,目前人們還所知甚少。在這種情況下,如果貿(mào)然用過去的監(jiān)管思路去對這個市場進(jìn)行管理,可能不僅無益于改善市場秩序,還可能影響該市場的正常運(yùn)行。因此,為了讓相關(guān)政策可以做到有的放矢,就必須先做好調(diào)查研究工作,切實(shí)摸清楚市場的特點(diǎn)。
鑒于目前歐美等國在生成式AI方面的產(chǎn)業(yè)實(shí)踐要比我國更為成熟,在規(guī)制生成式AI的競爭方面也比我國有更多的實(shí)踐,我們應(yīng)當(dāng)本著“他山之石,可以攻玉”的態(tài)度,對這些國家和地區(qū)的經(jīng)驗(yàn)和教訓(xùn)做好學(xué)習(xí)。尤其是對這些國家和地區(qū)的相關(guān)立法,以及典型案例,應(yīng)該切實(shí)消化吸收。
第二,應(yīng)當(dāng)用好政策手段幫助創(chuàng)造更好的競爭環(huán)境,限制生成式AI市場上壟斷格局的形成。
生成式AI公司的市場力量可能來自模型、數(shù)據(jù)和算力,因此為了限制這些市場上形成壟斷的格局,應(yīng)從這三個角度出發(fā),營建更好的競爭環(huán)境。具體來說:(i)在模型層面,應(yīng)當(dāng)加強(qiáng)開源模型的應(yīng)用。與閉源模型相比,使用開源模型的AI公司通常更難形成市場力量。因而,出于促進(jìn)市場競爭的考慮,應(yīng)當(dāng)對開源模型予以推廣,鼓勵開源生態(tài)的建設(shè)。(ii)在數(shù)據(jù)層面,應(yīng)當(dāng)保證數(shù)據(jù)獲取與使用的公平性。在市場上,一些AI公司的市場力量并非來自其模型,而是來自于其對數(shù)據(jù)源的壟斷。因此,為了促進(jìn)市場的競爭,就需要打破數(shù)據(jù)壟斷,推進(jìn)不同企業(yè)之間的互操作和數(shù)據(jù)可攜帶,讓更多企業(yè)可以以相對低的成本共享優(yōu)質(zhì)的數(shù)據(jù)源。(iii)在算力層面,應(yīng)當(dāng)加強(qiáng)對云服務(wù)商的規(guī)范。對于云計(jì)算領(lǐng)域存在的違法行為,應(yīng)當(dāng)積極予以糾正,以此確保所有的AI開發(fā)企業(yè),尤其是中小AI企業(yè)可以公平地獲得所需要的算力資源。
第三,應(yīng)當(dāng)綜合用好各種規(guī)制手段,對生成式AI市場上的競爭問題予以應(yīng)對。
在應(yīng)對競爭問題時,我們有很多不同的工具可以選擇。這些工具包括反壟斷、行業(yè)管制,以及像市場調(diào)查等一些新型的規(guī)制工具。對于生成式AI領(lǐng)域遇到的各種不同問題,應(yīng)當(dāng)根據(jù)其性質(zhì)的不同,對這些不同的工具選擇性地加以使用。
應(yīng)當(dāng)看到,各種規(guī)制工具在性質(zhì)上存在著很大的差異。例如,作為一種事后規(guī)制手段,反壟斷更側(cè)重于在競爭問題發(fā)生之后對其進(jìn)行糾正。由于在反壟斷介入時,問題已經(jīng)發(fā)生,因而用它來糾正競爭問題可以較好地回避將合法行為誤判為非法的情況。相比之下,行業(yè)管制則是事前的規(guī)制手段。為了規(guī)避某些問題的產(chǎn)生,有關(guān)部門會事先制定規(guī)則,對可能產(chǎn)生問題的行為予以禁止。這雖然可以在理論上做到防患于未然,但同時也可能對企業(yè)的競爭和創(chuàng)新行為產(chǎn)生過多的限制,從而阻礙行業(yè)的發(fā)展。容易看到,無論是反壟斷還是管制,抑或其他的規(guī)制工具,在實(shí)踐當(dāng)中都存在著各自的利弊。因此,對于生成式AI領(lǐng)域的各種競爭問題,究竟應(yīng)當(dāng)選擇哪種工具加以應(yīng)對,還應(yīng)當(dāng)實(shí)事求是地根據(jù)具體問題具體地進(jìn)行選擇。
第四,應(yīng)當(dāng)加強(qiáng)相關(guān)企業(yè)的自我審查和合規(guī)整改,鼓勵社會監(jiān)督。
限于相關(guān)資源和相關(guān)知識的不足,監(jiān)管機(jī)構(gòu)很難對生成式AI領(lǐng)域的所有競爭問題都做到及時發(fā)現(xiàn)、及時處理。在這種情況下,呼吁企業(yè)自身對其競爭行為進(jìn)行審查和合規(guī)就變得十分重要。應(yīng)當(dāng)積極發(fā)揮企業(yè)以及行業(yè)協(xié)會的作用,制定生成式AI領(lǐng)域的競爭規(guī)范,并號召行業(yè)中的所有企業(yè)都自覺對其進(jìn)行遵守。對于競爭中出現(xiàn)的各種問題,企業(yè)應(yīng)積極做好自糾、互糾。除此之外,也應(yīng)該鼓勵廣大的AI應(yīng)用者加入到監(jiān)督的行列當(dāng)中,充分發(fā)揮社會力量對AI公司的監(jiān)督。
第五,應(yīng)當(dāng)建立監(jiān)管沙盒,鼓勵企業(yè)對新商業(yè)模式進(jìn)行創(chuàng)新。
在生成式AI領(lǐng)域,很多競爭問題都是伴隨著創(chuàng)新產(chǎn)生的。這些創(chuàng)新及其所伴生的問題究竟會帶來怎樣的收益和成本,在事先通常很難確知。針對這一情況,應(yīng)當(dāng)考慮建立監(jiān)管沙盒,讓企業(yè)在一定范圍、一定規(guī)則之下開展創(chuàng)新試驗(yàn),并對其后果及時進(jìn)行評估。在此基礎(chǔ)之上,再確認(rèn)是否對創(chuàng)新進(jìn)行認(rèn)可,以及用怎樣的工具對創(chuàng)新進(jìn)行規(guī)范。
第六,應(yīng)當(dāng)積極開展國際合作,與國際同行一起探索對生成式AI的規(guī)制思路。
生成式AI技術(shù)帶來的革命是世界性的,生成式AI公司之間的競爭也是在全球范圍內(nèi)展開的,由此產(chǎn)生的問題也是全球性的。在這種情況下,中國應(yīng)該與世界各國加強(qiáng)合作,交流、溝通這一領(lǐng)域的規(guī)制經(jīng)驗(yàn),分享相關(guān)的信息。在此基礎(chǔ)上,共同制定國際標(biāo)準(zhǔn)和規(guī)范,推動全球范圍內(nèi)生成式AI的公平競爭。
總而言之,雖然生成式AI會帶來很多新的競爭問題,但只要秉承實(shí)事求是的態(tài)度,用好政策對其發(fā)展做好引導(dǎo),就一定可以揚(yáng)長避短,讓我們享受這項(xiàng)技術(shù)帶來的各種好處時盡可能減少隨之產(chǎn)生的負(fù)面影響。
The "Triple Competition" and Competition Problems of Generative AI
Abstract: As a new technology, the rise of generative AI has brought many new opportunities as well as many new problems. Specifically in the field of competition, generative AI not only brings new sources of market power, but also spawns many new monopolistic behaviors. To address these issues, it is necessary to have a full understanding of the competitive laws of the generative AI market. This article first summarizes the competitive essence of generative AI, pointing out that the competition in this market is actually a "triple competition" around models, data, and computing power. On this basis, this article further analyzes how these three factors have brought market power to enterprises and what competitive problems they may bring. Finally, this article also proposes some feasible ideas on how to deal with the problems caused by generative AI.
Keywords: Generative AI; Model; Data; Computing Power