克林
百舸爭流,奮楫者先
截至2023年5月底,國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型至少已經(jīng)公布了79個,此時距離ChatGPT在國內(nèi)“破圈”尚不足3個月。
時間來到8月,這股勢頭依然不減。15日,科大訊飛發(fā)布星火認知大模型V2.0版本,在代碼及多模態(tài)能力方面進行了重大升級;在14日的年度演講上,小米董事長雷軍宣布小愛同學已升級大模型,并開始邀請測試;3日,“神秘”的騰訊混元大模型也浮出水面,目前已進入公司內(nèi)應用測試階段……
“百模大戰(zhàn)”一觸即發(fā),國內(nèi)通用類、垂直類大模型呈現(xiàn)井噴之勢發(fā)展。IDC預測,2026年中國AI大模型市場規(guī)模將達到211億美元,人工智能將進入大規(guī)模落地應用關(guān)鍵期。
放眼全球,據(jù)統(tǒng)計今年上半年全球新發(fā)布的大模型已超過400個。麥肯錫的報告《生成式人工智能的經(jīng)濟潛力》中提到,在其研究的63種應用中使用生成式AI,將為全球經(jīng)濟帶來每年2.6萬億~4.4萬億美元的增長。
同時,由于通用大模型成本與技術(shù)門檻相對較高,國內(nèi)較多大模型選擇圍繞垂直行業(yè)進行開發(fā),模型參數(shù)量雖然不大,但是因為有一些行業(yè)的核心數(shù)據(jù)和業(yè)務系統(tǒng)的生產(chǎn)數(shù)據(jù)參與,所以在相應行業(yè)解決問題更為高效、直接,特別是在金融、教育、醫(yī)療等領(lǐng)域,已經(jīng)有不少公司發(fā)布了相應產(chǎn)品。整體生態(tài)呈現(xiàn)出“通用+垂直”模型互相融通的態(tài)勢。
千帆競發(fā),勇進者勝
今年6月,ChatGPT訪問量環(huán)比下滑9.7%,為其推出以來首次下滑。從全球范圍看,盡管不斷有企業(yè)或機構(gòu)發(fā)布或更新大模型,但媒體和公眾似乎不再像幾個月前那般“上頭”。
當大模型回歸理性,市場必然要經(jīng)歷一場大浪淘沙。關(guān)乎技術(shù),更關(guān)乎商業(yè)模式。
目前幾乎所有的大模型預訓練都基于Transformer架構(gòu),雖是“百模大戰(zhàn)”,但各家大模型之間同質(zhì)化嚴重,實質(zhì)性的創(chuàng)新相對較少。同時,訓練大模型所耗費的計算資源非常龐大,需要超級算力的支撐,很多公司沒有過往的研究履歷,發(fā)布的產(chǎn)品多是“套殼”或者接入其他研發(fā)機構(gòu)的模型,投機現(xiàn)象泛濫。
當下的大模型競爭早已超過了技術(shù)的范疇,更多是一種生態(tài)層面的比拼,具體表現(xiàn)在有多少應用、有多少插件、有多少開發(fā)者以及用戶等。如果沒有良好的可循環(huán)生態(tài),那么無論在模型的持續(xù)迭代,抑或是變現(xiàn)攤薄巨額研發(fā)成本方面,可以預見都會面臨重大困境,對于創(chuàng)業(yè)型公司來說更是如此。
考驗的核心就在于大模型的落地能力。
今年獲得世界人工智能大會最高獎項SAIL獎(卓越人工智能引領(lǐng)者獎)的論文《機器學習結(jié)合阻抗譜技術(shù)預測鋰電池老化》,該文作者、中山大學物理學院副教授張云蔚說,她只采集了2萬個電化學阻抗譜,就實現(xiàn)了AI精準建模。比起海量數(shù)據(jù),更重要的是思路。就是這樣一個小模型,將過去需要花費幾天才能實現(xiàn)的電池壽命預測縮短到了15分鐘,且檢測精度是原來的10倍。
越是面對如大模型落地這種復雜的問題,就越是要回歸更本質(zhì)的層面去思考,考驗的不僅是技術(shù)力,更重要的還是要落實在“服務”二字上,更高效、更便捷、更人性化將會是未來可持續(xù)探索的重要方向。
結(jié)語
1.受關(guān)注度或注意力這一綜合性指所反映的也是最綜合性的或整體性的。
2.真正的答案往往要向內(nèi)去尋找,這是更為根本的解決之道。
3.發(fā)展迅猛,未來的中國大模型100強即將出現(xiàn),敬請期待。