強(qiáng)人工智能崛起引發(fā)新一輪AI備戰(zhàn)升級

2023-05-30 18:17:59陳徐毅

中關(guān)村 2023年3期

陳徐毅

在優(yōu)勢與挑戰(zhàn)并存的同時，未來強(qiáng)人工智能技術(shù)走向?qū)⒏吤骼?，相信更多AI產(chǎn)品將在新的消費(fèi)級領(lǐng)域涌現(xiàn)。

2022年11月，人工智能對話機(jī)器人程序ChatGPT面世引起了外界廣泛關(guān)注，因其遠(yuǎn)高于比過去同品程序的文本反饋能力以及在理解人類提問上的優(yōu)異表現(xiàn)，業(yè)界將之視為當(dāng)前強(qiáng)人工智能的代表作。不到兩個月里，ChatGPT用戶數(shù)激增過億，成為史上增長速度最快的消費(fèi)級應(yīng)用程序。這也是繼AlphaGo問世之后出現(xiàn)的第二次強(qiáng)人工智能熱潮。

ChatGPT的亮眼表現(xiàn)也牽動了行業(yè)科技巨頭紛紛入局，并引發(fā)新一輪的AI備戰(zhàn)升級。由于谷歌搜索業(yè)務(wù)被認(rèn)為受ChatGPT影響最深，谷歌公司迫于壓力倉促推出其競品Bard（一款基于LaMDA語言模型的AI對話程序），卻因其首秀意外“翻車”而導(dǎo)致股價(jià)大跌。與ChatGPT研發(fā)機(jī)構(gòu)OpenAI早有投資關(guān)系的微軟則繼續(xù)跟進(jìn)擴(kuò)大投資，并高調(diào)宣布旗下搜索Bing引入ChatGPT。而國內(nèi)的百度、阿里也傳出正在研發(fā)類ChatGPT的項(xiàng)目，網(wǎng)易、科大訊飛、360等也在相關(guān)領(lǐng)域布局涉足類ChatGPT業(yè)務(wù)。

ChatGPT的由來

ChatGPT是由人工智能實(shí)驗(yàn)室OpenAI開發(fā)的一款人工智能對話工具，作為深度學(xué)習(xí)的產(chǎn)物，該程序基于GPT-3架構(gòu)的自回歸語言模型進(jìn)行強(qiáng)化巨量的文本學(xué)習(xí)訓(xùn)練。由于是聊天機(jī)器人的產(chǎn)品形態(tài)，ChatGPT仍以文本交互方式與終端使用者進(jìn)行自然對話，但其功能遠(yuǎn)比此前的一般聊天智能助理強(qiáng)大，能夠生成自動文本，應(yīng)對復(fù)雜的文字工作，自動問答、生成和調(diào)試編程語言等等，應(yīng)用廣泛。

人工智能實(shí)驗(yàn)室OpenAI成立于2015年，是一個目前由非營利向盈利過渡的商業(yè)組織，其創(chuàng)始人埃隆·馬斯克和山姆·阿爾特曼創(chuàng)辦動機(jī)是出于對強(qiáng)人工智能潛在風(fēng)險(xiǎn)的擔(dān)憂。2016年OpenAI發(fā)布了機(jī)器學(xué)習(xí)公測平臺，此后每年花費(fèi)高昂資金用于訓(xùn)練，直至ChatGPT發(fā)布。

發(fā)布之初，ChatGPT的表現(xiàn)雖然亮眼但并非臻于完美，經(jīng)使用者大量測試發(fā)現(xiàn)，一些專業(yè)領(lǐng)域知識給出的反饋仍存在事實(shí)準(zhǔn)確性參差不齊的缺陷，其模型訓(xùn)練結(jié)果被認(rèn)為需要進(jìn)一步校正。

強(qiáng)人工智能應(yīng)用興起與現(xiàn)狀

這些年，人工智能領(lǐng)域的分支以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu)的深度學(xué)習(xí)發(fā)展迅速，這主要得益于全球云計(jì)算市場膨脹、基礎(chǔ)設(shè)施數(shù)量逐年擴(kuò)大帶來的算力資源總量的快速上升。深度學(xué)習(xí)有賴于并行分布式計(jì)算，而并行計(jì)算的技術(shù)路線是人工智能領(lǐng)域近十年來得以突破瓶頸和超越以往技術(shù)形態(tài)的業(yè)界共識。

在此共識之下的成果，ChatGPT這類文本應(yīng)用只是其中之一，這兩年還有AI繪畫、AI音樂，甚至AI 3D建模的出現(xiàn)，無不意味著有著推理和解決問題能力的強(qiáng)人工智能技術(shù)形態(tài)初現(xiàn)端倪。

比如2022年8月發(fā)布的文本生成圖像模型Stable Diffusion，它根據(jù)用戶給出的文字描述生成相應(yīng)的圖像，也可以用于繪制和修補(bǔ)圖像。Stable Diffusion在一個公開的數(shù)據(jù)集LAION-5B上訓(xùn)練模型，而LAION-5B至少包含了50億個圖像—文本數(shù)據(jù)對。除此之外，還有Disco Diffusion、Midjourney等AI繪畫工具也與之類似。

再比如可以從文本描述中生成高保真音樂的模型MusicLM。例如用戶輸入“一段吉他即興演奏搭配平靜的小提琴旋律”，MusicLM會將文本描述條件按過程和層次建立序列并建模任務(wù)，最終生成可長達(dá)幾分鐘的24kHz音頻文件。還有同樣出彩的AI 3D建模方面，但因過程復(fù)雜目前暫未出現(xiàn)以文字生成樣本的產(chǎn)品。

這些強(qiáng)人工智能工具由于訓(xùn)練所用模型依賴海量互聯(lián)網(wǎng)已有數(shù)據(jù)，也面臨著著作權(quán)爭議和道德倫理方面的負(fù)面影響。由AI侵權(quán)引發(fā)的版權(quán)訴訟案件正在逐年增加，不久前代碼自動生成工具Copilot侵權(quán)案尚未落定，ChatGPT在教育界又引起論文作弊與學(xué)術(shù)道德的爭議。

強(qiáng)人工智能產(chǎn)品市場格局和未來走向

業(yè)界在經(jīng)歷疫情蕭條期和元宇宙概念虛火之后，這種新形態(tài)的強(qiáng)人工智能產(chǎn)品落地確實(shí)給了市場一針強(qiáng)心，特別是2023年以來，人工智能概念板塊普遍景氣揚(yáng)升。新的AI項(xiàng)目研發(fā)落地吸引著科技巨頭們紛紛入場布局，由于強(qiáng)人工智能項(xiàng)目研發(fā)所需投入的模型訓(xùn)練經(jīng)費(fèi)高昂，它們也急需盡快獲得大型科技公司的融資和算力資源的支持。比如2017年OpenAI僅在云計(jì)算資源上就花費(fèi)790萬美元，占其總支出的四分之一；而AI繪圖Stable Diffusion在亞馬遜云計(jì)算平臺上訓(xùn)練共15萬個GPU小時，花費(fèi)成本60萬美元。

由于新的AI產(chǎn)品落地時間不長，強(qiáng)人工智能市場仍在初期形成當(dāng)中，這一波由Copilot和ChatGPT兩種新的AI產(chǎn)品形態(tài)帶起的風(fēng)口，在當(dāng)前市場格局中走在最前面的仍然是微軟。微軟于2019年7月率先投資OpenAI 10億美元，為之提供Azure云的計(jì)算訓(xùn)練資源，后續(xù)取得該技術(shù)的獨(dú)家授權(quán)。2023年初微軟跟進(jìn)投資第二筆據(jù)報(bào)道為100億美元資金，隨后旋即宣布旗下Bing搜索引入ChatGPT，強(qiáng)調(diào)集成了AI的瀏覽器Edge+搜索Bing的全新產(chǎn)品矩陣，旨在對谷歌互聯(lián)網(wǎng)業(yè)務(wù)的彎道超車。

由此可見，當(dāng)前強(qiáng)人工智能技術(shù)初級形態(tài)以及其所代表的種種落地產(chǎn)品，與上一代人工智能技術(shù)相較確實(shí)令該領(lǐng)域的發(fā)展耳目一新，但也存在明顯需要校正的算法缺陷，以及在涉及訓(xùn)練源的版權(quán)、學(xué)術(shù)道德、網(wǎng)絡(luò)安全等方面的批評與風(fēng)險(xiǎn)。在優(yōu)勢與挑戰(zhàn)并存的同時，未來強(qiáng)人工智能技術(shù)走向?qū)⒏吤骼?，相信更多AI產(chǎn)品將在新的消費(fèi)級領(lǐng)域涌現(xiàn)。