陳徐毅
在優(yōu)勢與挑戰(zhàn)并存的同時,未來強(qiáng)人工智能技術(shù)走向?qū)⒏吤骼?,相信更多AI產(chǎn)品將在新的消費(fèi)級領(lǐng)域涌現(xiàn)。
2022年11月,人工智能對話機(jī)器人程序ChatGPT面世引起了外界廣泛關(guān)注,因其遠(yuǎn)高于比過去同品程序的文本反饋能力以及在理解人類提問上的優(yōu)異表現(xiàn),業(yè)界將之視為當(dāng)前強(qiáng)人工智能的代表作。不到兩個月里,ChatGPT用戶數(shù)激增過億,成為史上增長速度最快的消費(fèi)級應(yīng)用程序。這也是繼AlphaGo問世之后出現(xiàn)的第二次強(qiáng)人工智能熱潮。
ChatGPT的亮眼表現(xiàn)也牽動了行業(yè)科技巨頭紛紛入局,并引發(fā)新一輪的AI備戰(zhàn)升級。由于谷歌搜索業(yè)務(wù)被認(rèn)為受ChatGPT影響最深,谷歌公司迫于壓力倉促推出其競品Bard(一款基于LaMDA語言模型的AI對話程序),卻因其首秀意外“翻車”而導(dǎo)致股價(jià)大跌。與ChatGPT研發(fā)機(jī)構(gòu)OpenAI早有投資關(guān)系的微軟則繼續(xù)跟進(jìn)擴(kuò)大投資,并高調(diào)宣布旗下搜索Bing引入ChatGPT。而國內(nèi)的百度、阿里也傳出正在研發(fā)類ChatGPT的項(xiàng)目,網(wǎng)易、科大訊飛、360等也在相關(guān)領(lǐng)域布局涉足類ChatGPT業(yè)務(wù)。
ChatGPT的由來
ChatGPT是由人工智能實(shí)驗(yàn)室OpenAI開發(fā)的一款人工智能對話工具,作為深度學(xué)習(xí)的產(chǎn)物,該程序基于GPT-3架構(gòu)的自回歸語言模型進(jìn)行強(qiáng)化巨量的文本學(xué)習(xí)訓(xùn)練。由于是聊天機(jī)器人的產(chǎn)品形態(tài),ChatGPT仍以文本交互方式與終端使用者進(jìn)行自然對話,但其功能遠(yuǎn)比此前的一般聊天智能助理強(qiáng)大,能夠生成自動文本,應(yīng)對復(fù)雜的文字工作,自動問答、生成和調(diào)試編程語言等等,應(yīng)用廣泛。
人工智能實(shí)驗(yàn)室OpenAI成立于2015年,是一個目前由非營利向盈利過渡的商業(yè)組織,其創(chuàng)始人埃隆·馬斯克和山姆·阿爾特曼創(chuàng)辦動機(jī)是出于對強(qiáng)人工智能潛在風(fēng)險(xiǎn)的擔(dān)憂。2016年OpenAI發(fā)布了機(jī)器學(xué)習(xí)公測平臺,此后每年花費(fèi)高昂資金用于訓(xùn)練,直至ChatGPT發(fā)布。
發(fā)布之初,ChatGPT的表現(xiàn)雖然亮眼但并非臻于完美,經(jīng)使用者大量測試發(fā)現(xiàn),一些專業(yè)領(lǐng)域知識給出的反饋仍存在事實(shí)準(zhǔn)確性參差不齊的缺陷,其模型訓(xùn)練結(jié)果被認(rèn)為需要進(jìn)一步校正。
強(qiáng)人工智能應(yīng)用興起與現(xiàn)狀
這些年,人工智能領(lǐng)域的分支以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu)的深度學(xué)習(xí)發(fā)展迅速,這主要得益于全球云計(jì)算市場膨脹、基礎(chǔ)設(shè)施數(shù)量逐年擴(kuò)大帶來的算力資源總量的快速上升。深度學(xué)習(xí)有賴于并行分布式計(jì)算,而并行計(jì)算的技術(shù)路線是人工智能領(lǐng)域近十年來得以突破瓶頸和超越以往技術(shù)形態(tài)的業(yè)界共識。
在此共識之下的成果,ChatGPT這類文本應(yīng)用只是其中之一,這兩年還有AI繪畫、AI音樂,甚至AI 3D建模的出現(xiàn),無不意味著有著推理和解決問題能力的強(qiáng)人工智能技術(shù)形態(tài)初現(xiàn)端倪。
比如2022年8月發(fā)布的文本生成圖像模型Stable Diffusion,它根據(jù)用戶給出的文字描述生成相應(yīng)的圖像,也可以用于繪制和修補(bǔ)圖像。Stable Diffusion在一個公開的數(shù)據(jù)集LAION-5B上訓(xùn)練模型,而LAION-5B至少包含了50億個圖像—文本數(shù)據(jù)對。除此之外,還有Disco Diffusion、Midjourney等AI繪畫工具也與之類似。
再比如可以從文本描述中生成高保真音樂的模型MusicLM。例如用戶輸入“一段吉他即興演奏搭配平靜的小提琴旋律”,MusicLM會將文本描述條件按過程和層次建立序列并建模任務(wù),最終生成可長達(dá)幾分鐘的24kHz音頻文件。還有同樣出彩的AI 3D建模方面,但因過程復(fù)雜目前暫未出現(xiàn)以文字生成樣本的產(chǎn)品。
這些強(qiáng)人工智能工具由于訓(xùn)練所用模型依賴海量互聯(lián)網(wǎng)已有數(shù)據(jù),也面臨著著作權(quán)爭議和道德倫理方面的負(fù)面影響。由AI侵權(quán)引發(fā)的版權(quán)訴訟案件正在逐年增加,不久前代碼自動生成工具Copilot侵權(quán)案尚未落定,ChatGPT在教育界又引起論文作弊與學(xué)術(shù)道德的爭議。
強(qiáng)人工智能產(chǎn)品市場格局和未來走向
業(yè)界在經(jīng)歷疫情蕭條期和元宇宙概念虛火之后,這種新形態(tài)的強(qiáng)人工智能產(chǎn)品落地確實(shí)給了市場一針強(qiáng)心,特別是2023年以來,人工智能概念板塊普遍景氣揚(yáng)升。新的AI項(xiàng)目研發(fā)落地吸引著科技巨頭們紛紛入場布局,由于強(qiáng)人工智能項(xiàng)目研發(fā)所需投入的模型訓(xùn)練經(jīng)費(fèi)高昂,它們也急需盡快獲得大型科技公司的融資和算力資源的支持。比如2017年OpenAI僅在云計(jì)算資源上就花費(fèi)790萬美元,占其總支出的四分之一;而AI繪圖Stable Diffusion在亞馬遜云計(jì)算平臺上訓(xùn)練共15萬個GPU小時,花費(fèi)成本60萬美元。
由于新的AI產(chǎn)品落地時間不長,強(qiáng)人工智能市場仍在初期形成當(dāng)中,這一波由Copilot和ChatGPT兩種新的AI產(chǎn)品形態(tài)帶起的風(fēng)口,在當(dāng)前市場格局中走在最前面的仍然是微軟。微軟于2019年7月率先投資OpenAI 10億美元,為之提供Azure云的計(jì)算訓(xùn)練資源,后續(xù)取得該技術(shù)的獨(dú)家授權(quán)。2023年初微軟跟進(jìn)投資第二筆據(jù)報(bào)道為100億美元資金,隨后旋即宣布旗下Bing搜索引入ChatGPT,強(qiáng)調(diào)集成了AI的瀏覽器Edge+搜索Bing的全新產(chǎn)品矩陣,旨在對谷歌互聯(lián)網(wǎng)業(yè)務(wù)的彎道超車。
由此可見,當(dāng)前強(qiáng)人工智能技術(shù)初級形態(tài)以及其所代表的種種落地產(chǎn)品,與上一代人工智能技術(shù)相較確實(shí)令該領(lǐng)域的發(fā)展耳目一新,但也存在明顯需要校正的算法缺陷,以及在涉及訓(xùn)練源的版權(quán)、學(xué)術(shù)道德、網(wǎng)絡(luò)安全等方面的批評與風(fēng)險(xiǎn)。在優(yōu)勢與挑戰(zhàn)并存的同時,未來強(qiáng)人工智能技術(shù)走向?qū)⒏吤骼?,相信更多AI產(chǎn)品將在新的消費(fèi)級領(lǐng)域涌現(xiàn)。