吳洋洋
ChatGPT變笨了嗎?
這個(gè)幾個(gè)月以來不斷在社交媒體上引發(fā)爭論的話題終于等來了學(xué)術(shù)分析。來自斯坦福大學(xué)與加州大學(xué)伯克利分校的研究團(tuán)隊(duì)比較了GPT模型在3月和6月對同一問題的回答,發(fā)現(xiàn)6月的GPT解決數(shù)學(xué)問題、生成代碼等方面的能力都有所下降。
對此的一種推測是嚴(yán)格的監(jiān)管措施損害了大模型的輸出質(zhì)量。7月14日,美國聯(lián)邦貿(mào)易委員會(FTC)向ChatGPT的所有者OpenAI發(fā)出了質(zhì)詢函,要求該公司對運(yùn)營中是否存在不公平或欺騙行為作出回應(yīng)。這是迄今為止AI技術(shù)公司在美國面臨的最強(qiáng)監(jiān)管。
對于模型訓(xùn)練和輸出內(nèi)容的各種“正確”要求會影響ChatGPT的表現(xiàn)—太聽話的孩子都會顯得缺乏創(chuàng)造力,更何況大語言模型(Large LanguageModels, LLMs)。不過從時(shí)間上看,4月至5月已經(jīng)有用戶反映GPT“變笨”,而當(dāng)時(shí)OpenAI 與美國政府還處于蜜月期,監(jiān)管至少不是其性能下降的唯一原因。
另一種更合理的推測是OpenAI主動(dòng)降低了GPT的性能。OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)在6月初就說過,為大模型提供算力的GPU極度短缺,“少一些人使用Chat GPT會更好”。而方正證券剛剛發(fā)布的《OpenAI的盈虧分析》報(bào)告就提供了佐證:如果GPT-3.5的精度下降為原來的95.7%,成本大約下降25%。當(dāng)然,OpenAI對主動(dòng)降低性能的猜測矢口否認(rèn),只表示會進(jìn)一步研究GP T可能變笨的原因。
作為開啟AI新紀(jì)元的產(chǎn)品,ChatGP T的變化或多或少也反映著智能領(lǐng)域發(fā)生的改變—人工智能與大眾的蜜月期已經(jīng)結(jié)束了。政府不會再睜一只眼閉一只眼地任由AI技術(shù)公司野蠻生長,新鮮感退去的消費(fèi)者也開始用挑剔的眼光來判斷它是否值得占用一筆額外支出。
而監(jiān)管與算力緊缺,這兩大導(dǎo)致ChatGPT變笨的難題,也在影響著每一家AI技術(shù)公司。
從監(jiān)管上看,在意識到生成式AI的潛力后,全球都加快推出了法律法規(guī)。這對于創(chuàng)業(yè)公司的影響要遠(yuǎn)大于對技術(shù)巨頭,畢竟有著資金優(yōu)勢和先發(fā)優(yōu)勢的技術(shù)巨頭能夠更好地消化上漲的合規(guī)成本。
7月21日,白宮宣布,政府已經(jīng)與7家AI技術(shù)公司達(dá)成自愿協(xié)議,這些公司承諾會“保持強(qiáng)有力的安全措施”。這7家公司分別是亞馬遜、Google、Meta、Inf lection、Anthropic、微軟和OpenAI,它們要么本身是技術(shù)巨頭,要么背后的主要投資人是技術(shù)巨頭,大模型的“大”對應(yīng)著大公司的“大”。
與美國政府優(yōu)先選擇和技術(shù)巨頭達(dá)成自愿協(xié)議的方式不同,中國政府的監(jiān)管更加積極主動(dòng)。7月13日,網(wǎng)信辦等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》),要求技術(shù)公司為生成式AI算法備案,并保證AI生成的內(nèi)容“透明”“可靠”,不能是“虛假有害”的。生成式AI應(yīng)該做什么、不能做什么,《暫行辦法》基本把這個(gè)要求說清楚了,但依然沒有提及開放生成式AI商業(yè)化的議題。
從另一大難題—算力緊缺的角度看,短期內(nèi)它依然是套在AI技術(shù)公司頭上的緊箍咒,不過長期來看,供需關(guān)系會回歸平 衡。
6月21日,英特爾宣布將分拆芯片制造業(yè)務(wù)。在過去三十多年里,英特爾一直奉行垂直整合策略,包攬了從芯片設(shè)計(jì)、制造到銷售的所有工作。它擁有優(yōu)秀的芯片制造能力,但只制造自己設(shè)計(jì)的芯片。
拆分后的英特爾芯片制造部門會將產(chǎn)能開放,這意味著除了臺積電與三星電子,英偉達(dá)、AMD這樣的芯片設(shè)計(jì)公司將迎來第三個(gè)具備制造高性能AI芯片能力的合作對象。不僅如此,英特爾與三星電子幾乎同時(shí)公布了擴(kuò)充產(chǎn)能的計(jì)劃,長期來看,算力供給會越來越充裕。
然而對于中國公司來說,算力風(fēng)險(xiǎn)可能會是一個(gè)長期難題。6月底《華爾街日報(bào)》稱,拜登政府考慮對出口中國的AI芯片實(shí)施更嚴(yán)格的限制措施:向中國客戶直接出口芯片必須經(jīng)審批通過;同時(shí)禁止以云服務(wù)的方式向中國AI公司提供算力。這兩項(xiàng)措施如若實(shí)施,將幾乎杜絕中國公司獲取高性能算力的方法。
作為回應(yīng),7月3日,中國商務(wù)部、海關(guān)總署宣布,對鎵、鍺兩種制造半導(dǎo)體最重要的材料實(shí)施出口管制,中國出口的鎵鍺目前占據(jù)全球鎵鍺出口量的80%。緊接著7月17日,美國半導(dǎo)體行業(yè)協(xié)會(SIA)在官網(wǎng)對美國可能采取的限制措施發(fā)表聲明稱,“白宮反復(fù)采取過于廣泛、模糊不清、有時(shí)是單方面的限制措施,可能會削弱美國半導(dǎo)體行業(yè)的競爭力,破壞供應(yīng)鏈,引發(fā)重大市場不確定性。”
既不確定政策何時(shí)允許生成式AI開放商用,又面臨著芯片供應(yīng)隨時(shí)可能中斷,但中國技術(shù)公司在兩難中并沒有停下腳步。在7月8日結(jié)束的2023世界人工智能大會(WAIC)上,阿里巴巴、華為、騰訊、百度等大公司都設(shè)臺展示了它們的“大模型”,總計(jì)超過30款。
在上海世博中心的會場里,幾乎每家公司都在強(qiáng)調(diào)自家模型可以服務(wù)不同行業(yè)的企業(yè)客戶,最常聽到的詞是金融、傳媒、政府、零售等等,但很少聽到哪家公司談及如何讓大模型服務(wù)個(gè)人用戶。
要讓個(gè)人用戶買單很難,至少ChatGPT的情況是這樣的。App分析平臺data.ai的數(shù)據(jù)顯示,ChatGPT iOS版App上線后第一個(gè)月,每日新增付費(fèi)用戶只有1500人左右(20美元/月),月活付費(fèi)率(月付費(fèi)用戶數(shù)÷月活躍用戶數(shù))約1.6%。相比之下,Spotify、Slack、Evernote 3款產(chǎn)品的付費(fèi)率分別為46%、30%、4%。即使考慮到部分用戶選擇通過網(wǎng)頁渠道付費(fèi)而未被計(jì)入該統(tǒng)計(jì),ChatGPT的數(shù)字依然不算樂觀。
不過,作為全球最大的企業(yè)軟件公司,微軟在銷售生成式AI產(chǎn)品方面看上去很有信心。7月18日,微軟在Inspire大會上宣布,公司將優(yōu)先為企業(yè)客戶提供Microsoft 365 Copilot服務(wù),定價(jià)為每月30美元。這個(gè)價(jià)格昂貴得超出大部分人的預(yù)料,要知道相較于Microsoft 365(曾用名Office 365,包含Word、Excel、PowerPoint、Outlook、Teams等辦公軟件)商業(yè)標(biāo)準(zhǔn)版每月12.5美元的價(jià)格,含有Copilot(生成式AI助手)功能的完全體總價(jià)接近原先的3倍。
不過對于企業(yè)來說,Copilot哪怕只提高個(gè)位數(shù)的效率都是劃算的,畢竟雇用一個(gè)月薪2萬元員工的開銷足以買100套生成式AI助手。微軟在宣布定價(jià)一周前與畢馬威(KPMG)達(dá)成了一項(xiàng)協(xié)議,畢馬威將在未來5年花費(fèi)總共20億美元采購微軟的人工智能與云計(jì)算服務(wù),這家會計(jì)師事務(wù)所預(yù)期這筆投資將創(chuàng)造120億美元的回報(bào)。按照其2022年的營收測算,相當(dāng)于這批“AI員工”要承擔(dān)每年7%的新增業(yè)績。
相比于微軟在生成式AI商業(yè)化上的一系列進(jìn)展,OpenAI的商業(yè)化卻困難連連,不僅付費(fèi)率不樂觀,用戶數(shù)也面臨增長瓶頸。數(shù)據(jù)統(tǒng)計(jì)網(wǎng)站Similarweb稱,ChatGPT的網(wǎng)站訪問量和應(yīng)用軟件下載次數(shù)在6月首次出現(xiàn)下降。
隨著雙方關(guān)系逐漸發(fā)生微妙變化,微軟與OpenAI的蜜月期也將結(jié)束。
OpenAI首席執(zhí)行官山姆·奧特曼多次提到ChatGPT要做“超級助手”,這無疑讓人聯(lián)想到微軟反復(fù)宣傳的概念“Copilot”—智能副駕,其實(shí)就是超級助手的另一種說法。并且OpenAI說到做到,繼6月推出“函數(shù)調(diào)用”功能后,7月它又推出了“自定義指令”功能。前者讓ChatGPT能夠連接到模型以外的軟件或數(shù)據(jù),從而在回答特定問題時(shí)給出更準(zhǔn)確的答案;后者讓用戶控制ChatGPT回復(fù)內(nèi)容的風(fēng)格,提升了個(gè)性化能力。
微軟自然也不會把雞蛋全放在OpenAI這一個(gè)籃子里。在7月18日的Inspire大會上,微軟還宣布了與Meta的合作,將其開發(fā)的Llama 2新模型添加進(jìn)Azure云服務(wù)的AI模型目錄中,為想要調(diào)用大模型的客戶提供GPT之外的另一種選擇。Llama 2是Meta開發(fā)的第二代大語言模型,Meta稱其性能只略微遜色于GPT-4與PaLM 2(它們分別是OpenAI與Google最先進(jìn)的大模型),關(guān)鍵是這款模型可免費(fèi)商用。
除了貌合神離的老面孔,智能領(lǐng)域7月也有重量級新玩家入 場。
7月12日,馬斯克宣布成立一家新的人工智能公司—xAI。他召集了一群有數(shù)學(xué)背景的人工智能科學(xué)家,立志要做一個(gè)幫助人類破解數(shù)學(xué)、物理學(xué)等學(xué)科復(fù)雜問題的通用人工智能。馬斯克表示團(tuán)隊(duì)會保持著一個(gè)較小的規(guī)模,更接近是一個(gè)研究機(jī)構(gòu)。
7月19日,彭博社報(bào)道稱,蘋果2022年起就在秘密研發(fā)聊天機(jī)器人AppleGPT,團(tuán)隊(duì)管理者直接向CEO庫克匯報(bào)。等到蘋果真正推出這款應(yīng)用,在iPhone里陪伴用戶多年但只會預(yù)報(bào)天氣的Siri將成為名副其實(shí)的智能助 理。
蜜月期里,即使ChatGPT回復(fù)笨答案,用戶依然會盲目喜歡它。但蜜月期結(jié)束后,一切逐漸回歸基本的商業(yè)邏輯,AI技術(shù)公司需要游走在政府、用戶、競爭對手與合作伙伴之間尋找各方利益的平衡點(diǎn)。沒有什么關(guān)系是牢不可破的,哪怕是微軟與OpenAI。
附:以下是2023年7月人工智能領(lǐng)域在監(jiān)管、模型與芯片等方面重要進(jìn)展的新聞詳情。
01. 國內(nèi)監(jiān)管的一只靴子落地:《生成式人工智能服務(wù)管理暫行辦法》發(fā)布
7月13日,國家網(wǎng)信辦、國家發(fā)改委、教育部、科技部、工信部、公安部與廣電總局等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》),首次對生成式AI的研發(fā)及服務(wù)作出明確規(guī)定。相較于4月的《生成式人工智能服務(wù)管理辦法(征求意見稿)》,正式版《暫行辦法》首次明確了對生成式AI監(jiān)管的辯證原則,要求“發(fā)展和安全并重、促進(jìn)創(chuàng)新和依法治理相結(jié)合”,以及實(shí)行”包容審慎和分類分級監(jiān)管”。該《暫行辦法》將于8月15日起施行。
02. 美國聯(lián)邦貿(mào)易委員會:首次正式調(diào)查OpenAI
7月14日,美國聯(lián)邦貿(mào)易委員會(FTC)向OpenAI發(fā)出了一份長達(dá)20頁的質(zhì)詢函,提出了包括模型訓(xùn)練、隱私和提示詞風(fēng)險(xiǎn)、API 插件、個(gè)人信息等在內(nèi)的49個(gè)問題,囊括200多個(gè)小問題。這是美國監(jiān)管機(jī)構(gòu)首次正式發(fā)起對生成式AI潛在風(fēng)險(xiǎn)的審查,也是OpenAI面對的首次調(diào)查,而就在5月,山姆·奧特曼還曾在參議院聽證會上就AI與隱私、監(jiān)管的關(guān)系侃侃而談。彼時(shí)參議員們提出的問題大多并不尖銳,更多時(shí)候是向奧特曼請教人工智能技術(shù),征詢對類似ChatGPT這樣的人工智能的管理方法的意見。
03. 拜登政府:與7家技術(shù)巨頭建立“AI開發(fā)共識”
7月21日,白宮宣布政府已與7家生成式AI公司達(dá)成自愿協(xié)議,以制定旨在確保該技術(shù)安全開發(fā)的指導(dǎo)方針。這些公司承諾會在人工智能技術(shù)開發(fā)過程中履行“安全、保障和信任”三項(xiàng)基本原則,并采取多項(xiàng)措施保障AI安全,包括發(fā)布產(chǎn)品前先做內(nèi)外部安全測試、開發(fā)水?。╳atermark)系統(tǒng)幫助用戶識別AI生成內(nèi)容,降低欺詐和誤導(dǎo)風(fēng)險(xiǎn)。據(jù)稱,OpenAI還特別起草了一份內(nèi)部政策備忘錄,內(nèi)容顯示該公司支持“要求任何想要開發(fā)人工智能系統(tǒng)的機(jī)構(gòu)需要先獲得政府許可”的想法,公司CEO奧特曼5月在參議院聽證會上也曾表達(dá)過類似觀點(diǎn)。
04. 馬斯克又成立一家公司xAI:要做通用人工智能
7月12日,馬斯克在Twitter上宣布,正式創(chuàng)立人工智能公司xAI。在馬斯克眼里,xAI是一家人工智能公司,但又不只局限于人工智能,而是擁有一個(gè)更宏大的目標(biāo)—“理解宇宙”。這是馬斯克繼2002年的航空公司SpaceX、2003年的新能源汽車公司特斯拉、2016年的腦機(jī)接口公司Neuralink之后,創(chuàng)立的又一家新公司。他表示,xAI將會與他擁有的另外兩家公司Twitter和特斯拉深度合作,利用前者的高質(zhì)量內(nèi)容與后者的算力來訓(xùn)練模型。馬斯克曾在4月批評ChatGPT等大模型給公眾制造謊言,他認(rèn)為構(gòu)建AI時(shí)不能考慮政治正確,因?yàn)楸仨氃试S人工智能說出它真正相信的事實(shí),即使會引來批評,但這是追求真理以及確保AI不會威脅人類的唯一途徑。
05. 微軟為Microsoft 365的生成式AI定價(jià):每人每月30美元
7月19日,微軟公布了Microsoft 365 Copilot—一款專門為Microsoft 365用名“Office 365”,包括Word、Excel設(shè)計(jì)的生成式AI助手—的定價(jià)和推出方式,該產(chǎn)品基于OpenAI最先進(jìn)的模型GPT-4。微軟為該產(chǎn)品定價(jià)每人每月30美元,并且暫時(shí)只賣給企業(yè)客戶。不少人認(rèn)為價(jià)格偏貴,同為微軟旗下的AI編程助手GitHub Copilot每月僅收費(fèi)19美元,高級版ChatGPT每月也不過20美元。不過會后微軟股價(jià)上漲近4%,反映出資本市場對于微軟辦公套件的吸引力充滿信心。
06. 蘋果入場:AppleGPT已在內(nèi)部測試
彭博社7月19日報(bào)道,蘋果公司已創(chuàng)建一個(gè)名為“Ajax”的人工智能框架。該框架創(chuàng)立于2022年,目標(biāo)是將蘋果在機(jī)器學(xué)習(xí)方面的開發(fā)統(tǒng)一起來。該系統(tǒng)架構(gòu)在Google云的機(jī)器學(xué)習(xí)框架GoogleJAX上(這可能是“Ajax”這一怪異名字的來源)。蘋果已基于“Ajax”新框架改進(jìn)了搜索、Siri、地圖等多款產(chǎn)品,并基于該框架開發(fā)了類ChatGPT的聊天機(jī)器人AppleGPT。蘋果計(jì)劃在明年舉行一個(gè)與人工智能相關(guān)的重大發(fā)布會,屆時(shí)有可能發(fā)布這款慢了對手一年多的產(chǎn)品。
07. 英特爾:計(jì)劃分拆芯片制造業(yè)務(wù)
據(jù)路透社6月2 1日報(bào)道,芯片巨頭英特爾宣布組織架構(gòu)重組,旗下制造業(yè)務(wù)將在未來獨(dú)立運(yùn)作并自負(fù)盈虧。分拆有助于英特爾更專注于芯片設(shè)計(jì),分拆后,根據(jù)英特爾CFO大衛(wèi)·津斯納(Dav i dZinsner)在投資者電話會議上的說法,英特爾從事芯片設(shè)計(jì)的部門將與制造業(yè)務(wù)部門建立“客戶-供應(yīng)商”的關(guān)系?;谶@種新模式,英特爾明年將成為全球第二大晶圓代工廠,制造收入將超過200億美元(臺積電的銷售目標(biāo)為850億美元)。但是英特爾沒有給出具體的執(zhí)行時(shí)間表,消息發(fā)布后,英特爾股價(jià)收跌6%,創(chuàng)1月以來的最大單日跌幅。
08. 拜登政府:準(zhǔn)備升級對華AI芯片限制
據(jù)《華爾街日報(bào)》6月27日報(bào)道,拜登政府正在考慮對出口中國的AI芯片實(shí)施新的限制。美國商務(wù)部可能會叫停英偉達(dá)等芯片制造企業(yè)向中國等國家的客戶直接出口芯片,此類出口必須經(jīng)審批通過。此外,美國政府還在考慮限制向中國人工智能公司提供云服務(wù),美國政府希望通過這種方式杜絕對于芯片出口禁令的規(guī)避。
不過美國芯片公司對此限制表示反對。7月15日,美國三大芯片巨頭—英特爾、高通、英偉達(dá)的高管共同前往華盛頓游說,反對拜登政府?dāng)U大對中國出售某些芯片和半導(dǎo)體制造設(shè)備的限制。兩天后,美國半導(dǎo)體行業(yè)協(xié)會也呼吁不要再升級對華芯片銷售的限制,因限制會“擾亂供應(yīng)鏈,造成重大市場不確定性,并促使中國持續(xù)升級報(bào)復(fù)行動(dòng)”。