• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      作為新基礎(chǔ)設(shè)施的AGI:以GPT-4O等新一代生成式人工智能為例

      2024-08-13 00:00:00郭全中蘇劉潤薇
      新聞愛好者 2024年7期

      【摘要】GPT-4o與谷歌Project Astra的相繼發(fā)布,展現(xiàn)出大模型交互能力的本質(zhì)性提升和實(shí)用性的突破,預(yù)示著以生成式人工智能為代表的AGI將如同互聯(lián)網(wǎng)和人工智能一樣,成為支撐社會運(yùn)行的新基礎(chǔ)設(shè)施,并對傳媒業(yè)的技術(shù)應(yīng)用、業(yè)務(wù)實(shí)踐以及產(chǎn)業(yè)融合帶來全景式的影響。

      【關(guān)鍵詞】GPT-4o;AGI;基礎(chǔ)設(shè)施;生成式人工智能;傳媒業(yè)

      繼Sora文生視頻模型驚艷世界之后,2024年5月14日,OpenAI揭開了最新生成模型GPT-4o的“神秘面紗”,其強(qiáng)大的實(shí)時(shí)語音和視頻交互能力再次引發(fā)震撼。次日,谷歌在I/O 2024開發(fā)者大會上也發(fā)布了一系列引人注目的產(chǎn)品,包括最新的AI智能體Project Astra。作為新一代生成式人工智能,GPT-4o和Project Astra在技術(shù)原理、交互功能和場景落地方面均實(shí)現(xiàn)了新的躍升,代表著通用人工智能(AGI)發(fā)展的最新突破。隨著AI技術(shù)不斷朝著AGI演進(jìn),其廣泛的認(rèn)知能力、自我進(jìn)化能力以及在多樣化任務(wù)中的應(yīng)用潛力,將逐步成為與互聯(lián)網(wǎng)、人工智能類似的社會新基礎(chǔ)設(shè)施。對于傳媒業(yè)來說,技術(shù)始終是驅(qū)動行業(yè)發(fā)展的動力,AGI作為新基礎(chǔ)設(shè)施將對傳媒業(yè)的技術(shù)應(yīng)用、業(yè)務(wù)實(shí)踐以及產(chǎn)業(yè)融合帶來全景式的影響。

      一、GPT-4O與谷歌Project Astra的新躍升

      (一)從“拼接”到“原生”的多模態(tài)模型轉(zhuǎn)向

      GPT-4o和Project Astra兩款產(chǎn)品分別代表了OpenAI和谷歌在生成式人工智能領(lǐng)域的最新進(jìn)展。GPT-4o以其“Omni”(意為“全能”)之名,彰顯了卓越的多模態(tài)處理能力,能夠接受文本、音頻、圖像和視頻的組合輸入,并生成相應(yīng)的組合輸出,在實(shí)時(shí)語音對話、情感表達(dá)及視覺交互等方面取得了顯著進(jìn)步。在性能上,GPT-4o是GPT-4的第三次主要迭代,相較于GPT-4 Turbo,其在文本推理、多語言音頻處理和視覺理解方面表現(xiàn)出色。與OpenAI的GPT-4o類似,谷歌的Project Astra也是一款多模態(tài)生成式人工智能產(chǎn)品,作為一個(gè)“通用AI智能體”,其基于Gemini模型同樣展現(xiàn)出多模態(tài)理解和實(shí)時(shí)對話的強(qiáng)大性能。用戶可以借助手機(jī)攝像頭、智慧眼鏡等設(shè)備捕捉現(xiàn)實(shí)世界中的事物,并通過Project Astra獲得對所見內(nèi)容的自然語言描述,從而實(shí)現(xiàn)一種全新的交互體驗(yàn)。

      在此之前,盡管DALL·E、Midjourney、TTS、Runway、Pika、Sora等生成式人工智能模型和產(chǎn)品已經(jīng)能夠模擬人類實(shí)現(xiàn)跨模態(tài)的信息轉(zhuǎn)換,但其都是以單一功能為導(dǎo)向,如從文本到圖像、從語音到文本、從圖像到視頻、從文本到視頻的轉(zhuǎn)換等,用戶在不同任務(wù)之間切換時(shí)的體驗(yàn)十分碎片化,并且,這些不同模態(tài)之間的信息傳遞主要依賴于大語言模型(LLM)生成的離散文本,在級聯(lián)過程中不可避免地會引入噪聲并出現(xiàn)傳播錯(cuò)誤,同時(shí)由于缺乏整體訓(xùn)練,在理解復(fù)雜且隱含的用戶指令、進(jìn)行多模態(tài)生成方面能力有限。[1]例如,原先ChatGPT在與用戶進(jìn)行語音模式的對話交談時(shí),需要首先通過語音識別模型Whisper將用戶輸入的語音轉(zhuǎn)換成文字,再由GPT大模型處理文字,最后通過TTS(文字轉(zhuǎn)語音)模型輸出語音。這種由三個(gè)模型“拼接”的處理方式不僅速度慢、效率低,而且還會永久性地過濾掉語調(diào)、口音、語速、說話人數(shù)、音色、情緒等微妙的信息,同時(shí)輸出的語音缺乏抑揚(yáng)頓挫和情感表現(xiàn)力,顯得機(jī)械感強(qiáng)且平淡無味。而GPT-4o和Project Astra則通過跨文本、視覺和語音的訓(xùn)練,構(gòu)建了一個(gè)“端到端”(end-to-end)的原生多模態(tài)大模型,實(shí)現(xiàn)了模型的“三合一”。這意味著所有輸入和輸出的信息均由同一個(gè)神經(jīng)網(wǎng)絡(luò)直接處理,無需經(jīng)過多個(gè)獨(dú)立模型的級聯(lián)過程,不僅極大地降低了響應(yīng)的時(shí)延,還顯著提高了信息處理的準(zhǔn)確性和連貫性,并增強(qiáng)了信息輸出的表現(xiàn)力。例如,GPT-4o能夠進(jìn)行實(shí)時(shí)的語音對話,其輸出的語音既可以包含喜怒哀樂等情感元素,甚至還能模擬笑聲、唱歌和插話等豐富的情感表現(xiàn)。

      (二)大模型交互能力的本質(zhì)性提升

      保羅·萊文森提出了媒介發(fā)展的“人性化趨勢”概念,認(rèn)為媒介必然沿著人類傳播要求的方向進(jìn)化,且媒介具有“延伸性”,其使用功能將越來越符合人類感官愉悅的要求。[2]以GPT-4o、Project Astra為代表的新一代生成式人工智能則進(jìn)一步驗(yàn)證了媒介進(jìn)化論。正如360集團(tuán)創(chuàng)始人周鴻祎的形象闡述,GPT賦予了AI對知識的理解能力,讓其擁有了“大腦”;GPT-4V賦予了AI視覺能力,讓其擁有了“眼睛”;GPT-4o賦予了AI看懂、聽懂和表達(dá)情感的能力,讓其擁有了“眼睛”“耳朵”和“嘴巴”。由此可見,生成式人工智能的“人性化”演進(jìn)趨勢將人機(jī)交互的體驗(yàn)推進(jìn)到了前所未有的高度。

      第一,實(shí)時(shí)視覺識別擴(kuò)展了人類的視覺邊界。谷歌發(fā)布的視頻顯示,Project Astra能夠準(zhǔn)確識別攝像頭捕捉到的物體、代碼、行為和場景等,并作出相應(yīng)的解讀,與人類進(jìn)行實(shí)時(shí)溝通。同樣,在OpenAI發(fā)布的視頻演示中,GPT-4o具備處理圖像分類、物體檢測和場景理解等復(fù)雜視覺任務(wù)的強(qiáng)大能力,用戶可以與其“視頻通話”,通過攝像頭直接解決各種問題,如解答數(shù)學(xué)題、逗弄寵物、唱生日歌和輔助視障人士等。

      第二,類人對話提升了人機(jī)交互體驗(yàn)的質(zhì)量。一是響應(yīng)速度提升使對話更加流暢。OpenAI官方數(shù)據(jù)顯示,GPT-4o針對音頻輸入的平均反應(yīng)時(shí)長為320毫秒,最快可達(dá)232毫秒,相較于GPT-3.5(2.8秒)和GPT-4(5.4秒)的平均延遲,反應(yīng)時(shí)間大幅縮短,與人類日常交流的時(shí)序更加契合。二是與Siri等傳統(tǒng)語音交互系統(tǒng)相比,GPT-4o不僅無需喚醒詞啟動,還能記住用戶的名字和偏好,從而無需反復(fù)輸入指令;同時(shí)更在音色、音調(diào)和表達(dá)習(xí)慣(如語氣詞)上幾乎與真人無異,甚至能夠感知并回應(yīng)情緒(如開啟嘲諷模式),在情感理解和表達(dá)上取得了顯著突破。三是GPT-4o在哲學(xué)思辨、科學(xué)闡釋、工作和日常生活等領(lǐng)域展現(xiàn)出廣泛而深入的理解能力。其能夠根據(jù)場景氛圍和用戶情緒靈活調(diào)整語調(diào)和措辭,塑造了一種接近真實(shí)人際交流的互動體驗(yàn)。例如,在輔助“石頭剪刀布”桌面游戲時(shí),GPT-4o能夠勝任主持人的角色并調(diào)動游戲氛圍;在即興創(chuàng)作歌曲時(shí),其不僅能夠編寫歌詞,還能即時(shí)生成旋律和諧的曲調(diào),甚至自動進(jìn)行和聲以及實(shí)現(xiàn)模型之間的對唱等。

      GPT-4o和Project Astra在交互能力上實(shí)現(xiàn)了本質(zhì)性的提升,包括對多維感官的識別、對復(fù)雜任務(wù)的理解、更自然的對話流暢度和感知情感的能力,標(biāo)志著生成式人工智能向更加智能化和人性化方向發(fā)展邁出了重要一步。

      (三)大模型實(shí)用性突破與大規(guī)模應(yīng)用落地

      場景落地是大模型發(fā)展的關(guān)鍵。然而,無論是ChatGPT還是國內(nèi)的文心一言等大模型,盡管在技術(shù)層面上取得了一定進(jìn)展,但目前主要局限于生成類場景的應(yīng)用,尚未實(shí)現(xiàn)預(yù)期中廣泛的場景價(jià)值。以ChatGPT為例,自O(shè)penAI在2022年11月30日發(fā)布以來,其用戶數(shù)量在短短五天內(nèi)突破百萬,兩個(gè)月內(nèi)迅速飆升至億級規(guī)模。可是,隨著時(shí)間的推移,這一強(qiáng)勁的增長勢頭并未持續(xù)。根據(jù)數(shù)據(jù)分析公司Similarweb的消息,在2023年5月ChatGPT全球總訪問量達(dá)到18億次的峰值之后,其流量增長便開始放緩[3],增長勢頭也再未恢復(fù)至先前的驚人速度。這一現(xiàn)象的背后,很大程度上是由于ChatGPT在場景落地方面的不足。而Sora作為文生視頻領(lǐng)域的技術(shù)前沿驚艷于世,目前仍處于內(nèi)測階段,暫未對外開放使用,這也表明大模型從研發(fā)到實(shí)際應(yīng)用的轉(zhuǎn)化過程中面臨較大困難。

      GPT-4o與Project Astra有效解決了大模型的實(shí)用性問題。第一,在使用操作上,此前,用戶主要通過鍵盤輸入提示詞與AI互動,這種操作相對復(fù)雜,對于很多普通用戶來說存在較高的使用門檻。OpenAI創(chuàng)始人、CEO山姆·奧特曼也曾表示,提示工程(prompt engineering)只是生成式人工智能發(fā)展的過渡階段,未來將不再需要這一過程。GPT-4o和Project Astra則實(shí)現(xiàn)了從文字輸入到口語互動的交互方式轉(zhuǎn)變,類似于智能手機(jī)的出現(xiàn)徹底顛覆了基于鍵盤的操作方式,變?yōu)槭种赣|摸操作,AI技術(shù)也迎來了新的“iPhone時(shí)刻”。如今,用戶可以通過自然語言直接與AI進(jìn)行口頭對話并獲得即時(shí)反饋,人機(jī)交互變得更加直觀和自然。由此也預(yù)示著生成式人工智能的接受度將大幅提高,更多用戶能夠真正接觸和使用AI技術(shù),從而幫助其解決生活難題、提供娛樂和情感陪伴等。第二,在使用成本上,例如GPT-4o進(jìn)一步強(qiáng)化了“免費(fèi)+收費(fèi)”的商業(yè)模式,踐行了“OpenAI創(chuàng)造AI,人們利用它創(chuàng)造新奇事物并惠及所有人”的愿景,目的在于降低用戶的使用成本,以服務(wù)于更廣大的社會公眾。此外,通過開放API接口和降低計(jì)費(fèi)價(jià)格,OpenAI鼓勵并支持開發(fā)者基于GPT-4o構(gòu)建多樣化的AI應(yīng)用生態(tài),從而在大模型的基礎(chǔ)上,真正地實(shí)現(xiàn)向各個(gè)細(xì)分商業(yè)場景的輸出,在教育、廣告、搜索、娛樂等各種領(lǐng)域更好地落地。

      二、AGI何以成為基礎(chǔ)設(shè)施?

      實(shí)現(xiàn)AGI不僅需要AI具備深厚的知識儲備和高度的推理能力,更關(guān)鍵的是要能夠與人進(jìn)行交互。GPT-4o與Project Astra的問世代表著類人AI Agent(智能體)的雛形顯現(xiàn),展現(xiàn)出了真正能夠?yàn)槿怂玫臐摿?,進(jìn)一步拉近了人類與AGI的距離。那么,AGI是什么?AGI如何成為社會的基礎(chǔ)設(shè)施?AGI將帶來哪些影響?在探討這些問題之前,首先需要明確基礎(chǔ)設(shè)施的定義與標(biāo)準(zhǔn),立足于理論之維與實(shí)踐之基探尋依據(jù),并從互聯(lián)網(wǎng)和人工智能的演進(jìn)中尋找規(guī)律,進(jìn)而理解AGI作為基礎(chǔ)設(shè)施的合理性與必然趨勢。

      (一)基礎(chǔ)設(shè)施的定義與標(biāo)準(zhǔn)

      對于基礎(chǔ)設(shè)施的理解和研究通常始于技術(shù)功能,但其內(nèi)涵遠(yuǎn)不止于技術(shù)層面。[4]從字面上看,“基礎(chǔ)設(shè)施”由“基礎(chǔ)”和“設(shè)施”構(gòu)成,“基礎(chǔ)”指的是事物發(fā)展所必需的、基本的、不可或缺的支撐要素;“設(shè)施”則是指能夠滿足社會生活需求的操作系統(tǒng)。在英文中,“infrastructure”對應(yīng)基礎(chǔ)設(shè)施的概念,由前綴“infra-”(意為“在下面”)和“structure”(意為“結(jié)構(gòu)”)組成,強(qiáng)調(diào)其作為“底層技術(shù)架構(gòu)”的特性。綜合來看,本文將基礎(chǔ)設(shè)施定義為支撐社會運(yùn)行所需的底層技術(shù)架構(gòu)和操作系統(tǒng)。

      第一,在理論層面,基礎(chǔ)設(shè)施需要具備以下特征:一是物質(zhì)性?;A(chǔ)設(shè)施是由一系列中心、節(jié)點(diǎn)、線路和終端構(gòu)成的網(wǎng)絡(luò)[5],是可以使貨物、思想、人員等實(shí)現(xiàn)空間交換的物質(zhì)形式[6]。無論是電網(wǎng)、供水、燃?xì)?、交通等作為物質(zhì)工程的硬基礎(chǔ)設(shè)施,還是由信息基礎(chǔ)設(shè)施、融合基礎(chǔ)設(shè)施、創(chuàng)新基礎(chǔ)設(shè)施構(gòu)成的“新基建”(新型基礎(chǔ)設(shè)施建設(shè))等軟基礎(chǔ)設(shè)施,都是人類賴以生活和行動的物質(zhì)條件,為推動經(jīng)濟(jì)社會發(fā)展起到了至關(guān)重要的基礎(chǔ)作用。二是關(guān)系性。基礎(chǔ)設(shè)施不僅可以是物質(zhì)層面的基礎(chǔ)設(shè)施建設(shè),還可以是隱喻的深層結(jié)構(gòu)。在Susan Leigh Star的研究框架中,技術(shù)、基礎(chǔ)設(shè)施與組織變革三者之間存在著互動關(guān)系,拓展了理解基礎(chǔ)設(shè)施的關(guān)系性視角[7],即基礎(chǔ)設(shè)施并非是孤立存在的,而是嵌入到了社會結(jié)構(gòu)、配置和技術(shù)之中[8],既源自社會關(guān)系,也形塑了社會關(guān)系[9]。因此,在探討某一事物何以成為基礎(chǔ)設(shè)施時(shí),還需考量其在落地過程中的物質(zhì)性特征與其所處的社會環(huán)境及不同主體之間的復(fù)雜關(guān)系[10],只有其與社會實(shí)踐活動緊密相連,才能真正發(fā)揮基礎(chǔ)設(shè)施的作用。三是歷時(shí)性。一方面,基礎(chǔ)設(shè)施的建設(shè)與發(fā)展是一個(gè)逐步成熟和完善,進(jìn)而基礎(chǔ)設(shè)施化的過程,無論是規(guī)模的擴(kuò)大、功能的增強(qiáng),還是技術(shù)的革新,都需要?dú)v經(jīng)時(shí)間的沉淀;另一方面,基礎(chǔ)設(shè)施的發(fā)展路徑還沿襲了既有的慣性[11],但這種慣性并非簡單重復(fù)過去,而是受到歷史經(jīng)驗(yàn)、社會慣例和文化傳統(tǒng)等多種因素的綜合影響,形成了相對穩(wěn)定的基礎(chǔ)設(shè)施發(fā)展模式,為其持續(xù)發(fā)展提供結(jié)構(gòu)性保障。四是公共性。隨著基礎(chǔ)設(shè)施的發(fā)展,其在經(jīng)濟(jì)和社會進(jìn)程中扮演著越來越重要的角色,提供廣泛而普遍的公共服務(wù)[12],并在整合公眾方面發(fā)揮著關(guān)鍵作用[13]。同時(shí),基礎(chǔ)設(shè)施也在一定程度上構(gòu)建了自下而上的權(quán)力生態(tài),承擔(dān)了部分政府的管理職能。

      第二,在實(shí)踐層面,基礎(chǔ)設(shè)施的建設(shè)還深受三大要素影響:一是用戶數(shù)量。根據(jù)梅特卡夫定律,網(wǎng)絡(luò)的價(jià)值與用戶數(shù)量的平方成正比,基礎(chǔ)設(shè)施作為承載社會各種資源的網(wǎng)絡(luò),其高效運(yùn)行依賴于用戶的廣泛參與,用戶規(guī)模越大,其發(fā)展的根基就越牢固,從而帶來更顯著的規(guī)模效應(yīng)和范圍效應(yīng)。二是用戶的使用頻度。如前所述,基礎(chǔ)設(shè)施的“設(shè)施”代表滿足社會生活需求的操作系統(tǒng),許多經(jīng)濟(jì)社會活動都需要依托于基礎(chǔ)設(shè)施來實(shí)現(xiàn),因此,高頻率的用戶使用是評估基礎(chǔ)設(shè)施有效性的重要指標(biāo),也是衡量其功能和服務(wù)質(zhì)量的重要標(biāo)準(zhǔn)。三是對用戶的影響程度。用戶的行為模式、生產(chǎn)和生活方式等都可能因基礎(chǔ)設(shè)施的進(jìn)步而發(fā)生變化。例如,公共交通系統(tǒng)的優(yōu)化和共享出行系統(tǒng)的興起,改變了人們的出行習(xí)慣;隨著信息化和網(wǎng)絡(luò)化的發(fā)展,遠(yuǎn)程辦公、在線會議等新型工作方式逐漸成為趨勢。由此可見,基礎(chǔ)設(shè)施對用戶行為、觀念、習(xí)慣等的深刻影響反映了其在社會中的重要性和實(shí)際價(jià)值。

      (二)互聯(lián)網(wǎng)、人工智能的基礎(chǔ)設(shè)施化演進(jìn)

      1.互聯(lián)網(wǎng)平臺化:作為“連接一切”的基礎(chǔ)設(shè)施

      隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,平臺的功能和作用也在逐漸擴(kuò)展和深化,影響力日益凸顯,平臺化的互聯(lián)網(wǎng)逐步成為“連接萬物”、支撐社會發(fā)展的重要基礎(chǔ)設(shè)施。因此,互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施化主要體現(xiàn)在平臺的展現(xiàn)形式上。

      從學(xué)理角度來說,平臺被視為基礎(chǔ)設(shè)施的隱喻[14],在現(xiàn)代社會中,互聯(lián)網(wǎng)平臺發(fā)揮著基礎(chǔ)性的作用。第一,互聯(lián)網(wǎng)平臺的建立基于一系列互聯(lián)網(wǎng)相關(guān)的技術(shù)標(biāo)準(zhǔn),如網(wǎng)絡(luò)基站、服務(wù)器、數(shù)據(jù)中心、互聯(lián)網(wǎng)協(xié)議,以及互聯(lián)網(wǎng)接入與輸出的終端設(shè)備等[15],這些構(gòu)成了互聯(lián)網(wǎng)平臺的物質(zhì)性基礎(chǔ)。第二,互聯(lián)網(wǎng)因其連接性、開放性和去中心化的特征,削弱了傳統(tǒng)權(quán)力結(jié)構(gòu)中的中心節(jié)點(diǎn),為不同階層和背景的個(gè)體提供了展示和互動的平臺,賦予了個(gè)體成為信息傳播主體的可能性。隨著社交媒體平臺的出現(xiàn)和發(fā)展,互聯(lián)網(wǎng)日益成為連接和維系社會關(guān)系網(wǎng)絡(luò)的基礎(chǔ)紐帶,不僅引發(fā)了社會關(guān)系維度的深刻變革,也使互聯(lián)網(wǎng)逐漸嵌入更廣泛的社會關(guān)系網(wǎng)絡(luò)中,成為社會互動的重要媒介。第三,互聯(lián)網(wǎng)的發(fā)展經(jīng)歷了從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),再到智能互聯(lián)網(wǎng)的演進(jìn)過程,逐步形成了相對穩(wěn)定的平臺發(fā)展模式。第四,互聯(lián)網(wǎng)平臺正在自我構(gòu)建一種龐大的生態(tài)系統(tǒng),逐步融合現(xiàn)有的基礎(chǔ)設(shè)施,成為兼具信息傳遞、社會交往、公共傳播、政治溝通、產(chǎn)業(yè)經(jīng)營等的公共空間[16]。一些超級平臺甚至憑借強(qiáng)大的資本、經(jīng)濟(jì)與數(shù)據(jù)優(yōu)勢,獲得了改造乃至創(chuàng)造基礎(chǔ)設(shè)施的權(quán)力,開始承擔(dān)起部分政府職能。[17]

      而在實(shí)踐過程中,互聯(lián)網(wǎng)之所以能夠成為基礎(chǔ)設(shè)施,首先在于其擁有大體量的用戶規(guī)模。根據(jù)Statista的數(shù)據(jù),截至2023年,全球互聯(lián)網(wǎng)用戶數(shù)量約為54億,覆蓋了全球三分之二的人口。其中,自2008年以來,我國一直是全球互聯(lián)網(wǎng)用戶數(shù)量最多的國家,這為我國互聯(lián)網(wǎng)的高速發(fā)展奠定了基礎(chǔ)。CNNIC的數(shù)據(jù)顯示,截至2023年12月,我國網(wǎng)民規(guī)模達(dá)到10.92億人,互聯(lián)網(wǎng)普及率達(dá)77.5%,其中使用手機(jī)上網(wǎng)的網(wǎng)民比例高達(dá)99.9%,互聯(lián)網(wǎng)在我國社會具有較高的滲透度。其次,互聯(lián)網(wǎng)的用戶使用頻度高。Statista的數(shù)據(jù)顯示,截至2023年第四季度,全球互聯(lián)網(wǎng)用戶每日平均上網(wǎng)時(shí)間為6小時(shí)35分鐘,其中日均使用社交媒體的時(shí)間為143分鐘。根據(jù)CNNIC發(fā)布的數(shù)據(jù),在中國,網(wǎng)民的人均每周上網(wǎng)時(shí)長從2012年的19.9小時(shí)增加到2023年的26.1小時(shí),可以看出互聯(lián)網(wǎng)在用戶日常生活中占據(jù)越來越多的時(shí)間。此外,在互聯(lián)網(wǎng)的影響下,人們的生產(chǎn)、生活和工作逐漸從線下轉(zhuǎn)移至線上,生存方式從數(shù)字化生存向數(shù)據(jù)化生存轉(zhuǎn)變[18],短視頻平臺的興起更是激發(fā)了視頻化生存的轉(zhuǎn)向,從而重塑了人們的社交和消費(fèi)的觀念和行為等。

      2.平臺AI化:人工智能技術(shù)平移的基礎(chǔ)性作用

      隨著信息技術(shù)的快速發(fā)展,人工智能技術(shù)逐漸取代傳統(tǒng)互聯(lián)網(wǎng)技術(shù)成為平臺運(yùn)作的基礎(chǔ)性技術(shù)。換言之,互聯(lián)網(wǎng)平臺的展現(xiàn)形式依然保持不變,但從互聯(lián)網(wǎng)向人工智能的技術(shù)平移使得當(dāng)前各大互聯(lián)網(wǎng)平臺都朝著AI化的方向發(fā)展。

      在學(xué)理角度上,第一,人工智能并非只是后臺運(yùn)行的代碼和抽象的技術(shù),相反,其與物質(zhì)世界的協(xié)同交互與影響是非常深入的。一方面,AI的運(yùn)行需要依賴充足的電力供應(yīng)、低延遲的網(wǎng)絡(luò)、高性能的硬件、可靠的存儲解決方案以及大規(guī)模的數(shù)據(jù)中心等基礎(chǔ)性物質(zhì)資源;另一方面,通過物聯(lián)網(wǎng)設(shè)備(如傳感器、攝像頭)收集物理世界中的數(shù)據(jù),AI算法能夠進(jìn)行數(shù)據(jù)分析和處理,進(jìn)而在復(fù)雜的場景中提供精準(zhǔn)、高效的智能化服務(wù),如手機(jī)地圖平臺運(yùn)用AI技術(shù)可以分析實(shí)時(shí)交通數(shù)據(jù),優(yōu)化交通流量,減少擁堵和事故發(fā)生的可能性。在這個(gè)過程中,數(shù)字勞動的物質(zhì)網(wǎng)絡(luò)也被同時(shí)構(gòu)建了起來[19],在平臺經(jīng)濟(jì)的驅(qū)動下出現(xiàn)了外賣員、網(wǎng)約車司機(jī)等新型職業(yè)群體。第二,人工智能推動了人類社會關(guān)系的重DoVnyPKIhZR9sQThwFsYaw==構(gòu)和結(jié)構(gòu)的重組,實(shí)現(xiàn)了從機(jī)器輔助人類到人機(jī)協(xié)同、人機(jī)共生的轉(zhuǎn)變,同時(shí)虛擬與現(xiàn)實(shí)的界限也隨之進(jìn)一步消弭,虛實(shí)交互不斷深化。第三,人工智能技術(shù)由于受到認(rèn)知水平、技術(shù)水平和資金水平等多方面不足的制約,經(jīng)歷了半個(gè)多世紀(jì)的持續(xù)深潛,才逐漸成為社會的底層技術(shù)。從翻譯軟件、AI圍棋模型AlphaGo,到智能推薦算法、電子設(shè)備智能助手,再到生成式人工智能的出現(xiàn),AI的應(yīng)用領(lǐng)域日益廣泛。第四,人工智能技術(shù)在互聯(lián)網(wǎng)平臺的廣泛應(yīng)用下,正在賦能教育、醫(yī)療、交通、農(nóng)業(yè)等社會各領(lǐng)域的數(shù)字化、智能化轉(zhuǎn)型,催生出了新理念、新用戶、新模式、新產(chǎn)業(yè)和新應(yīng)用。在2024年《政府工作報(bào)告》中,我國將“人工智能+”行動上升為國家戰(zhàn)略,未來將形成“人工智能+各行各業(yè)+各應(yīng)用場景”的深度融合。

      在實(shí)踐角度上,無論是在線學(xué)習(xí)、遠(yuǎn)程辦公,還是智能家居、智慧醫(yī)療等領(lǐng)域,人工智能正在對人類生活進(jìn)行全方位滲透。自從ChatGPT問世以來,特別是新一代生成式人工智能如GPT-4o和谷歌Project Astra的推出,AI直觀易用的界面設(shè)計(jì)、高效準(zhǔn)確的信息處理能力、自然流暢的對話體驗(yàn),必將進(jìn)一步提升用戶接納度。

      (三)“生產(chǎn)即分發(fā)”:AGI也將成為新基礎(chǔ)設(shè)施

      自1956年在達(dá)特茅斯會議上首次提出“人工智能”概念以來,為了實(shí)現(xiàn)AGI的終極目標(biāo),人工智能技術(shù)經(jīng)歷了專用人工智能(ANI)的經(jīng)驗(yàn)積累,以及AI大模型的能力涌現(xiàn),奠定了技術(shù)、資金、人才等基礎(chǔ)條件。所謂AGI就是一個(gè)能夠執(zhí)行人類所有工作,甚至超越人類能力范疇的智能系統(tǒng),它不再局限于特定的任務(wù)或領(lǐng)域,而是擁有廣泛的認(rèn)知能力、自我進(jìn)化能力,并在多樣化的任務(wù)和復(fù)雜環(huán)境中展現(xiàn)出人類級別或更高的智能水平。[20]也就是說,AGI的最終意義是創(chuàng)造出一個(gè)終極智能世界[21],將成為未來的社會基礎(chǔ)設(shè)施。

      從學(xué)理角度出發(fā),互聯(lián)網(wǎng)和人工智能技術(shù)推動了互聯(lián)網(wǎng)平臺迅速崛起,出現(xiàn)了“基礎(chǔ)設(shè)施的平臺化”和“平臺的基礎(chǔ)設(shè)施化”[22],平臺成為基礎(chǔ)設(shè)施的主要展現(xiàn)形式。但是,相對于未來的AGI,則會在現(xiàn)有平臺基礎(chǔ)上衍生出“生產(chǎn)即分發(fā)”的新形式。具體而言,AGI基礎(chǔ)設(shè)施將不再局限于當(dāng)前平臺的展現(xiàn)形式,而是進(jìn)一步把現(xiàn)有的基礎(chǔ)設(shè)施化、媒介化的平臺“再中介化”。這一過程將徹底改變傳統(tǒng)的生產(chǎn)和分發(fā)流程,實(shí)現(xiàn)了生產(chǎn)之后直接分發(fā)的模式,無需依賴傳統(tǒng)平臺作為“中介”。例如,基于個(gè)體化模型和個(gè)性化AI進(jìn)行的人機(jī)交互,生成的內(nèi)容可以直接面向用戶進(jìn)行分發(fā),而不再需要經(jīng)過任何中介平臺的處理。AGI通過“去中介化”及其在全面泛化的過程中具備的環(huán)境配置性、嵌入基底性、動態(tài)生成性、關(guān)系公共性、透明生態(tài)性[23]的特征,在各類復(fù)雜環(huán)境中自適應(yīng)地實(shí)現(xiàn)更高程度的資源配置效率和用戶體驗(yàn)優(yōu)化。正如凱文·凱利所言:“當(dāng)技術(shù)變得隱形的時(shí)候才是最強(qiáng)大的?!蔽磥?,AGI會成為“看不見、摸不著、離不開”的基礎(chǔ)設(shè)施,深度滲透并融入社會的每一個(gè)細(xì)微脈絡(luò)之中,無縫連接并塑造社會運(yùn)作的每一個(gè)層面,真正實(shí)現(xiàn)全面的智能化。

      在具體實(shí)踐方面,有學(xué)者通過實(shí)證研究發(fā)現(xiàn),用戶會下意識地將人際交往的原則和期望遷移至人智交互情境中,因此,在AI的研發(fā)與設(shè)計(jì)過程中,能力和情感的雙重兼顧尤為必要。[24]目前,GPT-4o與谷歌Project Astra已經(jīng)突破了語音、聽覺和視覺感官能力的界限,展現(xiàn)出強(qiáng)大的情感理解能力,甚至能夠提供情緒價(jià)值,帶來了豐富的交互體驗(yàn)。未來,AGI將可能模擬人類“眼耳鼻舌身意”六識的感知能力[25],來獲得更多的感知數(shù)據(jù),從而帶來更加直接、自然、真實(shí)的沉浸式體驗(yàn),以更加細(xì)膩、人性化的方式融入人類社會的方方面面。雖然,目前的AI技術(shù)與真正的AGI尚存在距離,但根據(jù)ChatGPT、Sora、GPT-4o、Project Astra等引發(fā)的社會反響,可以預(yù)見,隨著AI能力的不斷提升和AI技術(shù)的日益普及,AGI的用戶群體將持續(xù)擴(kuò)大,使用頻度亦將大幅度提升。

      三、AGI作為新基礎(chǔ)設(shè)施對傳媒業(yè)的全景式重構(gòu)

      GPT基于背后的預(yù)訓(xùn)練大語言模型,能夠?qū)χR進(jìn)行理解,表現(xiàn)為二維的信息處理能力;Sora作為“世界模擬器”,具備視覺感知能力,能夠?qū)ξ锢硎澜邕M(jìn)行更加立體和直觀的認(rèn)知和模擬,實(shí)現(xiàn)了對現(xiàn)實(shí)的三維理解。但是,GPT和Sora更多是在技術(shù)和底層架構(gòu)上產(chǎn)生了影響,并沒有真正實(shí)際落地,或者說在實(shí)際操作層面仍然面臨一定難度。而GPT-4o和谷歌Project Astra在技術(shù)、性能上的躍升為大模型增加了一個(gè)全新的維度——能夠?qū)嶋H應(yīng)用和實(shí)現(xiàn)場景落地,預(yù)示著AGI正在從理論走向現(xiàn)實(shí),有望真正成為新的基礎(chǔ)設(shè)施。對于傳媒業(yè)而言,具備更為有效落地場景的AGI新基礎(chǔ)設(shè)施將引發(fā)行業(yè)的全景式變革。

      (一)AGI將成為傳媒業(yè)的技術(shù)主導(dǎo)方向

      隨著人工智能技術(shù)的進(jìn)步,傳媒業(yè)迎來了以生成式人工智能為代表的新一輪技術(shù)革命。從ChatGPT人機(jī)對話應(yīng)用程序橫空出世到Sora文生視頻大模型驚艷四方,再到GPT-4o和谷歌Project Astra的能力躍升,AGI的曙光日益顯現(xiàn)。盡管目前還未真正實(shí)現(xiàn)AGI,但自然語言處理(NLP)、機(jī)器學(xué)習(xí)等基礎(chǔ)性技術(shù),以及具備泛化任務(wù)處理能力的類AGI已經(jīng)在傳媒業(yè)得到廣泛應(yīng)用,如撰寫新聞稿件、生成采訪提綱、翻譯文件、分析數(shù)據(jù)、優(yōu)化廣告創(chuàng)意等,為傳媒業(yè)實(shí)現(xiàn)了降本增效。此外,一些媒體還積極推出傳媒垂類大模型,如人民網(wǎng)與百度發(fā)布的“人民網(wǎng)—百度·文心”、中央廣播電視總臺與上海AI實(shí)驗(yàn)室聯(lián)合發(fā)布的“央視聽媒體大模型”、傳播大腦科技(浙江)股份有限公司研發(fā)的“傳播大模型”等。未來,AGI將成為傳媒業(yè)的技術(shù)主導(dǎo)方向,推動傳媒業(yè)在內(nèi)容生產(chǎn)、傳播模式、營銷模式等方面的全面智能化。

      (二)傳媒業(yè)務(wù)實(shí)現(xiàn)智能化、精細(xì)化與場景化再造

      第一,在AGI的加持下,新聞生產(chǎn)主體泛化,形成“UGC+PGC+AIGC+AI Agent”協(xié)同生產(chǎn)的格局。其中,AIGC已在體育、財(cái)經(jīng)報(bào)道中有所應(yīng)用,通過AI自主內(nèi)容創(chuàng)作,實(shí)現(xiàn)全天候、實(shí)時(shí)內(nèi)容產(chǎn)出,提升了內(nèi)容生產(chǎn)效率。AI Agent作為一種高級應(yīng)用程序,能夠理解人類指令,并以類人的方式作出回應(yīng)、互動和決策。原先的圍棋機(jī)器人AlphaGo、語音助手Siri等可被視為AI Agent的初級形態(tài),而GPT-4o和谷歌Project Astra則具備了更高級的類人AI Agent特性,能夠與用戶進(jìn)行自然、流暢、即時(shí)的互動交流,將成為全新的內(nèi)容生產(chǎn)主體。

      第二,在AGI的驅(qū)動下,新聞傳播的互動方式和場景也展現(xiàn)出顯著癥候。一是GPT-4o和Project Astra這種類AGI技術(shù)在人機(jī)交互方面的顯著進(jìn)步,已經(jīng)調(diào)整并重塑了傳媒業(yè)的新聞分發(fā)模式,即在人與機(jī)器的一問一答過程中,形成了“生產(chǎn)即分發(fā)”的傳播形式。具體來說,用戶通過即時(shí)語音對話和實(shí)時(shí)參與主動提出需求,AGI在時(shí)延、表達(dá)方式上能夠進(jìn)行類人響應(yīng),針對性地滿足其需求,從而顛覆了傳統(tǒng)新聞機(jī)構(gòu)“點(diǎn)對面”的新聞分發(fā)模式,以及依賴算法推薦而導(dǎo)致的內(nèi)容分發(fā)同質(zhì)化現(xiàn)象,實(shí)現(xiàn)了真正意義上的“點(diǎn)對點(diǎn)”傳播,滿足了個(gè)性化、精細(xì)化、“千人千面”的互動體驗(yàn)[26]。二是AGI進(jìn)一步深化了元宇宙新聞場景的“脫虛向?qū)崱边M(jìn)程。一方面,作為元宇宙最早落地的應(yīng)用場景之一,以GPT-4o為代表的新一代生成式人工智能賦能虛擬數(shù)字人的類人化屬性和智能化水平,能夠克服當(dāng)前一些數(shù)字人依靠幕后工作人員操控、動作和表情不自然、語音交互不流暢等不足,給予用戶更優(yōu)質(zhì)的體驗(yàn);另一方面,通過手機(jī)攝像頭、智慧眼鏡或數(shù)字替身,用戶可以參與沉浸式的新聞互動,新聞傳播從單一的信息傳遞轉(zhuǎn)變?yōu)槎喔泄俚木C合體驗(yàn),在一定程度上增強(qiáng)了新聞的現(xiàn)場感和真實(shí)性。

      (三)產(chǎn)業(yè)融合與傳媒功能深度延伸

      在AGI的技術(shù)語境中,傳媒業(yè)作為相對傳統(tǒng)的產(chǎn)業(yè),需要通過與AI技術(shù)的深度融合,注入新的活力與動力。AGI作為基礎(chǔ)設(shè)施將延續(xù)“互聯(lián)網(wǎng)+跨界”的模式,推進(jìn)傳媒業(yè)在產(chǎn)業(yè)層面的深度融合。第一,互聯(lián)網(wǎng)企業(yè)通常是新技術(shù)的先行者,無論是西方發(fā)達(dá)國家還是我國的互聯(lián)網(wǎng)企業(yè),都在積極探索AI大模型及其相關(guān)業(yè)務(wù),致力于實(shí)現(xiàn)產(chǎn)業(yè)智能升級,推動AGI的全面快速發(fā)展,為傳媒業(yè)的跨界融合提供了技術(shù)、人才和資金支持。第二,面對技術(shù)對傳媒業(yè)的沖擊,尤其是AGI應(yīng)用下“生產(chǎn)即分發(fā)”的新模式,將進(jìn)一步動搖媒體的用戶基礎(chǔ)。因此,傳媒業(yè)需要把握住AGI的機(jī)遇,將功能的“觸角”延伸至社會更多領(lǐng)域,如文化創(chuàng)意產(chǎn)業(yè)、教育、醫(yī)療、智慧城市、數(shù)字治理等,拓展自身的影響力。

      四、結(jié)語

      塞巴斯蒂安·特倫曾言:“人工智能更像是一門人文學(xué)科,其本質(zhì)在于嘗試?yán)斫馊祟惖闹悄芘c認(rèn)知?!币訥PT-4o、谷歌Project Astra為代表的新一代生成式人工智能賦予了AI以人類的感官,不僅在多模態(tài)處理和人機(jī)交互能力上實(shí)現(xiàn)了顯著突破,更在實(shí)際應(yīng)用場景中展現(xiàn)了廣泛的實(shí)用性,代表著AGI的最新發(fā)展方向。在AI技術(shù)的演進(jìn)趨勢下,AGI將逐漸成為無處不在的現(xiàn)象和實(shí)體,成為繼互聯(lián)網(wǎng)和人工智能之后的新基礎(chǔ)設(shè)施。然而,任何技術(shù)的發(fā)展都伴隨著挑戰(zhàn),在實(shí)現(xiàn)AGI的過程中,諸如數(shù)據(jù)安全、隱私保護(hù)、倫理道德等問題亦不容忽視,在未來的演進(jìn)過程中還需進(jìn)一步跟蹤研究。

      [本文為北京市社會科學(xué)基金規(guī)劃重點(diǎn)項(xiàng)目“首都互聯(lián)網(wǎng)平臺企業(yè)社會責(zé)任與協(xié)同治理體系研究”的階段性成果,批準(zhǔn)號(22XCA002)]

      參考文獻(xiàn):

      [1]Wu S,F(xiàn)ei H,Qu L,et al.Next-gpt:Any-to-any multimodal llm[EB/OL].https://arxiv.org/abs/2309.05519.

      [2]保羅·萊文森.人類歷程回放:媒介進(jìn)化論[M].鄔建中,譯.重慶:西南師范大學(xué)出版社,2016.

      [3]財(cái)聯(lián)社.OpenAI放開限制!用戶無需注冊即可使用ChatGPT[EB/OL].https://finance.eastmoney.com/a/202404023031708894.html.

      [4]柯小俊.“技術(shù)網(wǎng)絡(luò)”與“意義點(diǎn)位”:作為紀(jì)念碑的基礎(chǔ)設(shè)施研究[J].新聞大學(xué),2023(7):86-100+120.

      [5]張磊,賈文斌.互聯(lián)網(wǎng)基礎(chǔ)設(shè)施研究:元概念、路徑與理論框架[J].中國社會科學(xué)院研究生院學(xué)報(bào),2021(5):22-32+145.

      [6]Larkin B.The politics and poetics of infrastructure[J].Annual review of anthropology,2013(42)327-343.

      [7]王家東.基礎(chǔ)設(shè)施、邊界對象與科學(xué)技術(shù)研究的人類學(xué)路徑[J].自然辯證法研究,2023,39(06):112-117.

      [8]Star S L.The ethnography of infrastructure[J].American behavioral scientist,1999,43(3):377-391.

      [9]張磊,賈文斌.互聯(lián)網(wǎng)基礎(chǔ)設(shè)施研究:元概念、路徑與理論框架[J].中國社會科學(xué)院研究生院學(xué)報(bào),2021(05):22-32+145.

      [10]段世昌.媒介基礎(chǔ)設(shè)施視角下的技術(shù)編碼研究:教育網(wǎng)PT站的“分享”規(guī)則及用戶實(shí)踐[J].新聞界,2020(10):81-94.

      [11]張磊,賈文斌.互聯(lián)網(wǎng)基礎(chǔ)設(shè)施研究:元概念、路徑與理論框架[J].中國社會科學(xué)院研究生院學(xué)報(bào),2021(05):22-32+145.

      [12]張超義.能源網(wǎng)、交通網(wǎng)、信息網(wǎng):作為媒介的網(wǎng)絡(luò)型基礎(chǔ)設(shè)施與三網(wǎng)融合[J].全球傳媒學(xué)刊,2023,10(05):56-70.

      [13]Collier S J,Mizes J C,Von Schnitzler A. Preface:Public infrastructures/infrastructural publics[J/OL].(2016-07)[2024-05-18].https://limn.it/articles/preface-public-infrastructures-infrastructural-publics/.

      [14]劉戰(zhàn)偉.凸顯什么?遮蔽什么?——作為隱喻的“平臺”:連接、中介與基礎(chǔ)設(shè)施[J].新聞記者,2022(6):54-66.

      [15]束開榮.互聯(lián)網(wǎng)基礎(chǔ)設(shè)施:技術(shù)實(shí)踐與話語建構(gòu)的雙重向度——以媒介物質(zhì)性為視角的個(gè)案研究[J].新聞記者,2021(2):39-50.

      [16]殷琦,國秋華.從靜態(tài)機(jī)構(gòu)到動態(tài)功能:互聯(lián)網(wǎng)平臺的內(nèi)涵演變與治理轉(zhuǎn)向[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2023,45(04):135-142.

      [17]劉戰(zhàn)偉,劉潔.“平臺/platform”:一個(gè)概念史的溯源性研究[J].新聞與寫作,2023(8):70-82.

      [18]彭蘭.“數(shù)據(jù)化生存”:被量化、外化的人與人生[J].蘇州大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2022,43(02):154-163.

      [19]孫萍.如何理解算法的物質(zhì)屬性:基于平臺經(jīng)濟(jì)和數(shù)字勞動的物質(zhì)性研究[J].科學(xué)與社會,2019,9(03):50-66.

      [20]郭全中,張金熠.作為視頻世界模擬器的Sora:通向AGI的重要里程碑[J].新聞愛好者,2024(4):9-14.

      [21]郭全中,袁柏林.從GPT看AGI的本質(zhì)突破:傳媒業(yè)新挑戰(zhàn)與未來[J].新聞愛好者,2023(4):30-35.

      [22]Plantin J C,Lagoze C,Edwards P N,et al.Infrastructure studies meet platform studies in the age of Google and Facebook[J].New media & society,2018,20(1):293-310.

      [23]陳昌鳳,袁雨晴.智能新聞業(yè):生成式人工智能成為基礎(chǔ)設(shè)施[J].內(nèi)蒙古社會科學(xué),2024,45(01):40-48.

      [24]張妍,趙宇翔,吳大偉,等.人智交互情境中用戶對生成式人工智能的心智感知及反應(yīng)研究[J/OL].情報(bào)理論與實(shí)踐,1-12[2024-05-18].http://kns.cnki.net/kcms/detail/11.1762.G3.20240510.1836.002.html.

      [25]張?jiān)姮?,沈?Sora:傳媒生態(tài)的鏡像進(jìn)化與認(rèn)知變革[J/OL].編輯之友,1-8[2024-05-18].http://kns.cnki.net/kcms/detail/14.1066.G2.20240419.1104.002.html.

      [26]郭全中,蘇劉潤薇.大模型驅(qū)動下的傳媒再造[J].出版廣角,2024(3):4-12.

      作者簡介:郭全中,中央民族大學(xué)新聞與傳播學(xué)院教授,互聯(lián)網(wǎng)平臺企業(yè)發(fā)展與治理研究中心主任(北京 100081),江蘇紫金傳媒智庫高級研究員(南京 211199);蘇劉潤薇,中央民族大學(xué)新聞與傳播學(xué)院碩士生(北京 100081)。

      編校:王志昭

      正镶白旗| 樟树市| 丰台区| 涟水县| 永城市| 恭城| 宣威市| 辽中县| 昆山市| 桂林市| 娱乐| 大新县| 广西| 泗洪县| 克拉玛依市| 香河县| 甘洛县| 永丰县| 马边| 民勤县| 温州市| 赤峰市| 余江县| 宁明县| 普定县| 长葛市| 松滋市| 凤凰县| 山东省| 宁津县| 吕梁市| 奈曼旗| 图们市| 从化市| 上思县| 自贡市| 延安市| 安图县| 施秉县| 扎赉特旗| 囊谦县|