李育輝,龐菊愛,譚北平
(1.中國人民大學(xué) 勞動人事學(xué)院,北京 100872;2.寧波大學(xué) 人文與傳媒學(xué)院,浙江 寧波 315211;3.明略科技 秒針營銷科學(xué)院,北京 100015)
科技的快速發(fā)展對經(jīng)濟(jì)和勞動技能都帶來深刻影響,進(jìn)而對就業(yè)和收入分配產(chǎn)生深遠(yuǎn)作用。人工智能的技術(shù)突破,一方面帶來勞動生產(chǎn)率的提高和社會分工體系的變革,另一方面也面臨著傳統(tǒng)勞動技能的替代和勞動力的釋放。已有的研究發(fā)現(xiàn),在解答各類復(fù)雜的學(xué)科考試、數(shù)學(xué)、編程等問題的能力上,生成式人工智能已被證實超越大多數(shù)人的水平。隨著人工智能在營銷策劃、廣告創(chuàng)意等更具復(fù)雜推理和創(chuàng)造需求上的任務(wù)表現(xiàn)越來越好,對于人工智能在創(chuàng)造力上能否超越人類引發(fā)了學(xué)者們的廣泛關(guān)注[1-2]。
關(guān)于創(chuàng)造力,心理學(xué)家進(jìn)行了豐富的研究,對其內(nèi)涵也存在一些不同的表述,例如Guilford(1950)認(rèn)為創(chuàng)造力是一種特殊能力,是人人都具備的能力,幾乎每個人都可能出現(xiàn)創(chuàng)造性行為[3];Lubart等(2004)和Sternberg(2006)認(rèn)為創(chuàng)造力是產(chǎn)生新穎且合適的產(chǎn)品和工作成果的能力[4-5];Csikszentmihalyi(1997)強(qiáng)調(diào)生物進(jìn)化和文化演化角度,認(rèn)為創(chuàng)造力是一個系統(tǒng)內(nèi)部個體、領(lǐng)域、范圍等因素相互作用的結(jié)果[6]。對創(chuàng)造力的實證研究揭示出其獨(dú)特性、新穎性、環(huán)境交互作用的一系列特征,是產(chǎn)生新思想、發(fā)現(xiàn)和創(chuàng)造新事物的能力。人工智能本質(zhì)是模擬人腦思維的過程,那么人工智能在創(chuàng)造力上的表現(xiàn)如何、能否替代人類進(jìn)行創(chuàng)新活動正成為重要的研究命題[7]。以最受沖擊的廣告營銷行業(yè)為例,人工智能在消費(fèi)市場分析、文案生產(chǎn)和創(chuàng)意廣告產(chǎn)生等領(lǐng)域已有諸多突破,作為廣告文案生產(chǎn)者(producer)的行業(yè)專家和作為接收者(receiver)的消費(fèi)者,這兩類群體如何感知和評判人工智能的能力對于了解人工智能創(chuàng)造力發(fā)展水平至關(guān)重要[8-9]。由此,圍繞廣告營銷行業(yè)人工智能創(chuàng)造力的水平展開研究,通過比較人工智能與人類在創(chuàng)造力上的水平差異,能夠在一定程度上回答人工智能對人力資本的可替代性問題,進(jìn)而在預(yù)測職業(yè)技能發(fā)展、消費(fèi)者認(rèn)知水平變化、社會分工變革等方面提供有參考性的建議。
技術(shù)發(fā)展讓人工智能在能力上有了較大發(fā)展,人工智能產(chǎn)品從傳統(tǒng)的“分析式人工智能”(Analytical AI)發(fā)展為“生成式人工智能”(Generative AI)后,以其強(qiáng)大的內(nèi)容生成能力和接近人類水平的“聰明”程度在人類世界帶來巨大震撼[10]。分析式人工智能的主要功能是對數(shù)據(jù)進(jìn)行學(xué)習(xí)和分析,以此來進(jìn)行預(yù)測、輔助用戶進(jìn)行判斷;以及通過學(xué)習(xí)來生成與訓(xùn)練數(shù)據(jù)不同的新數(shù)據(jù)給出解答。生成式人工智能的歷史原型可以追溯到20世紀(jì)60年代的聊天機(jī)器人Eliza,但直到2014年生成式對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)模型[11]的提出才開始了實質(zhì)性發(fā)展并能創(chuàng)造大段文字和圖片。OpenAI公司推出過一款基于GAN的圖形生成模型Dall-E2,以及Stability AI推出的Stable Diffusion模型,二者都能通過用戶簡短的文字描述迅速生成圖片。
生成式人工智能領(lǐng)域最大的突破來自“大型語言模型”(Large Language Models, LLM)[12]。2017 年,Transformer 架構(gòu)被提出,自然語言處理(Natural Language Processing,NLP) 模型的發(fā)展取得了突破。從此,很多企業(yè)都開始構(gòu)建自己的 LLM。其中,最有代表性的模型就是OpenAI的GPT系列。GPT的全稱是“生成式預(yù)訓(xùn)練”(Generative Pre-Training)模型,其采用的訓(xùn)練方法是自回歸算法,通過前面出現(xiàn)過的文字來推斷下文[13]。這種模式逐漸演變成一種通用人工智能技術(shù)。
生成式人工智能(如ChatGPT)憑借著對海量數(shù)據(jù)集的深度訓(xùn)練與學(xué)習(xí),通過完成“感知—理解—學(xué)習(xí)—行為—反饋—優(yōu)化”的閉環(huán)增加了早期人工智能所不具備的“理解力”和“綜合創(chuàng)造力”。2022年11月底,OpenAI上線智能對話系統(tǒng)ChatGPT3.5,引起巨大反響。ChatGPT3.5版本已經(jīng)擁有了超過1750億的模型參數(shù),這些模型參數(shù)的數(shù)量與生成式人工智能的學(xué)習(xí)能力呈正相關(guān),而人類擁有超過100萬億個用以存儲和傳播信息的突觸。2023年3月15日,OpenAI正式推出ChatGPT4.0。假設(shè)ChatGPT4.0能夠?qū)崿F(xiàn)100萬億的模型參數(shù)規(guī)模,意味著它將與人類大腦神經(jīng)觸點(diǎn)的規(guī)模相當(dāng),屆時則真正可以堪比人腦智能水平[14]。與此同時,中國的類似生成式人工智能產(chǎn)品也在陸續(xù)發(fā)布,包括百度文心一言(ERNIE Bot)、阿里通義千問、華為盤古和復(fù)旦大學(xué)的MOSS等。生成式人工智能徹底迎來了大爆發(fā)。
隨著生成式人工智能的發(fā)展,人工智能逐漸能夠完成繪畫、寫作、編程、譜曲等一系列復(fù)雜且需要創(chuàng)造能力的工作,圍繞人工智能與人類能力差距的一系列測試和研究也在如火如荼地推進(jìn)。根據(jù)2023年OpenAI的測試報告[15],ChatGPT4.0不僅在美國律師資格考試中擊敗了約90%的考生,在滿分1600分的SAT考試中獲得了1300分的成績,還在生物學(xué)、心理學(xué)、統(tǒng)計學(xué)、微積分、歷史等大學(xué)預(yù)修考試中都取得了滿分。生成式人工智能通過不斷提升自主的推理能力,已經(jīng)將對于通用問題的處理能力提升到了一個新的高度。用考試作為測試是一個非??陀^的方法,因為考試常常有標(biāo)準(zhǔn)答案或評分標(biāo)準(zhǔn),可以作為生成式人工智能解決知識性問題的良好評判標(biāo)準(zhǔn)。
除了對語言的掌握,以GPT-4為代表的人工智能還能解決跨越數(shù)學(xué)、編碼、視覺、醫(yī)學(xué)、法律、心理學(xué)等領(lǐng)域的新穎而困難的任務(wù),而不需要任何特殊的提示[16]。此外,在所有這些任務(wù)中,GPT-4的表現(xiàn)都驚人地接近人類水平,如要求它以一首詩的形式寫出素數(shù)的無限性證明,用TiKZ(一種在LATEX中創(chuàng)建圖形的語言)畫出一只獨(dú)角獸,用Python創(chuàng)建一個復(fù)雜的動畫,并解決一個高中水平的數(shù)學(xué)問題。它很容易地、快速地完成了所有這些任務(wù),并產(chǎn)生了與人類所能產(chǎn)生的結(jié)果基本沒有區(qū)別(甚至更好)的結(jié)果輸出。這些研究大多采用案例研究方式去證明人工智能確實能夠完成一系列令人驚艷的工作。
盡管學(xué)者還沒有對人工智能生產(chǎn)的圖像等多元化內(nèi)容進(jìn)行系統(tǒng)性研究,但已有大量現(xiàn)實案例證明生成式人工智能能夠取得與人類等同的藝術(shù)創(chuàng)造力產(chǎn)出。例如,2022年8月美國游戲設(shè)計師Jason Allen憑借一幅人工智能繪畫作品《太空歌劇院》,獲得了美國科羅拉多州博覽會美術(shù)競賽一等獎[17];在亞馬遜網(wǎng)站上甚至有系列人工智能輔助寫作的小說在售賣。當(dāng)然需要指出的是,在這些藝術(shù)與文學(xué)的創(chuàng)作中,是人類與人工智能協(xié)作逐步完成的,無法準(zhǔn)確區(qū)分人類和人工智能在其中的具體貢獻(xiàn)程度和創(chuàng)造力差異。
廣告營銷行業(yè)在使用人工智能來進(jìn)行人類營銷工作的探索上一直走在前列。過去人工智能更多扮演工具的角色:2017年阿里AI設(shè)計師魯班上崗,每秒制作8000張海報,設(shè)計水平接近人類專業(yè)設(shè)計師;2018年阿里AI智能文案上崗,1秒能產(chǎn)生2萬條文案,保量的同時還保質(zhì)。于是傳統(tǒng)的工作模式被改變,營銷人員可以通過生成式人工智能獲得初稿,并在此基礎(chǔ)上修改完善,從而更快速有效地完成工作。
創(chuàng)意是廣告營銷行業(yè)的核心能力[18],創(chuàng)意也可以被理解為創(chuàng)造力在廣告行業(yè)的具體體現(xiàn)。20世紀(jì)20年代開始,廣告開始成為一個獨(dú)立的學(xué)科門類,相應(yīng)的廣告從業(yè)者和廣告學(xué)者便開始探究創(chuàng)意的方法理論,包括USP理論、品牌形象理論、ROI理論、內(nèi)在戲劇性理論,并稱為四大創(chuàng)意理論[19]。這種創(chuàng)造力包括廣告相關(guān)的圖文生產(chǎn),也包括廣告文案策劃背后所體現(xiàn)的創(chuàng)新性、獨(dú)特性,以及對消費(fèi)者和商業(yè)目標(biāo)的多重洞察能力。
生成式人工智能作為一種通用人工智能技術(shù)擁有了圖文理解、圖文生成、以文生圖、以文生成音樂等更加復(fù)雜的多模態(tài)能力。ChatGPT憑借高度擬人化的對話方式,改變了人類思考和解決問題的方式,或?qū)㈩嵏残袠I(yè)的傳統(tǒng)生態(tài)。已有學(xué)者指出,無論是廣告營銷、劇本設(shè)計,還是創(chuàng)意寫稿等原本需要發(fā)揮人類才智的行業(yè),都將被ChatGPT重塑。
研究者對美國職業(yè)信息網(wǎng)絡(luò)中所覆蓋的1000多個職業(yè)進(jìn)行分析,發(fā)現(xiàn)有些工作原材料和產(chǎn)出大部分公開在網(wǎng)上,會被大模型預(yù)訓(xùn)練吸收,這類生成式大模型所能完成的職業(yè)日常被定義為“暴露”的工作活動;反之,工作原材料和成果如果長久保存在私域、不公開,就沒有“暴露”。研究發(fā)現(xiàn),越來越多“暴露”在人工智能下的工作活動和職業(yè)內(nèi)容將會被取代,一些職業(yè)如數(shù)學(xué)家、作家、新聞記者、金融定量分析員等甚至?xí)蝗斯ぶ悄芡耆〈?信息處理行業(yè)也表現(xiàn)出高暴露風(fēng)險[10]。有研究預(yù)測,隨著人工智能技術(shù)的加強(qiáng),全球?qū)?億個工作崗位被生成式人工智能取代,其中律師和行政人員等腦力勞動者受影響最大;但對體力要求較高的職業(yè)或戶外職業(yè)影響較小(如建筑和維修工作)。廣告營銷行業(yè)也是典型的腦力勞動者居多,可以想見該行業(yè)的從業(yè)人員的職業(yè)能力也被廣泛地暴露在生成式人工智能的能力范疇中。
可以預(yù)見的是,在生成式人工智能快速滲透進(jìn)社會運(yùn)轉(zhuǎn)機(jī)制的背景下,營銷行業(yè)將會掀起重大變革。那么,生成式人工智能在解決廣告營銷問題中的創(chuàng)意能力水平到底如何,回答這一問題有助于我們更好地應(yīng)對技術(shù)對行業(yè)生態(tài)的沖擊以及對人力資本的影響。廣告營銷問題,一直以來都是一個高度創(chuàng)意、高度整合的腦力問題,并沒有像能力考試一樣有標(biāo)準(zhǔn)答案,甚至解答的水平也需要通過代表生產(chǎn)者的專家以及代表接收者的消費(fèi)者進(jìn)行嚴(yán)謹(jǐn)規(guī)范的雙重評估。以各類廣告營銷獎項為例,通常采用的是系統(tǒng)專業(yè)評審團(tuán)對專業(yè)能力進(jìn)行評估,而企業(yè)在進(jìn)行文案創(chuàng)意評估和篩選時通常采用消費(fèi)者抽樣測試的方法。
由此,本文運(yùn)用實驗設(shè)計,圍繞人工智能創(chuàng)造力(廣告文案創(chuàng)作能力)進(jìn)行專家和消費(fèi)者的雙重視角比較研究,嘗試為營銷相關(guān)產(chǎn)業(yè)的技能變革、人才布局、人與智能協(xié)作模式提供依據(jù),同時也為廣告營銷專業(yè)的人才培養(yǎng)和專業(yè)設(shè)置提供有意義的參考。
根據(jù)當(dāng)前生成式人工智能的表現(xiàn),能夠體現(xiàn)廣告營銷行業(yè)里創(chuàng)造力的任務(wù)至少包括以下三種類型:一是廣告文案的創(chuàng)作,給出品牌信息和傳播需求,撰寫一定字?jǐn)?shù)的廣告文案;二是廣告創(chuàng)意的圖形設(shè)計,給出品牌信息和傳播需求,設(shè)計廣告創(chuàng)意的圖片;三是營銷數(shù)據(jù)的分析洞察,給出一組營銷相關(guān)的數(shù)據(jù),進(jìn)行數(shù)據(jù)的解讀分析。這三種類型的任務(wù),對應(yīng)著營銷行業(yè)實戰(zhàn)業(yè)務(wù)中極普遍的應(yīng)用場景和基本能力。通過專家小組訪談,綜合考慮任務(wù)輸入需求的明確性和輸出結(jié)果評估的難易程度,選擇“廣告文案創(chuàng)作能力”為本研究的目標(biāo)任務(wù)。
廣告文案作為廣告營銷的重要組成部分,是影響廣告效果的關(guān)鍵要素,文案創(chuàng)作能力也是廣告營銷人員的核心能力之一。陳培愛和閆琰(2020)針對現(xiàn)有企業(yè)對于新媒體廣告人才需求,研究得出廣告人才需具備的專業(yè)技能有文本、視頻制作與編輯、活動推廣、大數(shù)據(jù)分析、攝影與美術(shù)、計算機(jī)技術(shù)等[20]。倪琳等(2021)對企業(yè)中高管人員進(jìn)行問卷調(diào)查,發(fā)現(xiàn)當(dāng)前企業(yè)廣告人才需要的核心能力素質(zhì)為創(chuàng)意與策劃能力、文字表達(dá)與圖文編輯能力、視頻拍攝制作能力[21]。ChatGPT和文心一言作為大模型,學(xué)習(xí)了大量人類語言,眾多案例都表明其擁有良好的理解問題的能力和撰寫清晰完整易理解的文案的能力。可以看出,文案創(chuàng)作能力不僅是廣告營銷專業(yè)的一項基本能力,也正成為生成式人工智能(如ChatGPT,文心一言)的勝任能力。因此,進(jìn)行人工智能和人類的創(chuàng)造力對比研究,選擇文案創(chuàng)作能力,對比標(biāo)準(zhǔn)更明確,也更不易受視頻圖像等復(fù)雜信息的干擾。
以往的研究發(fā)現(xiàn),個體掌握的廣告知識越多,對廣告內(nèi)容和創(chuàng)意上的認(rèn)知差異越大。作為廣告創(chuàng)意生產(chǎn)者的專家群體和作為創(chuàng)意接收者的消費(fèi)者群體在廣告知識上顯然存在差異,因此對廣告營銷行業(yè)的創(chuàng)意文本感知也存在顯著不同[22]。本研究在比較人工智能和人類在廣告文案創(chuàng)作能力上的差異時,納入生產(chǎn)者和接收者的雙重視角,邀請行業(yè)專家和消費(fèi)者進(jìn)行評估。由此提出如下假設(shè):
假設(shè)1:專家和消費(fèi)者在對文案作者的識別上存在差異。
假設(shè)1a:在文案作者上,專家可以區(qū)分人工智能與人類文案。
假設(shè)1b:在文案作者上,消費(fèi)者對人工智能與人類文案的區(qū)分能力低于專家。
盡管在語言能力上沒有差異,但廣告文案不僅僅是一段文字,還需要有創(chuàng)造性,并且兼顧對消費(fèi)者的洞察以及商業(yè)的洞察。創(chuàng)造力是一種更加高級的能力,即使是人類,也需要大量的時間和實踐積累才能成為專業(yè)的文案撰寫者。有理由相信現(xiàn)階段人工智能的廣告文案創(chuàng)造力有所欠缺,并且最終在消費(fèi)者的體驗感知上也產(chǎn)生差異。在與人工智能的競爭中,人類可能還擁有創(chuàng)造力、有更強(qiáng)的共情能力、有更好的洞察能力等優(yōu)勢,這是整體專業(yè)能力的一部分。已有研究將文案專業(yè)能力分為清晰完整、容易理解、創(chuàng)造性、消費(fèi)者洞察、商業(yè)洞察五個維度,由此提出假設(shè)2:
假設(shè)2:在文案專業(yè)能力(清晰完整、容易理解、創(chuàng)造性、消費(fèi)者洞察、商業(yè)洞察)上,專家評價人工智能創(chuàng)作的文案低于人類文案。
消費(fèi)者是廣告文案的接收者,也是廣告文案生成者的洞察對象。研究表明,廣告中的語言表達(dá)方式會影響被試對產(chǎn)品的評價,創(chuàng)意的文字表達(dá)會帶來消費(fèi)者更積極的情緒和感知(Eisend, 2011)[23]?;谏鲜黾僭O(shè),人工智能創(chuàng)作的廣告文案在整體專業(yè)能力上弱于人類文案,那么提出假設(shè)3:
假設(shè)3:在消費(fèi)者感知水平上,人工智能創(chuàng)作的文案低于人類文案。
研究將采用雙盲實驗法進(jìn)行對比測試,被試(專家和消費(fèi)者)被隨機(jī)分到兩類文案組別(人類,人工智能)中,對文案的創(chuàng)作者進(jìn)行判斷,并且專家進(jìn)一步評價文案的專業(yè)能力,消費(fèi)者評價對文案的感受,然后對數(shù)據(jù)進(jìn)行統(tǒng)計分析。
為了比較人工智能與人類在市場營銷行業(yè)內(nèi)工作任務(wù)上創(chuàng)造力的差異,首先需要選定可用于比較的實驗材料。通過專家小組法選取2022年“中國大學(xué)生廣告藝術(shù)節(jié)學(xué)院獎”(以下簡稱學(xué)院獎)的品牌命題策略單作為真實的任務(wù)代表。這是因為該任務(wù)符合實驗要求,且發(fā)布時生成式人工智能的技術(shù)并未出現(xiàn),不會對人類的文案創(chuàng)作能力產(chǎn)生干擾。提取學(xué)院獎網(wǎng)站(1)學(xué)院獎網(wǎng)站https://www.5iidea.com/xyj。任務(wù)單中包括企業(yè)背景、品牌和產(chǎn)品介紹、廣告主題設(shè)定、傳播目標(biāo),整理后作為廣告文案的需求信息。最終由專家小組挑選其中10個廣告文案任務(wù)單作為任務(wù)列表,覆蓋7個行業(yè),分別是醫(yī)藥保健、美妝個護(hù)、服裝飾品、IP文化、交通工具、數(shù)碼產(chǎn)品、網(wǎng)服游戲,具有廣泛的營銷主流代表性。
針對10個廣告任務(wù),每一個廣告任務(wù)均設(shè)計兩水平實驗材料(人類文案×人工智能文案):
1.人類創(chuàng)作的文案20項。來自2022年在網(wǎng)站上公開的作品,不考慮獎項等級進(jìn)行隨機(jī)選擇。當(dāng)時生成式人工智能并未興起,可以認(rèn)為人類文案創(chuàng)作并沒有受到生成式人工智能的影響。
2.人工智能創(chuàng)作的文案20項。分別來自ChatGPT3.5產(chǎn)生的文案10項和文心一言產(chǎn)生的文案10項。將專家小組提取的任務(wù)單整理為符合人工智能平臺輸入的需求,控制在500字以內(nèi)撰寫一個文案。
示例:人工智能平臺所用的任務(wù)如下,以下提示語會直接輸入人工智能對話框中。
根據(jù)給出的信息,寫一段廣告語文案
要求:創(chuàng)作內(nèi)容需包含睫毛大燈以及雙A標(biāo)元素,需貼合“年輕、時尚、潮流”的產(chǎn)品策略定位,突出愛瑪女性時尚電動車的車輛特點(diǎn)和核心賣點(diǎn),易于用戶記憶。形式可以是三行情書,可以是視頻腳本或有趣段子,也可以是微小說,重點(diǎn)突出產(chǎn)品利益點(diǎn)和功能點(diǎn)。
以下是給出的信息
公司:愛瑪科技集團(tuán)
產(chǎn)品:愛瑪電動車露娜家族(VAVA為電自版)
廣告主題:娜不一Young煥彩青春(主題僅供參考,可自由發(fā)揮)
品牌調(diào)性:年輕、女性、時尚、色彩、潮流
傳播/營銷目的:與廣大大學(xué)生群體共創(chuàng),打造愛瑪電動車女性時尚的超級單品,以達(dá)成以下目標(biāo):
1.提升愛瑪品牌時尚化、女性化、年輕化的品牌形象。
2.強(qiáng)化品牌時尚基因符號(睫毛大燈、雙A標(biāo)),打造女性時尚電動車爆品創(chuàng)意。
然后隨機(jī)組合兩水平實驗材料(人類,人工智能),由編程人員呈現(xiàn)為在線評價問卷給到被試(專家,消費(fèi)者),編程人員和被試都不知道文案的具體作者是人類還是人工智能。具體實驗材料和測試文案見下列說明。(2)2023測試任務(wù)_人類文案與AI文案https://docs.qq.com/sheet/DUGFFamV2Y0dBV3RE。
專家被試:通過志愿者招募和專家遴選的方法獲取,一共60位專家,其中55%為高等院校的營銷相關(guān)專業(yè)老師,45%為營銷行業(yè)從業(yè)人員;42%為男性,58%為女性。平均年齡41.2歲,標(biāo)準(zhǔn)差8.8歲;平均從業(yè)年限為15.7年,77%在10年以上。
消費(fèi)者被試:通過秒針系統(tǒng)的專業(yè)調(diào)查樣本組進(jìn)行隨機(jī)抽樣,共1707名消費(fèi)者,其中32.5%為男性,67.6%為女性;平均年齡38.3歲,標(biāo)準(zhǔn)差9.9歲。
專家:參與的任務(wù)被隨機(jī)分為兩組,每位專家隨機(jī)參加一組,評價20個文案,共計1200次評價。專家在下面三項內(nèi)容上進(jìn)行評價:
(1)在作者身份上對廣告文案進(jìn)行評價,采用5等級評價,從1分至5分別對應(yīng)“肯定是人類”“可能是人類”“不確定”“可能是人工智能”“肯定是人工智能”。
(2)在專業(yè)能力維度上對廣告文案進(jìn)行評價。如表1所示,專業(yè)能力包含文案的清晰完整、容易理解、創(chuàng)造性、消費(fèi)者洞察、商業(yè)洞察這五個子維度。采用李克特5等級量表的方式進(jìn)行評價。
表1 文案專業(yè)能力評估表
(3)在等價工作年限上對廣告文案進(jìn)行評價。即對每個文案作者對應(yīng)的工作經(jīng)驗?zāi)晗捱M(jìn)行估計,從1年到10年,然后進(jìn)行平均分統(tǒng)計。
消費(fèi)者:隨機(jī)分配測試3—4個任務(wù),共獲得13720次消費(fèi)者對不同文案的評價。消費(fèi)者在下面兩項內(nèi)容上進(jìn)行評價:
(1)在作者身份上對廣告文案進(jìn)行評價,采用5等級評價,從1分至5分別對應(yīng)“肯定是人類”“可能是人類”“不確定”“可能是人工智能”“肯定是人工智能”。
(2)在效果感知上對廣告文案進(jìn)行評價,消費(fèi)者廣告文案效果感知量表來自譚北平使用的自編量表,包含3個維度9個子維度(見表2)。
表2 消費(fèi)者感知量表
表3 專家對于文案作者的分辨
使用SPSS26.0軟件,對數(shù)據(jù)進(jìn)行方差分析。將文案作者分辨力、專業(yè)能力評估整體及各維度、消費(fèi)者感知整體及各維度分別作為因變量;將任務(wù)以及文案作者(人類/人工智能)作為自變量,并納入兩者的交互作用;將專家的年齡、性別、教育及工作年限作為控制變量;將消費(fèi)者的年齡、性別及教育作為控制變量。
方差分析表明,專家對于文案作者是人類還是人工智能具有一定的分辨能力(p<0.001)。59%的情況下能正確區(qū)分(其中62%能正確區(qū)分人類文案,57%能正確區(qū)分人工智能文案),15%表示不確定,27%區(qū)分錯誤。當(dāng)然專家對于判斷的準(zhǔn)確度并沒有足夠的信心,大部分選擇“可能是”的選項。另外發(fā)現(xiàn),ChatGPT和文心一言的可分辨性并無顯著差異。
但是普通消費(fèi)者對于文案是人類撰寫還是人工智能撰寫無法分辨。人工智能文案被認(rèn)為人類撰寫(肯定是人類+可能是人類)的比例為55%,甚至略高于人類的文案53%。人工智能撰寫文案55%的情況下都被誤認(rèn)為人類撰寫,而人類文案卻只有53%被認(rèn)為是人類撰寫。由此可見,人工智能的文案確實已經(jīng)達(dá)到消費(fèi)者無法區(qū)分的狀態(tài),某種意義上來說是通過了文案的圖靈測試。
假設(shè)1得到驗證,專家大概率能夠分辨人工智能文案,而消費(fèi)者不能分辨。這說明在消費(fèi)者的感知里,人工智能文案至少在語言表達(dá)上達(dá)到了專業(yè)文案作家的能力水平。
從相匹配的工作年限來看,人類文案對應(yīng)的工作年限顯著高于人工智能。此處人類文案主要來自大學(xué)生的參賽作品,專家給出的等同工作經(jīng)驗為3.83年(標(biāo)準(zhǔn)差2.19年);而兩類人工智能(ChatGPT,文心一言)生成的文案對應(yīng)經(jīng)驗?zāi)晗逓?.47年(標(biāo)準(zhǔn)差1.58年)。專家評價人工智能文案的等同經(jīng)驗?zāi)陻?shù)顯著性低于人類文案,ChatGPT和文心一言的等同工作經(jīng)驗?zāi)晗逈]有顯著差異。
然后從文案的專業(yè)能力上進(jìn)行評價。首先,文案專業(yè)能力評價這五個維度具有高度一致性,模型的Cronbach’sα系數(shù)值為0.892。通過因子分析發(fā)現(xiàn)該五個維度在一個因子上。以五維度平均分作為文案專業(yè)能力評價。
以任務(wù)和文案作者(人類/人工智能)對各項專業(yè)能力進(jìn)行雙因素方差分析,在控制評價者專家的背景屬性后,任務(wù)以及文章作者(人類/人工智能)對于文案專業(yè)能力評價有顯著性影響,驗證了假設(shè)2。
圖1 人工智能與人類廣告文案專業(yè)能力對比
具體對比發(fā)現(xiàn),人類文案的專業(yè)能力顯著高于人工智能文案(p<0.001),包括ChatGPT和文心一言。ChatGPT和文心一言相比,二者在專業(yè)能力上沒有出現(xiàn)顯著差異。
分任務(wù)進(jìn)行方差分析發(fā)現(xiàn),在所有10個文案任務(wù)上,人類文案的專業(yè)能力得分都高于人工智能文案,在其中三個任務(wù)上存在顯著差異,這三個文案任務(wù)分別來自醫(yī)藥保健、美妝個護(hù)、數(shù)碼產(chǎn)品行業(yè)(見圖2)。
圖2 分任務(wù)文案的整體專業(yè)能力比較
圖4 人工智能與人類文案的消費(fèi)者整體感知比較
在各項文案專業(yè)能力維度上,專家對人類文案和人工智能文案的評價結(jié)果表明:人類文案和人工智能文案在“清晰完整”“容易理解”上的得分沒有顯著差異,不可區(qū)分;人工智能文案在“創(chuàng)造性”“消費(fèi)者洞察”和“商業(yè)洞察”上得分顯著低于人類文案(p<0.001),這說明人工智能在創(chuàng)意創(chuàng)新、處理復(fù)雜事務(wù)等更高層級能力上與人類仍存在差距(p<0.001)。
如表4和表7所示,與專家評價不同,消費(fèi)者在文案作者上不能區(qū)分人類文案和人工智能文案;對消費(fèi)者感知評價逐一使用雙因素方差分析,控制評價者(消費(fèi)者)的個人背景信息,發(fā)現(xiàn)消費(fèi)者在兩類文案的整體感知水平上沒有顯著差異,只有在傳遞維度(“容易理解”“相關(guān)性”“獨(dú)特性”)和認(rèn)同維度上(“信任”“喜歡”)存在顯著差異(p<0.01)。
表5 人工智能文案能力等同工作年限評估
表6 專業(yè)能力整體及分維度的方差分析結(jié)果
表7 人工智能與人類文案在消費(fèi)者感知上的方差分析
具體而言,人類文案與兩種人工智能文案在消費(fèi)者感知水平上得分極為接近;分不同任務(wù)來看,人類文案與人工智能文案相比,在少數(shù)任務(wù)上的表現(xiàn)比較好;但是多數(shù)任務(wù)并沒有顯著性感知差異,甚至對于一些任務(wù),消費(fèi)者對于人工智能文案感知更好。
細(xì)分到具體的消費(fèi)者感知子維度,人類文案在“容易理解”“相關(guān)性”上得分偏低,而在“獨(dú)特”“信任”以及“喜歡”上得分更高(p<0.01)。因此假設(shè)3得到部分驗證,整體上人工智能文案能夠提供與人類文案相似的體驗,但在具體的子維度上(獨(dú)特性、信任、喜歡)人工智能文案與人類文案相比仍存在不足。這或許與專家評價文案專業(yè)能力時人類“創(chuàng)造性”維度得分更高有關(guān)。但人類文案在子維度“容易理解”“相關(guān)性”上得分略低于人工智能文案,可能的原因是人工智能文案更加直接、明了,讓消費(fèi)者感知到的信息更加清晰。
統(tǒng)計40個文案的專家評價和消費(fèi)者評價各維度得分進(jìn)行相關(guān)分析,如表8所示,專家評價的文案專業(yè)能力綜合得分與消費(fèi)者感知的綜合得分高度相關(guān)(r=0.480,p<0.01)。這說明專家對文案專業(yè)能力維度的評價能夠顯著預(yù)測消費(fèi)者對文案的感知水平。專業(yè)能力各子維度上存在差別,其中的“清晰完整”維度的相關(guān)性最高。這一結(jié)果可以解釋人類文案在專家評價體系上呈現(xiàn)出更高的創(chuàng)造性,同時在消費(fèi)者感知上獲得較高“獨(dú)特性”“信任”及“喜歡”的評價。這揭示出當(dāng)下人類在創(chuàng)新創(chuàng)意能力上的不可替代性。
學(xué)者指出,生成式人工智能憑借著對海量數(shù)據(jù)的深度訓(xùn)練與學(xué)習(xí),已具備基本的理解力和綜合創(chuàng)造力[24]。本研究的結(jié)論也支持了這一判斷。采用雙盲實驗,通過專家和消費(fèi)者雙重視角去評價人工智能和人類在廣告文案創(chuàng)作能力上的差異,結(jié)果發(fā)現(xiàn)雖然部分專家還能分辨人類文案與人工智能文案,但消費(fèi)者已然無法對二者進(jìn)行區(qū)分。隨著人工智能的不斷迭代,尤其是專業(yè)型廣告文案創(chuàng)作人工智能的升級,人工智能作品與人類作品將更加難以區(qū)分。本研究發(fā)現(xiàn)無論是ChatGPT還是文心一言,都能如同人類一樣“讀懂”數(shù)百字的需求,并給出切題且有效的文案,所創(chuàng)作的文案在消費(fèi)者感知維度“容易理解”和“相關(guān)性”上表現(xiàn)優(yōu)異,甚至獲得比人類文案更好的感知評價。這說明人工智能在文案撰寫能力上的發(fā)展水平已接近受過專業(yè)訓(xùn)練的人類的能力表現(xiàn)。
在文案的專業(yè)能力表現(xiàn)上,專家評價人類文案得分顯著高于人工智能,特別是在創(chuàng)造性和洞察能力上。這說明人類目前還擁有創(chuàng)造力的智力高地。即使是詢問ChatGPT,人工智能也認(rèn)可創(chuàng)造力和對人情感的洞察是人工智能難以取代的能力[25]。一個可能的原因是人工智能創(chuàng)作的底層依據(jù)是歷史數(shù)據(jù),這決定了人工智能更善于歸納,而創(chuàng)作廣告文案更需要在歸納的基礎(chǔ)上演繹出新意,至少是微創(chuàng)新;加上人工智能創(chuàng)作基于數(shù)據(jù)、理性,對人性、心理、感受等因素理解不透徹,缺少共情能力,這就使得人類在感性創(chuàng)意能力尤其在創(chuàng)作高質(zhì)量的品牌形象廣告文案上仍具有優(yōu)勢。
研究還發(fā)現(xiàn)當(dāng)下人工智能的文案創(chuàng)作能力等同人類經(jīng)驗?zāi)晗逓?.47年,與人類存在1.36年的經(jīng)驗差距。看似人類存在一定的專業(yè)優(yōu)勢,但是考慮到人類專業(yè)能力提升速度可能會遠(yuǎn)遠(yuǎn)低于人工智能的提升速度,或許在不久的將來人類在這項能力上的領(lǐng)先優(yōu)勢就會消失。學(xué)者認(rèn)為,隨著生成式人工智能的技術(shù)發(fā)展,人工智能的能力,特別是創(chuàng)造力必將進(jìn)一步提升,未來超越人類或?qū)⒊蔀楝F(xiàn)實[26]。這種創(chuàng)造力一方面可能來自生成式人工智能的能力“涌現(xiàn)”,也就是人工智能出現(xiàn)的出乎意料的新行為和功能,這些行為可能與初始訓(xùn)練目標(biāo)無關(guān);另一方面可能來自人類輸入的任務(wù)提示的詳細(xì)程度,輸入人工智能的任務(wù)越詳細(xì)、越明確,人工智能的產(chǎn)出越有創(chuàng)造力,這也被稱為“提示詞工程”[15]。
研究對于廣告營銷行業(yè)的人才培養(yǎng)提供了重要的參考意義。隨著越來越多工作內(nèi)容“暴露”在人工智能學(xué)習(xí)范圍內(nèi),相當(dāng)多的職業(yè)會被取代。站在廣告營銷專業(yè)的發(fā)展角度,高校一方面要加快創(chuàng)新步伐,拉大人類與人工智能在創(chuàng)造力上的差距;另一方面要積極擁抱人工智能,構(gòu)建AI+營銷廣告類專業(yè)新模式,重塑基于人工智能深入滲透背景下的營銷廣告人才育人目標(biāo),重新設(shè)置培養(yǎng)方案。在培養(yǎng)核心專業(yè)能力的前提上,重點(diǎn)抓住人性與人工的關(guān)鍵區(qū)隔點(diǎn),培育學(xué)生在利用人工智能技術(shù)的基礎(chǔ)上,張揚(yáng)人性的光輝,培育原生審美能力、原生資源整合能力、社會共情能力、講故事能力、玩的能力和意義感,成為能夠管理人工智能、讓品牌與消費(fèi)者產(chǎn)生更好鏈接的營銷廣告人。
作為“通用目的技術(shù)”,生成式人工智能會對經(jīng)濟(jì)社會帶來深刻影響。人智協(xié)同(人類與人工智能共同工作)將成為營銷行業(yè)主流。隨著人工智能在營銷領(lǐng)域的擴(kuò)散,營銷生態(tài)正在被重構(gòu)。人工智能會迭代出更為復(fù)雜的模式,其效率會不斷提升,會生產(chǎn)出更多更新的廣告產(chǎn)品,演化出新的營銷流程,讓廣告營銷更精準(zhǔn)、更高效、更個性化,廣告作品源源不斷,從而重新配置營銷企業(yè)之間的競爭優(yōu)勢。
人工智能會對既有的社會分工體系以及現(xiàn)有工作方式產(chǎn)生重大沖擊,隨之對就業(yè)市場產(chǎn)生影響,會讓采用舊技術(shù)的人失去工作,又會產(chǎn)生新的就業(yè)崗位如首席人工智能官(CAIO)、AIGC作品加工師、AI訓(xùn)練師等。由于人工智能的高效率與可以24小時工作的不間斷節(jié)奏特性,人工智能給營銷產(chǎn)業(yè)帶來的“技術(shù)性失業(yè)”會占主導(dǎo)地位??深A(yù)見的營銷行業(yè)場景是,少量人類帶領(lǐng)多個人工智能助手即可完成需要一個大團(tuán)隊才能完成的復(fù)雜營銷任務(wù)。這一點(diǎn)在針對企業(yè)家的調(diào)查中也得到了支持,來自調(diào)查平臺Pollfish對1000家美國企業(yè)領(lǐng)導(dǎo)者關(guān)于ChatGPT對職場的影響調(diào)查結(jié)果顯示[27],49%的企業(yè)目前正在使用ChatGPT,30%計劃開始使用,48%的企業(yè)使用ChatGPT取代了員工,25%的企業(yè)通過使用ChatGPT已經(jīng)節(jié)省了超過7.5萬美元,93%的企業(yè)表示將計劃擴(kuò)大對ChatGPT的使用范圍,90%的企業(yè)表示會使用ChatGPT對求職者來說是一項有益的技能。
人工智能可以圍繞消費(fèi)者的旅程展開更有效率的服務(wù)。廣告媒介發(fā)展的一個趨勢是場景化[28],人們處于不斷變化的場景之中,用戶和媒介之間的接觸變得更加多樣化,而且往往具有偶然性。生成式人工智能本身能夠讓企業(yè)或廣告媒介創(chuàng)造性地將廣告信息融入用戶與媒介接觸的移動場景中,通過對場景和用戶需求的感知而生成個性化的廣告和內(nèi)容,整合周圍環(huán)境的刺激和強(qiáng)化,激發(fā)潛在消費(fèi)者對品牌的強(qiáng)烈興趣和渴望。喻國明(2014)早就提出廣告商、媒介、用戶之間需要更加私人化、自然縫合的溝通方式,以取得廣告主營銷效果、媒體商業(yè)化、用戶體驗三方皆贏的局面[29],如今在生成式人工智能的加持下將變成現(xiàn)實[30]。
人工智能可以更加規(guī)模化地實現(xiàn)人機(jī)耦合。創(chuàng)意的生產(chǎn)效率是提高廣告效果的重要工具[31],在過去創(chuàng)意生產(chǎn)的新方式主要是用程序化創(chuàng)意來體現(xiàn),需要建立獨(dú)立的動態(tài)創(chuàng)意優(yōu)化和程序化廣告創(chuàng)意系統(tǒng)。而在生成式人工智能的加持下,程序化創(chuàng)意的模式將再度被顛覆,變成任何人、任何系統(tǒng)都可以接入的通用能力。這種更強(qiáng)的聯(lián)通性將帶來更無縫的人智協(xié)同。以文案為例,秦雪冰和郭博(2022)曾基于消費(fèi)者感知參與度和行動參與度對智能廣告文案進(jìn)行測量,發(fā)現(xiàn)智能廣告文案在消費(fèi)者感知參與度和行動參與度上都優(yōu)于傳統(tǒng)廣告文案[32],其原因在于大規(guī)模個性化是智能廣告文案優(yōu)于傳統(tǒng)廣告文案的根本原因,人機(jī)耦合是智能廣告文案的機(jī)制保障。
廣告營銷行業(yè)是直面人工智能影響的第一陣營行業(yè),其變革迅速而深刻。本次研究聚焦在廣告文案創(chuàng)作能力上進(jìn)行人工智能與人類的比較研究,未來可以在視覺創(chuàng)意、數(shù)據(jù)分析、消費(fèi)者行為洞察等更需要人類深度能力的領(lǐng)域進(jìn)行測試。
生成式人工智能的強(qiáng)大功能表明,在未來善于使用人工智能的員工將會更受企業(yè)的歡迎,因此有必要圍繞人智協(xié)同的新模式展開研究。人類與人工智能的協(xié)同也有多種模式,助手模式、同伴模式、小組模式、多輪協(xié)作模式等,這些人類與人工智能的新協(xié)作模式需要被驗證能否帶來更好的創(chuàng)造力、更高的工作效率、更積極的工作體驗,等等。這類研究不僅能夠指導(dǎo)廣告營銷行業(yè)的發(fā)展,對其他需要腦力勞動的行業(yè)都具有極高的借鑒性。人智交互模式的發(fā)展,會迅速影響到各行各業(yè)的人才培養(yǎng)、人才供給、國際協(xié)作模式等方面,進(jìn)而對我國的就業(yè)結(jié)構(gòu)優(yōu)化和人才高質(zhì)量發(fā)展提供有力支撐。
(致謝:感謝寧波大學(xué)人文與傳媒學(xué)院研究生朱詩琪、高宇航、鄭雨蛟在研究中的文獻(xiàn)整理支持;感謝秒針系統(tǒng)王云、楊菲等的執(zhí)行支持;感謝60位高校老師與行業(yè)專家的調(diào)查評估支持。)