【摘 要】 ChatGPT-4的進(jìn)步技術(shù),特別是情感分析和關(guān)鍵字提取功能,對(duì)于構(gòu)建針對(duì)市場(chǎng)的GPT-ESG評(píng)估框架起到了關(guān)鍵作用。本項(xiàng)研究應(yīng)用ChatGPT-4的文本情感分析能力,對(duì)A股市場(chǎng)上市公司的公開(kāi)報(bào)告進(jìn)行了深入研究,這些報(bào)告包括但不限于可持續(xù)發(fā)展報(bào)告、ESG報(bào)告和財(cái)務(wù)報(bào)告中專注于分析公司治理、環(huán)境保護(hù)以及社會(huì)責(zé)任方面的內(nèi)容。研究結(jié)果顯示,ChatGPT-4生成的數(shù)據(jù)與國(guó)內(nèi)三大評(píng)級(jí)機(jī)構(gòu)的標(biāo)準(zhǔn)化評(píng)級(jí)結(jié)果高度相關(guān)且差異較小。通過(guò)運(yùn)用ChatGPT-4技術(shù)對(duì)A股上市公司進(jìn)行客觀而高效的評(píng)級(jí),不僅促使企業(yè)提供更加公正的報(bào)告,還為投資者在評(píng)估公司的環(huán)境、社會(huì)和治理(ESG)實(shí)踐以及投資決策方面提供了重要支持。這一研究成功展示了ChatGPT-4在金融領(lǐng)域應(yīng)用的潛力,特別是在促進(jìn)公平、透明的企業(yè)評(píng)估方面的重要作用。
【關(guān)鍵詞】 評(píng)級(jí)機(jī)構(gòu); 文本分析; 情感值; 機(jī)器學(xué)習(xí); 自然語(yǔ)言處理; ChatGPT; ESG
【中圖分類號(hào)】 F230 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1004-5937(2025)01-0087-07
一、引言
如今越來(lái)越多的企業(yè)和投資者開(kāi)始重視ESG的披露與評(píng)級(jí),但企業(yè)的ESG披露仍處于自愿階段,缺乏統(tǒng)一的行業(yè)信息披露標(biāo)準(zhǔn)。ESG強(qiáng)調(diào)對(duì)環(huán)境的關(guān)注,是有效推進(jìn)碳中和目標(biāo)的重要手段之一[1]。
截至2023年6月30日,A股貨幣金融業(yè)上市公司總數(shù)為44家,其中有43家公司發(fā)布了與環(huán)境、社會(huì)和公司治理(ESG)相關(guān)的報(bào)告,披露率達(dá)到97.73%[2]。目前國(guó)內(nèi)主流ESG評(píng)級(jí)機(jī)構(gòu)有華證、商道融綠和萬(wàn)得等。不同ESG評(píng)級(jí)機(jī)構(gòu)對(duì)同一家公司的ESG評(píng)級(jí)是存在差異的,同一家公司獲得不同ESG評(píng)級(jí)的情況后會(huì)對(duì)投資者釋放錯(cuò)誤的信號(hào),可能導(dǎo)致其作出不明智的投資決策。以貴州茅臺(tái)為例,2020年6月,由于其ESG績(jī)效,該公司在中證指數(shù)的評(píng)級(jí)為高“AA”,而從圣道綠色金融獲得的評(píng)級(jí)卻為低“C+”,使投資者感到困惑不解[3]。在數(shù)字經(jīng)濟(jì)時(shí)代,傳統(tǒng)的財(cái)務(wù)處理方式難以滿足企業(yè)管理的需求,需要一個(gè)更加統(tǒng)一、客觀的ESG評(píng)級(jí)標(biāo)準(zhǔn)來(lái)對(duì)A股上市的企業(yè)進(jìn)行評(píng)級(jí),ChatGPT的自動(dòng)化處理和語(yǔ)義理解等能力為財(cái)務(wù)人員提供了新的機(jī)會(huì),可以更好地優(yōu)化各種財(cái)務(wù)場(chǎng)景,提高財(cái)務(wù)處理的準(zhǔn)確性和效率[4]。因此,可以設(shè)想采用ChatGPT-4的新技術(shù)來(lái)完善A股上市企業(yè)的ESG評(píng)級(jí)體系,而這一設(shè)想的成功會(huì)使公司披露更加公正、客觀的可持續(xù)報(bào)告,增強(qiáng)投資者對(duì)公司的信心。
對(duì)話生成式預(yù)訓(xùn)練模型(Chat Generative Pre-trained Transformer,ChatGPT)的問(wèn)世無(wú)疑具有重要意義,其憑借精準(zhǔn)的語(yǔ)義理解、強(qiáng)大的語(yǔ)言表達(dá)和嚴(yán)密的邏輯思維,對(duì)新聞媒體、教育培訓(xùn)、客戶服務(wù)與支持、法律服務(wù)等行業(yè)都帶來(lái)了顯著影響[4]。ChatGPT-4的出現(xiàn)確實(shí)有可能顯著減少金融和會(huì)計(jì)研究人員在應(yīng)用最先進(jìn)的自然語(yǔ)言處理模型時(shí)面臨的技術(shù)障礙。ChatGPT-4的強(qiáng)大功能和用戶友好的交互方式,使得研究人員不再需要深入研究和開(kāi)發(fā)復(fù)雜的自然語(yǔ)言處理算法和模型,只需投入最少的技術(shù),便可直接使用ChatGPT-4來(lái)分析和處理金融和會(huì)計(jì)領(lǐng)域的文本數(shù)據(jù)[5]。這種轉(zhuǎn)變會(huì)極大地簡(jiǎn)化研究人員的工作流程,讓他們更輕松地處理大量文本數(shù)據(jù),更專注于解決金融和會(huì)計(jì)領(lǐng)域特定的問(wèn)題和迎接挑戰(zhàn),從而深入研究和探索新的課題,加速學(xué)術(shù)和商業(yè)研究的進(jìn)展。
二、文獻(xiàn)綜述
(一)ESG與利益相關(guān)者的影響
ESG涵蓋了多個(gè)方面,包括環(huán)境、社會(huì)和公司治理。在環(huán)境方面,主要關(guān)注資源枯竭和氣候變化等問(wèn)題;而治理方面則涉及董事會(huì)多樣性、商業(yè)道德和腐敗等方面的監(jiān)督與管理[3]。 et al.[6]提出通過(guò)企業(yè)社會(huì)責(zé)任或可持續(xù)報(bào)告中的ESG信息披露,投資者可能獲得比期望值更高的利潤(rùn)[7]。投資者主要使用ESG評(píng)級(jí)來(lái)評(píng)估公司商業(yè)模式的可持續(xù)性,并對(duì)其長(zhǎng)期目標(biāo)進(jìn)行評(píng)估[8]。除投資者之外,企業(yè)、研究人員甚至監(jiān)管者都依賴于ESG評(píng)級(jí)機(jī)構(gòu)來(lái)評(píng)估企業(yè)的ESG表現(xiàn)[3]。
ESG評(píng)級(jí)機(jī)構(gòu)更加關(guān)注從非財(cái)務(wù)角度考察企業(yè)的價(jià)值和社會(huì)影響,對(duì)企業(yè)的經(jīng)濟(jì)效益和社會(huì)效益進(jìn)行綜合評(píng)價(jià)。在“雙碳”目標(biāo)下,推動(dòng)生產(chǎn)和生活方式向綠色轉(zhuǎn)型可能在短期內(nèi)無(wú)法直接反映在企業(yè)的財(cái)務(wù)指標(biāo)上,這導(dǎo)致ESG評(píng)價(jià)的維度逐漸成為企業(yè)另一個(gè)重要的績(jī)效衡量標(biāo)準(zhǔn),對(duì)企業(yè)的估值和融資成本產(chǎn)生影響[9]。
通過(guò)ESG評(píng)價(jià),企業(yè)的各利益相關(guān)者可以通過(guò)閱讀企業(yè)的財(cái)務(wù)報(bào)告,了解企業(yè)的可持續(xù)發(fā)展情況,推動(dòng)企業(yè)履行社會(huì)責(zé)任[4]。優(yōu)秀的ESG表現(xiàn)有助于企業(yè)提升聲譽(yù),利用綠色金融產(chǎn)品降低融資成本,增強(qiáng)抗風(fēng)險(xiǎn)能力,進(jìn)而提高財(cái)務(wù)利潤(rùn)水平。政策和行業(yè)協(xié)會(huì)的引導(dǎo)也逐步將ESG投資打造成主流的投資方式[1]。
(二)ESG評(píng)級(jí)體系現(xiàn)狀
目前,ESG評(píng)級(jí)在財(cái)經(jīng)新聞、監(jiān)管和政策辯論、學(xué)術(shù)研究等方面具有顯著的影響,同時(shí)也成為投資實(shí)踐中備受關(guān)注的熱門(mén)話題。這些評(píng)級(jí)越來(lái)越多地在機(jī)構(gòu)投資者的投資決策中發(fā)揮著重要作用。
近期,不同的ESG評(píng)級(jí)提供商對(duì)同一家公司的評(píng)級(jí)差異引起了廣泛的關(guān)注。ESG評(píng)級(jí)差異較小的股票,其平均ESG評(píng)級(jí)與未來(lái)股票表現(xiàn)呈負(fù)相關(guān)關(guān)系;而ESG評(píng)級(jí)差異越高的公司,其股票收益越高[10]。因此,ESG評(píng)級(jí)差異影響企業(yè)的未來(lái)表現(xiàn)以及投資者的心理,而ESG評(píng)級(jí)差異是由不同的評(píng)級(jí)機(jī)構(gòu)采用不同的評(píng)級(jí)標(biāo)準(zhǔn)造成的。ESG評(píng)級(jí)差異對(duì)于學(xué)術(shù)研究結(jié)論的普適性具有重要影響,同時(shí)也為資產(chǎn)管理者在實(shí)施ESG投資策略時(shí)帶來(lái)了挑戰(zhàn)[10]。
在信息披露、績(jī)效評(píng)級(jí)和投資指導(dǎo)方面,ESG評(píng)級(jí)能夠?yàn)閷?shí)現(xiàn)“雙碳”目標(biāo)提供更為全面的評(píng)估框架。然而,目前仍面臨著ESG披露標(biāo)準(zhǔn)不貼近本土價(jià)值觀、缺乏有影響力的ESG評(píng)價(jià)體系以及ESG投資產(chǎn)品數(shù)量有限等挑戰(zhàn)[9]。ESG評(píng)級(jí)通過(guò)從不同的來(lái)源和報(bào)告標(biāo)準(zhǔn)收集和匯總信息,為投資者提供服務(wù),來(lái)源和報(bào)告標(biāo)準(zhǔn)這兩種差異解釋了為什么ESG評(píng)級(jí)之間的差異比信用評(píng)級(jí)之間的差異顯著得多,后者在99%的水平上相關(guān)[11]。
不同評(píng)級(jí)機(jī)構(gòu)對(duì)同一家企業(yè)的ESG評(píng)級(jí)結(jié)果是不同的。不同評(píng)分者之間的分歧對(duì)實(shí)證研究提出了挑戰(zhàn),因?yàn)槭褂貌煌u(píng)分者的評(píng)級(jí)結(jié)果可能會(huì)導(dǎo)致研究結(jié)果和結(jié)論的變化。在ESG評(píng)級(jí)方面的分歧會(huì)為基于這些評(píng)級(jí)作出的決策帶來(lái)不確定性,從而對(duì)廣泛的決策者構(gòu)成了挑戰(zhàn)[11]。
由于缺乏一致性,ESG評(píng)級(jí)的有效性受到了質(zhì)疑,可能會(huì)引發(fā)一系列不良后果:首先,評(píng)級(jí)差異可能會(huì)影響可持續(xù)投資決策的準(zhǔn)確性,給計(jì)劃將ESG維度納入投資策略的投資者帶來(lái)挑戰(zhàn),并導(dǎo)致資本市場(chǎng)的效率降低。ESG評(píng)級(jí)差異所帶來(lái)的不確定性可能會(huì)導(dǎo)致不確定性溢價(jià),以彌補(bǔ)額外的風(fēng)險(xiǎn),并阻礙ESG敏感型投資者參與市場(chǎng)。其次,評(píng)級(jí)差異可能會(huì)削弱企業(yè)提高ESG績(jī)效的動(dòng)力,因?yàn)閷⒋罅抠Y源用于導(dǎo)致評(píng)級(jí)模糊不清的活動(dòng)可能是沒(méi)有意義的。最后,ESG評(píng)級(jí)的差異可能會(huì)動(dòng)搖學(xué)術(shù)研究中數(shù)據(jù)分析的基礎(chǔ),導(dǎo)致結(jié)論的不一致[3]。
對(duì)于ESG評(píng)級(jí)的結(jié)果,不同機(jī)構(gòu)發(fā)布的ESG評(píng)級(jí)的有效性和一致性在實(shí)踐和研究中備受批評(píng)[3]。
(三)文本情感分析與ESG關(guān)鍵詞
在對(duì)文本信息中包含的ESG內(nèi)容進(jìn)行分析時(shí),通常會(huì)采用兩種方法:一是統(tǒng)計(jì)ESG關(guān)鍵詞在文本中的出現(xiàn)次數(shù),二是對(duì)文本中關(guān)于ESG的情感進(jìn)行分析,即ESG情感[5]。這些分析結(jié)果有助于推動(dòng)企業(yè)更好地履行社會(huì)責(zé)任,以及為投資決策提供更多的參考信息。
隨著人工智能技術(shù)的不斷進(jìn)步,以及心理測(cè)試的特性,例如其主觀性、被測(cè)者之間的差異以及被測(cè)者自身情緒波動(dòng)等因素,使得基于機(jī)器學(xué)習(xí)的心理測(cè)試情感分析成為一種有效的解決方法[12]。
文本情感分析,也稱為傾向性分析或意見(jiàn)挖掘,是處理和推理帶有感情色彩的主觀性文本的過(guò)程,以從中獲取情感、情緒或態(tài)度等信息為目標(biāo)。通過(guò)自然語(yǔ)言處理技術(shù)和機(jī)器學(xué)習(xí)算法,對(duì)文本進(jìn)行情感分類,將其劃分為正面、負(fù)面或中性情感等級(jí),進(jìn)行有監(jiān)督的機(jī)器學(xué)習(xí)[13]。通常,這項(xiàng)任務(wù)會(huì)被形式化為二元或多類分類問(wèn)題,即將情感類別標(biāo)簽分配給給定的文本[14]。
每個(gè)對(duì)話都被附加上一個(gè)情感標(biāo)簽,用于表示對(duì)話的情感傾向,即是積極的還是消極的[15]。這項(xiàng)技術(shù)在社交媒體監(jiān)測(cè)、市場(chǎng)調(diào)研和輿情分析等領(lǐng)域有廣泛的應(yīng)用。然而,從文本信息中提取情感值在技術(shù)上確實(shí)具有挑戰(zhàn)性。通常,這需要使用帶標(biāo)簽的數(shù)據(jù)集來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練好的模型可以用于對(duì)文本信息的情感值進(jìn)行判斷[5]。
而ESG評(píng)級(jí)與關(guān)鍵字的提取技術(shù)密切相關(guān)。兩個(gè)ESG評(píng)級(jí)之間的差異主要包括范圍、測(cè)量和權(quán)重的分歧[11]。范圍分歧源于兩個(gè)評(píng)分者考慮了不同的屬性集合。這兩個(gè)評(píng)分者使用不同的指標(biāo)來(lái)衡量相同的屬性,從而導(dǎo)致測(cè)量結(jié)果的差異。而權(quán)重分歧則是由于兩個(gè)評(píng)分者對(duì)同一指標(biāo)使用不同的權(quán)重進(jìn)行加權(quán)求和所引起的。測(cè)量散度的貢獻(xiàn)最大,占比為56%,其次是范圍散度和權(quán)重散度,分別占比為38%和6%。范圍和權(quán)重反映了ESG評(píng)級(jí)旨在衡量哪些因素,而測(cè)量則反映了如何進(jìn)行這些衡量[11]。正如Brandon et al.[10]所說(shuō)的,大部分的差異可以追溯到測(cè)量和范圍的不同,而權(quán)重的差異似乎起到了較小的作用。
(四)ChatGPT-4技術(shù)對(duì)ESG評(píng)級(jí)的設(shè)想
針對(duì)缺乏專業(yè)計(jì)算機(jī)編程背景的人來(lái)說(shuō),應(yīng)用機(jī)器學(xué)習(xí)模型通常具有挑戰(zhàn)性。然而,ChatGPT-4提供了一種通過(guò)多語(yǔ)言對(duì)話交互來(lái)完成任務(wù)的方法,消除了技術(shù)性深入研究課題的障礙,使得使用機(jī)器學(xué)習(xí)模型變得更加簡(jiǎn)單[5]。因此,即使是非專業(yè)人士也能夠輕松地利用ChatGPT-4的強(qiáng)大功能和用戶友好的交互方式,在更廣泛的應(yīng)用領(lǐng)域中使用機(jī)器學(xué)習(xí)模型,并將其推廣普及。
Cao et al.[5]進(jìn)一步研究發(fā)現(xiàn),ChatGPT-4技術(shù)可以解決文本情感分析、ESG關(guān)鍵詞分析等問(wèn)題。這是因?yàn)镃hatGPT擁有出色的語(yǔ)言理解能力,可以精準(zhǔn)地根據(jù)指令完成特定任務(wù),并展現(xiàn)出優(yōu)秀的可控文本生成能力,ChatGPT-4在生成所需關(guān)鍵字列表方面的效果非常好??梢允褂肁lphabet在2022年發(fā)布的可持續(xù)報(bào)告來(lái)評(píng)估ESG關(guān)鍵詞百分比和ESG情緒,ESG關(guān)鍵詞的數(shù)量可以調(diào)整為20個(gè)、50個(gè)甚至100個(gè)[5]。從結(jié)果來(lái)看,ChatGPT-4確實(shí)具備生成關(guān)鍵詞列表后,能夠根據(jù)這些關(guān)鍵詞來(lái)分析文本并生成與關(guān)鍵詞相關(guān)的情感值的能力[5]。
2022年華證ESG評(píng)級(jí)方法論[16]中提到,華證利用自然語(yǔ)言處理(NLP)技術(shù)和語(yǔ)義分析等方法,以算法為指標(biāo)分配值,這與ChatGPT分析文本的情感值有類似的算法邏輯[17]。所以考慮研究?jī)烧咧g的相關(guān)性,探討ChatGPT-4中新技術(shù)的發(fā)展?jié)摿?,以期未?lái)能直接運(yùn)用ChatGPT-4對(duì)企業(yè)的ESG進(jìn)行評(píng)級(jí)。研究結(jié)果表明,ChatGPT-4在對(duì)文本內(nèi)容進(jìn)行定量和邏輯分析方面具有高度準(zhǔn)確性和高效性。
三、實(shí)驗(yàn)數(shù)據(jù)及方法
(一)樣本選擇與數(shù)據(jù)來(lái)源
研究范圍專注于2022年12月進(jìn)行ESG評(píng)級(jí)的滬深A(yù)股上市公司。這樣的選擇源于綠色債券、ESG指數(shù)等綠色金融產(chǎn)品方面相對(duì)起步晚,以及ESG概念在近年才逐漸受到廣泛重視[4]。總計(jì)有710個(gè)公司觀測(cè)值。國(guó)內(nèi)三家評(píng)級(jí)機(jī)構(gòu)的數(shù)據(jù)來(lái)源于華證、商道融綠、萬(wàn)得數(shù)據(jù)庫(kù)。在研究中排除了以下情況:金融類公司;存在變量缺失的公司-年份。最終的樣本包括710家公司觀測(cè)值。
(二)數(shù)據(jù)處理
為保證所選數(shù)據(jù)的有效性和結(jié)果的準(zhǔn)確性,對(duì)選定樣本進(jìn)行了以下處理:在實(shí)驗(yàn)中對(duì)三家評(píng)級(jí)機(jī)構(gòu)的關(guān)鍵指標(biāo)進(jìn)行了重新處理。
而量化三家評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)標(biāo)準(zhǔn)都不同,許多學(xué)術(shù)研究的做法是,將KLD的優(yōu)勢(shì)和關(guān)注點(diǎn)分別總結(jié),并對(duì)可用的總優(yōu)勢(shì)和關(guān)注點(diǎn)數(shù)量進(jìn)行加權(quán),從而形成了一個(gè)范圍從-1到+1的規(guī)模。
參照Brandon et al.[10]的方法,為了確保不同評(píng)級(jí)提供者之間的可比性,進(jìn)行了如下工作:在每個(gè)時(shí)間點(diǎn),根據(jù)評(píng)級(jí)機(jī)構(gòu)對(duì)所有股票的評(píng)級(jí)結(jié)果,對(duì)這些股票進(jìn)行排名。接著,計(jì)算個(gè)別評(píng)級(jí)的特定百分位等級(jí),并將其作為經(jīng)過(guò)調(diào)整的分?jǐn)?shù)。使用排名的測(cè)度也更貼近投資者比較特定信號(hào)在公司信號(hào)中的排名值與其他公司信號(hào)中的排名值的實(shí)際投資做法。在存在關(guān)聯(lián)的情況下,為每家公司分配了平均排名。然后,對(duì)這些等級(jí)進(jìn)行標(biāo)準(zhǔn)化,使其范圍在-1到1之間,因?yàn)镃hatGPT文本情感分析的價(jià)值區(qū)間也在(-1,1)。由于本實(shí)驗(yàn)已經(jīng)將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,樣本中的原始變量就避免了將其在上下2%的水平上進(jìn)行縮尾(Winsorize)處理,也避免了極端異常值對(duì)結(jié)果的影響[5]。
此外,數(shù)據(jù)的標(biāo)準(zhǔn)化處理以及后續(xù)的差異分析可以借助ChatGPT這一工具來(lái)完成。ChatGPT可以幫助分析人員自動(dòng)地進(jìn)行數(shù)據(jù)清洗、標(biāo)準(zhǔn)化和轉(zhuǎn)換,從而避免無(wú)關(guān)信息對(duì)后續(xù)處理和分析造成干擾。具體來(lái)說(shuō),它可以實(shí)現(xiàn)去除HTML標(biāo)簽、特殊字符等操作,同時(shí)進(jìn)行文本分詞、大小寫(xiě)化、中英文互譯、正則表達(dá)式匹配等操作。ChatGPT還能夠識(shí)別和分析數(shù)字、文本、圖像和視頻等多模態(tài)內(nèi)容。它不僅可以處理文本數(shù)據(jù),還可以理解和處理其他類型的信息,為多領(lǐng)域的應(yīng)用提供支持
(三)生成情感價(jià)值
參考Cao et al.[5]的實(shí)驗(yàn)步驟,在ChatGPT-4中使用特定指令形成了20個(gè)關(guān)鍵字:1.可持續(xù)發(fā)展,2.氣候變化,3.碳足跡,4.可再生能源,5.綠色金融,6.企業(yè)社會(huì)責(zé)任,7.多樣性和包容,8.員工福利,9.供應(yīng)鏈管理,10.環(huán)境影響評(píng)估,11.社區(qū)發(fā)展,12.透明度,13.反腐敗,14.風(fēng)險(xiǎn)管理,15.數(shù)據(jù)保護(hù),16.能源效率,17.廢物減少,18.水資源管理,19.合規(guī)性,20.道德采購(gòu)。此20個(gè)關(guān)鍵字與3家ESG評(píng)級(jí)機(jī)構(gòu)的議題和二級(jí)指標(biāo)(基于本土三家評(píng)級(jí)機(jī)構(gòu)2022年的評(píng)級(jí)方法論)相對(duì)應(yīng)。
ChatGPT-4知道如何根據(jù)剛剛生成的ESG關(guān)鍵詞列表來(lái)分析文本并生成與關(guān)鍵詞相關(guān)的情感值。之后,使用2022年A股企業(yè)ESG披露報(bào)告來(lái)評(píng)估ESG情緒(圖2)。三家評(píng)級(jí)機(jī)構(gòu)都對(duì)華僑城(代碼:000069)有ESG評(píng)分的數(shù)據(jù)。2022年華僑城ESG報(bào)告的頁(yè)數(shù)為73頁(yè),沒(méi)有超過(guò)100頁(yè)(或者占用空間超過(guò)15MB),所以適用ChatGPT-4在2023年10月推出的“AskYourPDF”插件來(lái)進(jìn)行上傳并分析。
需要注意的是,這時(shí)候ChatGPT-4可能還會(huì)讓你再輸入一次已生成的20個(gè)關(guān)鍵字,根據(jù)提示一步步完成就可以得到報(bào)告的整體情緒值。
2023年11月8日之后,ChatGPT又進(jìn)行了更新,這次可以在不使用任何插件的前提下,在對(duì)話框中直接上傳PDF進(jìn)行分析,輸入的指令與上述指令相似:
“在-1到1的范圍內(nèi),其中-1非常負(fù)面,1非常正面,對(duì)于以上PDF文本,基于已生成各項(xiàng)關(guān)鍵字的情緒值分析,上述生成的ESG關(guān)鍵字列表的情感估計(jì)值(保留兩位小數(shù))是多少+_上傳PDF_(如果它給了一個(gè)范圍,需要在對(duì)話框中要求它輸入具體值)”。
ChatGPT-4生成了2022年某A股企業(yè)ESG披露報(bào)告的情緒值。由于ChatGPT-4目前還不能完美識(shí)別所有的PDF文本,某些文件含有大量亂碼或非標(biāo)準(zhǔn)文本字符,導(dǎo)致無(wú)法有效進(jìn)行文本解析或情感分析,因此采用了以下替代方法:
將篇幅超過(guò)50頁(yè)的可持續(xù)報(bào)告轉(zhuǎn)化為T(mén)XT(使用OCR識(shí)別),然后這些文本將被切割成片段、分別讓ChatGPT-4進(jìn)行分析,文本中與ESG無(wú)關(guān)的內(nèi)容將會(huì)被排除,整篇報(bào)告的最終情感值為上述所有剩余片段情感分析值的平均值。對(duì)話框中的指令如下:
_文本_+“在-1到1的范圍內(nèi),其中-1非常負(fù)面,1 非常正面,對(duì)于以上文本,上述生成的ESG關(guān)鍵字列表整體的情感估計(jì)值(保留兩位小數(shù))是多少。”
這些值介于-1到1之間,其中-1表示最負(fù)面,1 表示最正面。有些公司沒(méi)有可持續(xù)報(bào)告或者ESG報(bào)告,就用該公司2022年度報(bào)告中的“公司治理”“環(huán)境與責(zé)任”部分文本的情感值分析來(lái)替代,所有A股公司文本的處理都基于上述兩種方式。
此后,用相同的方法得出2022年710家A股企業(yè)可持續(xù)報(bào)告的關(guān)鍵字以及ESG披露報(bào)告的情緒值。之后再參考之前Liu[3]的做法,在ChatGPT的對(duì)話框內(nèi)將(-1,1)之間的情緒值標(biāo)準(zhǔn)化到(1,10)之間,這樣做是為了方便對(duì)數(shù)據(jù)進(jìn)行后續(xù)的分析。研究范圍和測(cè)量差異主要通過(guò)關(guān)鍵字的出現(xiàn)頻次以及ESG披露報(bào)告中情緒值的差異來(lái)進(jìn)行衡量。關(guān)鍵字差異是由企業(yè)報(bào)告中ESG關(guān)鍵字出現(xiàn)的頻次與ChatGPT生成ESG關(guān)鍵字列表的差異決定的。此處不考慮權(quán)重差異,所有結(jié)果均為均值。因?yàn)闄?quán)重差異對(duì)評(píng)級(jí)結(jié)果的作用較小,且不同機(jī)構(gòu)對(duì)于權(quán)重的設(shè)置也不同,后續(xù)也可以人為地設(shè)置權(quán)重,來(lái)縮小ChatGPT-4與傳統(tǒng)評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)差異。
(四)描述性和相關(guān)性統(tǒng)計(jì)分析
由于ChatGPT-4生成的僅僅是情緒值,而ChatGPT-4用于實(shí)驗(yàn)的最終生成值和國(guó)內(nèi)三家本土評(píng)級(jí)機(jī)構(gòu)的差異可以參考Berg et al.[11]的實(shí)驗(yàn)結(jié)果來(lái)體現(xiàn):
GPT score=38%Δscope+56%Δmeas+6%Δweig|ts (1)
其中,Δscope表示范圍差異,在ChatGPT中用關(guān)鍵字百分比來(lái)衡量;Δmeas表示測(cè)量差異,在ChatGPT中用情感值來(lái)衡量;Δweights在此不做討論。
表1中ratingagency1表示商道融綠標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值,ratingagency2表示萬(wàn)得標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值,ratingagency3表示華證標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值,GPT表示由公式1得出的GPTscore。上述數(shù)據(jù)的標(biāo)準(zhǔn)差將體現(xiàn)ChatGPT生成值和評(píng)級(jí)機(jī)構(gòu)的差異。
對(duì)ChatGPT生成的結(jié)果與三家評(píng)級(jí)機(jī)構(gòu)標(biāo)準(zhǔn)化后結(jié)果的相關(guān)性分析如表2。
(五)單因素方差分析
描述性統(tǒng)計(jì)分析和相關(guān)性統(tǒng)計(jì)分析已經(jīng)評(píng)估了數(shù)據(jù)的整體差異和關(guān)聯(lián)性。通過(guò)描述性統(tǒng)計(jì),可以了解數(shù)據(jù)的分布特性,包括中心趨勢(shì)和離散度。相關(guān)性分析則提供了不同變量間相互關(guān)系的量化評(píng)估。進(jìn)一步的,通過(guò)計(jì)算和比較組間變異(不同組之間的差異)與組內(nèi)變異(同一組內(nèi)部的差異),單因素方差分析(ANOVA)為本研究提供了判斷不同組平均數(shù)之間差異的統(tǒng)計(jì)顯著性的方法。本研究分別對(duì)ratingagency1、ratingagency2、ratingagency3和GPT生成的評(píng)級(jí)數(shù)值之間的差異進(jìn)行了顯著性檢驗(yàn),以便評(píng)估chatGPT-4的生成值和三家評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)數(shù)值是否存在統(tǒng)計(jì)學(xué)上的顯著差異。表3—表5是單因素方差分析的結(jié)果。
四、實(shí)驗(yàn)結(jié)論
從表1的結(jié)果來(lái)看,ChatGPT生成的均值和華證的評(píng)級(jí)結(jié)果最為接近,接近7.6,整體差異不大。再看表2的結(jié)果,GPT生成值和商道融綠標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值的相關(guān)系數(shù)為0.1167,p值<0.01,這表明商道融綠和GPT的生成值之間99%以上存在相關(guān)性;GPT生成值和萬(wàn)得標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值的相關(guān)系數(shù)為0.1105,p值<0.01,這表明萬(wàn)得和GPT的生成值之間99%以上存在相關(guān)性;GPT生成值和華證標(biāo)準(zhǔn)化后的評(píng)級(jí)數(shù)值的相關(guān)系數(shù)為0.0814,p值<0.05,這表明萬(wàn)得和GPT的生成值之間95%以上存在相關(guān)性。表3顯示卡方統(tǒng)計(jì)量(chi2)為8.2669,自由度為5,對(duì)應(yīng)的P值(Prob>chi2)為0.142。P值大于0.05,說(shuō)明沒(méi)有足夠的證據(jù)拒絕方差相等的零假設(shè),可以認(rèn)為不同組的方差是相等的。表4的卡方統(tǒng)計(jì)量為155.7114,P值為0.895。同樣的,沒(méi)有證據(jù)表明方差不相等。表5的卡方統(tǒng)計(jì)量為100.5448,P值為0.997,這也不支持方差不等的假設(shè)。因此,單因素方差分析再次說(shuō)明了GPT生成值和三家本土機(jī)構(gòu)的數(shù)值間差異較小。在整體差異較小且相關(guān)性較高的情況下提出的未來(lái)使用ChatGPT-4對(duì)ESG評(píng)級(jí)機(jī)構(gòu)進(jìn)行評(píng)級(jí)的設(shè)想是可行的。
同時(shí),用ChatGPT-4來(lái)對(duì)企業(yè)的ESG進(jìn)行評(píng)級(jí)也間接提高了企業(yè)可持續(xù)、ESG報(bào)告披露的客觀性。ChatGPT-4可以對(duì)不同的文本進(jìn)行情感分析,但這項(xiàng)研究的前提就是企業(yè)報(bào)告披露的全面性以及客觀性,如果兩家企業(yè)之間的報(bào)告GPT生成值差異不大但是現(xiàn)有的評(píng)級(jí)差異很大,那就可以合理懷疑該企業(yè)披露的報(bào)告不夠客觀公允。
五、貢獻(xiàn)及未來(lái)研究方向
(一)貢獻(xiàn)
投資于可持續(xù)實(shí)踐的公司表現(xiàn)出更強(qiáng)的財(cái)務(wù)業(yè)績(jī),從長(zhǎng)遠(yuǎn)來(lái)看,優(yōu)先考慮社會(huì)責(zé)任的公司實(shí)際上可以在經(jīng)濟(jì)上受益;與同行相比,擁有強(qiáng)大治理的公司擁有更高的股本回報(bào)率和更低的破產(chǎn)風(fēng)險(xiǎn)。更精確、客觀的ESG評(píng)級(jí)能夠更有效地幫助投資者進(jìn)行明智的投資決策。
若GPT提取關(guān)鍵字的相關(guān)性較高且情感賦分比較精確(精確度的衡量在于與評(píng)級(jí)機(jī)構(gòu)相關(guān)性較高且整體差異較?。?,那么未來(lái)人工智能領(lǐng)域的研究方向就可以是:對(duì)現(xiàn)有版本的ChatGPT-4做進(jìn)一步的升級(jí),讓投資者直接使用ChatGPT-4對(duì)企業(yè)ESG進(jìn)行評(píng)分:底層技術(shù)就是考慮現(xiàn)在的文本情感分析和關(guān)鍵字提取技術(shù),減少人為評(píng)級(jí)的主觀性。
總之,ChatGPT-4的總體影響還是積極樂(lè)觀的,它不會(huì)給金融和會(huì)計(jì)學(xué)術(shù)研究的未來(lái)帶來(lái)問(wèn)題,相反,它可能成為這些學(xué)科領(lǐng)域更廣泛、更深入地接受人工智能和機(jī)器學(xué)習(xí)技術(shù)新的推動(dòng)力。GPT的出現(xiàn)可能從心理學(xué)的角度開(kāi)始建立對(duì)人工智能和機(jī)器學(xué)習(xí)技術(shù)的接受共識(shí)。同時(shí),GPT-4的出現(xiàn)也顯著降低了機(jī)器學(xué)習(xí)在金融和會(huì)計(jì)領(lǐng)域應(yīng)用的技術(shù)門(mén)檻[5]。
(二)未來(lái)研究方向
ChatGPT-4的文本分析技術(shù)并不僅僅可以用來(lái)初步評(píng)判、質(zhì)疑企業(yè)ESG報(bào)告的客觀公允,還可以應(yīng)用于更多的披露信息,如年報(bào)、發(fā)行的債券評(píng)級(jí)報(bào)告等,進(jìn)一步規(guī)范金融市場(chǎng)。
(三)不足之處
ChatGPT的出現(xiàn)取代了大部分基層財(cái)務(wù)人員及ESG評(píng)級(jí)人員的工作,這將從整體上減少財(cái)務(wù)部門(mén)對(duì)于財(cái)務(wù)人員的需求,可能導(dǎo)致部分財(cái)務(wù)人員失業(yè)[4]。甚至多家評(píng)級(jí)機(jī)構(gòu)也會(huì)逐漸減少人為的評(píng)級(jí),變成人工智能進(jìn)行評(píng)級(jí)。因此,確保勞動(dòng)者能夠接受新技能培訓(xùn)并獲得新興產(chǎn)業(yè)的就業(yè)機(jī)會(huì)變得至關(guān)重要。最后,ChatGPT的發(fā)展也引發(fā)了對(duì)偏見(jiàn)和公平性的擔(dān)憂。與任何人工智能技術(shù)一樣,ChatGPT的訓(xùn)練數(shù)據(jù)可能存在偏差,影響其回應(yīng),并導(dǎo)致歧視問(wèn)題。因此,確保訓(xùn)練數(shù)據(jù)的多樣性以及在模型部署之前進(jìn)行偏差檢測(cè)變得至關(guān)重要[15]。在使用ChatGPT時(shí)應(yīng)當(dāng)謹(jǐn)慎,它似乎是一個(gè)有用的研究工具,可以用于生成初步草稿,但最終的草稿可能與ChatGPT的輸出有很大不同[18]。
ChatGPT的問(wèn)世對(duì)于數(shù)據(jù)安全帶來(lái)了雙刃劍的影響。一方面,從信息安全的角度來(lái)看,盡管OpenAI在開(kāi)發(fā)ChatGPT時(shí)已經(jīng)設(shè)定了積極的價(jià)值觀以預(yù)防其被用于惡意目的,但仍有網(wǎng)絡(luò)攻擊者可能繞過(guò)ChatGPT內(nèi)置的防濫用規(guī)則,借助ChatGPT來(lái)更輕易地編寫(xiě)惡意軟件代碼。另一方面,從信息安全的防御角度來(lái)看,ChatGPT可以為防御方提供安全咨詢,幫助他們了解最新的網(wǎng)絡(luò)安全威脅和漏洞,提供可行的建議。這可以幫助組織更好地應(yīng)對(duì)不斷變化的網(wǎng)絡(luò)安全挑戰(zhàn)[4]。
本研究聚焦于A股市場(chǎng)上市的企業(yè),涵蓋了眾多行業(yè)。要考慮各行業(yè)ESG評(píng)級(jí)的差異,就需引入行業(yè)月固定效應(yīng)和各項(xiàng)標(biāo)準(zhǔn)特征[10]。然而,截至目前,ChatGPT-4的分析尚未調(diào)整不同行業(yè)間的差異,因此本研究未涉及行業(yè)差異的調(diào)整。這也指出了ChatGPT-4未來(lái)實(shí)現(xiàn)更準(zhǔn)確評(píng)級(jí)的潛在發(fā)展方向之一。同時(shí),三家評(píng)級(jí)機(jī)構(gòu)的方法論每年都有所調(diào)整,本研究只能基于新的評(píng)級(jí)標(biāo)準(zhǔn)和可持續(xù)報(bào)告,無(wú)法進(jìn)行多時(shí)間維度的分析。此外,ChatGPT-4在分析時(shí)需經(jīng)歷多次訓(xùn)練和嘗試才能得出具體的情感值,這對(duì)分析的準(zhǔn)確性和用戶體驗(yàn)提出了挑戰(zhàn)。
此外,盡管GPT-ESG評(píng)級(jí)體系可以提供有價(jià)值的信息,但仍需謹(jǐn)慎對(duì)待其結(jié)果。由于自然語(yǔ)言處理技術(shù)的限制,評(píng)級(jí)結(jié)果可能會(huì)受到文本語(yǔ)境等因素的影響,因此仍需結(jié)合其他信息和專業(yè)判斷進(jìn)行綜合分析。如果因?yàn)殄e(cuò)誤的結(jié)果導(dǎo)致投資者作出錯(cuò)誤的決策,使得誰(shuí)應(yīng)該承擔(dān)這一錯(cuò)誤的責(zé)任成為一個(gè)值得質(zhì)疑的問(wèn)題,所以,法律層面應(yīng)該更加明確地界定問(wèn)責(zé)機(jī)制,以確保在這種情況下有明確的責(zé)任分配和追究機(jī)制。
因此,在運(yùn)用ChatGPT-4進(jìn)行文本情感分析、關(guān)鍵詞提取以及ESG評(píng)級(jí)的同時(shí),開(kāi)發(fā)者需要制定恰當(dāng)?shù)拇胧﹣?lái)最大限度地減少潛在的威脅,并充分挖掘其在信息安全防御方面的潛力,ChatGPT-4也需要不斷地進(jìn)行更新來(lái)適應(yīng)人們的需求。
【參考文獻(xiàn)】
[1] 錢(qián)燕珍.在促進(jìn)“雙碳”目標(biāo)下發(fā)揮ESG投資的思考[J].時(shí)代金融,2022(8):61-62,69.
[2] 黃宗彥.ESG評(píng)級(jí)領(lǐng)先市場(chǎng)超九成A股金融公司披露相關(guān)報(bào)告[N].每日經(jīng)濟(jì)新聞,2023-07-11(006).
[3] LIU M.Quantitative ESG disclosure and divergence of ESG ratings[J].Frontiers in Psychology,2022,13.
[4] 金源,李成智.ChatGPT對(duì)智能財(cái)務(wù)體系的影響:場(chǎng)景優(yōu)化、技術(shù)革新與人員轉(zhuǎn)型[J].財(cái)會(huì)月刊,2023(15):23-30.
[5] CAO Y,ZHAI J.Bridging the gap the impact of ChatGPT on financial research[J].Journal of Chinese Economic and Business Studies,2023,21(2):177-191.
[6] KOCMANOV?魣 A,DO■EKALOV?魣 M.Construction of the economic indicators of performance in relation to environmental,social and corporate governance (ESG) factors[J].Acta Universitatis Agriculturae et Silviculturae Mendelianae Brunensis,2013,60(4):195-206.
[7] ATAN R,ALAM Md M,SAID J,et al.The impacts of environmental,social,and governance factors on firm performance:panel study of Malaysian companies[R/OL].SocArXiv,2019[2024-01-11].
[8] 吳巍.“雙碳”目標(biāo)下的ESG評(píng)價(jià)體系[J].上海國(guó)資,2022(6):14.
[9] BRANDON R G,KRUEGER P,SCHMIDT P S.ESG rating disagreement and stock returns[Z].2019.
[10] BERG F,K?魻LBEL J F,RIGOBON R.Aggregate confusion:the divergence of ESG Ratings[J].Review of Finance,2022,26(6):1315-1344.
[11] ZHAI S,ZHANG Z.Semisupervised autoencoder for sentiment analysis[J/OL].Proceedings of the AAAI Conference on Artificial Intelligence,2016,30(1)[2024-01-11].
[12] 宋海燕.基于貝葉斯算法的心理測(cè)試情感分析[J].信息系統(tǒng)工程,2023(6):116-119.
[13] SUN X,DONG L,LI X,et al.Pushing the limits of ChatGPT on NLP Tasks[M/OL].arXiv,2023[2023-07-29].
[14] SAXENA D,KHANDARE S,CHAUDHARY S.An overview of ChatGPT:impact on academic learning[J].2023,1.
[15] WANG Z,XIE Q,DING Z,et al.Is ChatGPT a good sentiment analyzer?A preliminary study[M/OL].arXiv,2023[2023-07-29].
[16] 華證ESG評(píng)級(jí)方法論[Z].2022.
[17] MCGEE R W.Is ESG a bad idea? The chatgpt response[J/OL].SSRN Electronic Journal,2023[2023-
07-28].
[18] 陳安萍,趙雅■.ChatGPT對(duì)財(cái)務(wù)分析的影響及對(duì)策研究[J].會(huì)計(jì)之友,2023(16):156-封三.