劉政昊 曾 曦 張志劍
(1.武漢大學(xué)信息管理學(xué)院,武漢,430072; 2.武漢大學(xué)大數(shù)據(jù)研究院,武漢,430072; 3.武漢大學(xué)信息資源研究中心,武漢,430072)
近年來(lái),隨著經(jīng)濟(jì)全球化進(jìn)程的加速,金融系統(tǒng)的風(fēng)險(xiǎn)敞口也日益增大,各種金融突發(fā)事件層出不窮[1], 并進(jìn)一步動(dòng)態(tài)演化[2]。 習(xí)近平總書(shū)記在黨的十九大報(bào)告中指出,打好防范化解重大風(fēng)險(xiǎn)攻堅(jiān)戰(zhàn),重點(diǎn)是防控金融風(fēng)險(xiǎn)[3]。 金融突發(fā)事件本質(zhì)是系統(tǒng)性金融風(fēng)險(xiǎn)積累到一定程度并惡化外向表現(xiàn)的危險(xiǎn)形式[4],一旦應(yīng)對(duì)分析處置不當(dāng)可能會(huì)導(dǎo)致風(fēng)險(xiǎn)級(jí)聯(lián)放大效應(yīng)的產(chǎn)生,引發(fā)金融市場(chǎng)大幅震蕩、貨幣大幅貶值、國(guó)民經(jīng)濟(jì)衰退等嚴(yán)重后果。 因此,及時(shí)發(fā)現(xiàn)和分析金融突發(fā)事件及其演化機(jī)理,并加快建立和完善金融機(jī)構(gòu)突發(fā)事件應(yīng)急管理體系,對(duì)于及時(shí)開(kāi)展風(fēng)險(xiǎn)管控和應(yīng)急管理工作、維護(hù)金融市場(chǎng)的穩(wěn)定具有重大作用。
當(dāng)前,我國(guó)關(guān)于金融突發(fā)事件演化分析及其應(yīng)急管理的研究仍處于探索階段,研究?jī)?nèi)容大多聚焦于國(guó)內(nèi)外突發(fā)公共事件對(duì)金融市場(chǎng)的影響[5-8]或針對(duì)特定的金融突發(fā)事件進(jìn)行風(fēng)險(xiǎn)案例分析與經(jīng)驗(yàn)總結(jié)[9-13]。 然而大數(shù)據(jù)背景下,傳統(tǒng)以專(zhuān)家為主的突發(fā)事件分析與決策難以處理海量的數(shù)據(jù),現(xiàn)有研究未能從數(shù)據(jù)驅(qū)動(dòng)的視角對(duì)事件演化機(jī)理進(jìn)行研討,尚未建立起較為成熟的系統(tǒng)性與全局性研究體系。 另外,突發(fā)事件涉及的主體和影響因素眾多、事件衍生和次生性明顯且演化機(jī)理復(fù)雜,導(dǎo)致常規(guī)的應(yīng)急管理措施正面臨嚴(yán)峻的挑戰(zhàn)和壓力。 因而,如何運(yùn)用合理有效的方法發(fā)現(xiàn)分析金融突發(fā)事件的演化機(jī)理成為了學(xué)術(shù)界關(guān)注的焦點(diǎn)。 鑒于此,本研究以知識(shí)驅(qū)動(dòng)的事件關(guān)聯(lián)與演化為切入點(diǎn),在借鑒突發(fā)事件應(yīng)急管理方法的基礎(chǔ)上,利用融合客觀知識(shí)與事理邏輯的“事理知識(shí)圖譜”,探討分析金融市場(chǎng)突發(fā)事件的發(fā)展演化規(guī)律,并對(duì)建立金融突發(fā)事件的應(yīng)對(duì)措施和應(yīng)急管理體系提供相應(yīng)的對(duì)策與建議,從而為金融突發(fā)事件建模、分析與全流程管理提供新的研究視角和方法。
《國(guó)家金融突發(fā)事件應(yīng)急預(yù)案》規(guī)定,金融突發(fā)事件是指突然發(fā)生的、無(wú)法預(yù)期或難以預(yù)期的、嚴(yán)重影響或可能影響金融穩(wěn)定、需要立即處置的事件[14];而金融應(yīng)急管理主要關(guān)注風(fēng)險(xiǎn)成因、演化與傳導(dǎo)路徑及其對(duì)金融業(yè)及經(jīng)濟(jì)社會(huì)造成的損失,以便及時(shí)提供合理的應(yīng)急措施與金融服務(wù)[15]。 目前關(guān)于金融突發(fā)事件及其應(yīng)急管理的相關(guān)研究并不多見(jiàn),早期研究多從宏觀視角出發(fā),重點(diǎn)研究各類(lèi)突發(fā)事件發(fā)生后金融行業(yè)的應(yīng)急管理機(jī)制[11,16-17],但并未關(guān)注金融突發(fā)事件本身。 突發(fā)事件應(yīng)急管理是一項(xiàng)系統(tǒng)工程[18],要實(shí)現(xiàn)有效應(yīng)對(duì)突發(fā)事件,將損失減到最小,首先需要對(duì)突發(fā)事件及其演化機(jī)理等有充分認(rèn)識(shí)[19]。 李綱等[20]認(rèn)為,突發(fā)事件演化問(wèn)題的核心在于利用關(guān)聯(lián)性對(duì)其動(dòng)態(tài)特征的捕捉和分析,這種關(guān)聯(lián)關(guān)系意味著網(wǎng)絡(luò)分析與社會(huì)管理存在結(jié)合。 重大金融突發(fā)事件作為一種客觀現(xiàn)象,各要素間具有豐富的邏輯鏈條,在事件的動(dòng)態(tài)演化分析中引入具有關(guān)聯(lián)特性的網(wǎng)絡(luò)結(jié)構(gòu),能夠清晰地刻畫(huà)突發(fā)事件的關(guān)聯(lián)邏輯及其演化過(guò)程,挖掘突發(fā)事件驅(qū)動(dòng)傳導(dǎo)鏈路,便于事后總結(jié)規(guī)律與管理預(yù)案建設(shè)。 近年來(lái)提出的“事理圖譜(Event Logical Graph)”作為一種以“事件”為描述核心、揭示事件之間的演化邏輯關(guān)系的復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)和可視化技術(shù),在面向突發(fā)事件的演化分析與應(yīng)急管理中具有明顯的優(yōu)勢(shì)。
事理圖譜這一概念最早由劉挺教授在2017年中國(guó)計(jì)算機(jī)大會(huì)上提出,與知識(shí)圖譜(Knowledge Graph)相比,事理圖譜更注重對(duì)事件之間順承關(guān)系、因果關(guān)系、條件關(guān)系和上下位等事理邏輯的刻畫(huà)[21],知識(shí)圖譜回答的是“是什么”的問(wèn)題,而以“事”為核心的事理圖譜回答的是“為什么”的問(wèn)題,因而事理圖譜不僅可以幫助人們快速掌握事件的變化方向,還有助于挖掘事件的發(fā)展規(guī)律,判斷事件的未來(lái)發(fā)展情況。 近年來(lái),國(guó)內(nèi)外關(guān)于事理圖譜的研究方興未艾,如Li等[22]和Yang等[23]構(gòu)建了事件演化圖(Event Evolutionary Graph,EEG),用以揭示事件間的演化模式和發(fā)展邏輯;寥闊[24]運(yùn)用端到端的事件因果關(guān)系抽取、常識(shí)信息增強(qiáng)的事件表示學(xué)習(xí)以及數(shù)據(jù)驅(qū)動(dòng)的因果關(guān)系強(qiáng)度計(jì)算等關(guān)鍵技術(shù),構(gòu)建了面向金融領(lǐng)域的事理圖譜;國(guó)內(nèi)學(xué)者夏立新等[25]以“奔馳女車(chē)主維權(quán)”事件為例,對(duì)微博輿情的熱度與演化路徑進(jìn)行分析,并通過(guò)事件抽取技術(shù)抽取輿情子事件,完成事理圖譜構(gòu)建同時(shí)生成可視化時(shí)間摘要;單曉紅[26]、龐世紅等[27]則基于構(gòu)建的抽象事理圖譜,依據(jù)事件演化方向和概率大小,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情事件的演化路徑分析和預(yù)測(cè)。
可見(jiàn),事理圖譜的構(gòu)建方法已較為成熟,并在針對(duì)網(wǎng)絡(luò)輿情的演化分析中得到了較好的應(yīng)用,但“事件”與“輿情”二者存在一定的區(qū)別。“輿情”文本相較于“事件”文本規(guī)范性較差、價(jià)值稀疏性更為明顯,但邏輯簡(jiǎn)單、易于識(shí)別與抽??;而“事件”文本中則包含著施事者、受事者等要素和角色信息,事件間的關(guān)聯(lián)更為復(fù)雜。 由于金融領(lǐng)域的特殊性和金融突發(fā)事件的高度不確定性與復(fù)雜性,導(dǎo)致其給金融市場(chǎng)帶來(lái)的沖擊效果與風(fēng)險(xiǎn)因子也具有高度不確定性,很多風(fēng)險(xiǎn)因子隱藏在事件的其他關(guān)聯(lián)信息之中,僅依賴(lài)事理圖譜分析突發(fā)事件的演化并不能從更深層次揭示事件背后涉事主體間的關(guān)聯(lián)特征與傳導(dǎo)效應(yīng),因而也就無(wú)法有針對(duì)性地開(kāi)展風(fēng)險(xiǎn)預(yù)警和應(yīng)急管理。
針對(duì)上述問(wèn)題,本文將靜態(tài)知識(shí)與事理邏輯相結(jié)合,構(gòu)建雙層結(jié)構(gòu)的“事理知識(shí)圖譜(Knowledge Graph with Event Logical,KGEL)”,從事件演化和風(fēng)險(xiǎn)主體關(guān)聯(lián)兩個(gè)角度解決金融突發(fā)事件的演化分析,以進(jìn)一步增強(qiáng)分析視角的多元性和分析結(jié)果的有效性,從而幫助相關(guān)企業(yè)或金融機(jī)構(gòu)更有針對(duì)性地開(kāi)展風(fēng)險(xiǎn)決策與應(yīng)急管理工作。
事理知識(shí)圖譜本質(zhì)上是一種雙層圖結(jié)構(gòu),在事件層以“事件”為單位對(duì)金融突發(fā)事件的演化關(guān)系進(jìn)行描述,同時(shí)在實(shí)體層又能夠反映涉事主體間存在的復(fù)雜關(guān)聯(lián),因而功能更加強(qiáng)大。 圖1展示了面向金融突發(fā)事件的事理知識(shí)圖譜結(jié)構(gòu),其節(jié)點(diǎn)主要包含以企業(yè)和金融機(jī)構(gòu)為核心的知識(shí)節(jié)點(diǎn)和以具體的突發(fā)事件為核心的事件節(jié)點(diǎn);關(guān)系則包含了實(shí)體間的分類(lèi)關(guān)聯(lián)關(guān)系、事件間的演化關(guān)聯(lián)關(guān)系以及事件和涉事主體間的級(jí)聯(lián)映射關(guān)系。
圖1 金融突發(fā)事件事理知識(shí)圖譜結(jié)構(gòu)
表1 展示了知識(shí)圖譜、事理圖譜與事理知識(shí)圖譜的區(qū)別。 從直觀上來(lái)看,傳統(tǒng)的知識(shí)圖譜由于沒(méi)有事件上下文的因果、順承等邏輯關(guān)聯(lián),因而缺乏事物之間動(dòng)態(tài)特征的刻畫(huà);而事理圖譜因?yàn)閮H包含了事件,在進(jìn)行推理時(shí)帶入了很多先入為主的處理,難以規(guī)模化也不夠智能化;事理知識(shí)圖譜則融合了客觀知識(shí)和事理邏輯,能夠提供一個(gè)基于多模式知識(shí)關(guān)聯(lián)的邏輯推理框架,這是目前其他技術(shù)所不具備的能力。
表1 知識(shí)圖譜、事理圖譜與事理知識(shí)圖譜的對(duì)比
本體(Ontology)作為對(duì)特定領(lǐng)域概念及其相互之間關(guān)系的形式化和規(guī)范化的表達(dá),是模式層構(gòu)建的主要依據(jù)[28]。 事件本體(Event Ontology)表示模型作為特殊的領(lǐng)域本體,以事件為認(rèn)知單元,可以事先確定事件的要素框架以及事件論元角色、不同事件之間的因果關(guān)系等事件要素,使得事件能夠通過(guò)規(guī)范、統(tǒng)一的組織模式進(jìn)行表征,更符合現(xiàn)實(shí)世界的存在規(guī)律和人類(lèi)對(duì)現(xiàn)實(shí)世界的認(rèn)知規(guī)律[29]。
本文在復(fù)用SEM(Simple Event Model)[30]、ABC Ontology[31]等事件本體模型的同時(shí),還借鑒唐旭麗等[32]對(duì)金融靜態(tài)本體和動(dòng)態(tài)本體構(gòu)建思路,構(gòu)建了具有動(dòng)態(tài)知識(shí)表征能力的金融突發(fā)事件本體(Financial Emergency Ontology,F(xiàn)EO),在面向金融突發(fā)事件的知識(shí)建模過(guò)程中,研究復(fù)用了美國(guó)企業(yè)數(shù)據(jù)管理委員會(huì)主導(dǎo)、通過(guò)眾包方式構(gòu)建的金融全領(lǐng)域靜態(tài)實(shí)體(Financial Industry Business Ontology,F(xiàn)IBO)[33],從中抽取相應(yīng)的金融實(shí)體,如時(shí)間、機(jī)構(gòu)、自主實(shí)體及事件等,與立足于突發(fā)的風(fēng)險(xiǎn)事件的風(fēng)險(xiǎn)動(dòng)態(tài)本體相結(jié)合(如圖2所示),有利于形成內(nèi)部的知識(shí)關(guān)聯(lián)。
圖2 金融突發(fā)事件本體構(gòu)建過(guò)程中的重用本體
金融突發(fā)事件類(lèi)(Financial Emergency Class)是具有共同特征的突發(fā)事件的集合。 根據(jù)《國(guó)家金融突發(fā)事件應(yīng)急預(yù)案》對(duì)金融突發(fā)事件的分類(lèi)原則,可將金融突發(fā)事件的引發(fā)類(lèi)型總結(jié)為由公共事件引發(fā)、由外部沖擊引發(fā)等七類(lèi);從事件演化的角度來(lái)看,任何突發(fā)事件都有從發(fā)生、發(fā)展到減緩的不同階段,根據(jù)這一特點(diǎn),又可將金融突發(fā)事件劃分為不同的生命周期,一般可分為預(yù)警期、爆發(fā)期、緩解期和善后期四大類(lèi)。 此外,根據(jù)突發(fā)事件的“情景-應(yīng)對(duì)”處理方式[34],金融突發(fā)事件發(fā)生后需要積極開(kāi)展應(yīng)急管理,計(jì)雷等[18]將應(yīng)急管理體系視為一個(gè)復(fù)雜系統(tǒng),并包含監(jiān)測(cè)預(yù)警、指揮調(diào)度、處置實(shí)施、資源保障和決策輔助五大類(lèi)。 金融突發(fā)事件類(lèi)的結(jié)構(gòu)層次如圖3所示。
圖3 金融突發(fā)事件類(lèi)的結(jié)構(gòu)層次
金融突發(fā)事件對(duì)象類(lèi)(Financial Emergency Object Class)可以被理解為具有共同特征的事件參與對(duì)象及其所在環(huán)境的集合。 事件對(duì)象可以分為事件主體和事件客體,用于描述金融市場(chǎng)客觀事實(shí)與知識(shí)。 事件參與對(duì)象所在的環(huán)境主要包括地形、地貌、大氣、生物等自然環(huán)境和金融行業(yè)環(huán)境、貨幣與資本市場(chǎng)的發(fā)行交易環(huán)境、金融監(jiān)管環(huán)境等復(fù)雜的社會(huì)環(huán)境。
類(lèi)之間的關(guān)系主要包括金融突發(fā)事件類(lèi)之間的關(guān)系、事件類(lèi)與事件對(duì)象類(lèi)之間的關(guān)系以及事件及事件環(huán)境間存在的復(fù)雜社會(huì)關(guān)系,如交易關(guān)系、服務(wù)關(guān)系、監(jiān)管關(guān)系、信用關(guān)系雇傭關(guān)系等。 除了對(duì)實(shí)體的屬性和屬性值進(jìn)行約束,還需要制定一些約束條件來(lái)消除知識(shí)庫(kù)的不一致。 如為某些實(shí)體定義“唯一性”、“傳遞性”等約束條件。
模式層構(gòu)建的金融突發(fā)事件本體是對(duì)金融突發(fā)事件知識(shí)領(lǐng)域通用化、共享型概念模型的規(guī)范化、形式化表達(dá),可以重用已有事件本體的基礎(chǔ)性概念模型和知識(shí)結(jié)構(gòu),并使突發(fā)事件能夠通過(guò)統(tǒng)一的組織模式進(jìn)行表征。 該本體將作為種子本體,并借由后續(xù)挖掘分析實(shí)現(xiàn)本體的概念擴(kuò)充和增量更新。
3.3.1 事件要素抽取
事件要素抽取是事件抽取的核心任務(wù),旨在根據(jù)事件表示框架,從文本中抽取事件類(lèi)型和對(duì)應(yīng)的事件主體。 研究采用基于混合模型的序列標(biāo)注方法,將輸入的金融事件語(yǔ)句轉(zhuǎn)化為由標(biāo)注標(biāo)簽組成的序列。 在模型選擇中,結(jié)合了具有動(dòng)態(tài)詞表示能力的金融領(lǐng)域預(yù)訓(xùn)練模型FinBERT、可加入觸發(fā)詞信息編碼的Bi-LSTM 以及具有全局特征約束效果的CRF結(jié)構(gòu),整體架構(gòu)如圖4 所示。 其中,F(xiàn)inBERT 層的主要目標(biāo)是從輸入文本中提取出豐富的語(yǔ)義信息;Bi-LSTM 分別從正序和逆序兩個(gè)方向?qū)尤肓擞|發(fā)詞位置信息的文本進(jìn)行學(xué)習(xí),并將對(duì)應(yīng)的預(yù)測(cè)標(biāo)簽信息傳入到CRF層中;CRF 層作為事件序列語(yǔ)句的全局特征約束方法,根據(jù)之前提取到的語(yǔ)義和句法特征,形成對(duì)整個(gè)輸入序列的特征約束,用于判斷輸出標(biāo)簽預(yù)測(cè)值中最合理的一組。
圖4 基于FinBERT+Bi-LSTM+CRF的實(shí)體標(biāo)注模型
通過(guò)抽取識(shí)別財(cái)經(jīng)資訊中的事件要素,可以形成“事件-實(shí)體”級(jí)聯(lián)關(guān)聯(lián)的異構(gòu)圖譜,更加細(xì)化了金融突發(fā)事件的表示粒度,并增加了圖譜放縮的靈活性,以適應(yīng)突發(fā)事件演化分析、關(guān)聯(lián)風(fēng)險(xiǎn)主體識(shí)別及后續(xù)的應(yīng)急管理等多種場(chǎng)景。
3.3.2 實(shí)體關(guān)系抽取
在實(shí)際的抽取任務(wù)中,由于每一類(lèi)事件可能涉及到的不同主體,因而各實(shí)體間的關(guān)系也較為多元。 研究在對(duì)金融事件分類(lèi)的基礎(chǔ)上,對(duì)部分關(guān)系進(jìn)行了預(yù)定義,如表2所示。
表2 各類(lèi)型金融事件預(yù)定義關(guān)系表
其中,企業(yè)的行業(yè)屬性和地區(qū)屬性由深圳證券信息有限公司提供;涉及金額和人數(shù)的關(guān)系屬性由抽取到的數(shù)量詞(NUM)清洗后建立,關(guān)系名稱(chēng)則取決于事件的類(lèi)型和觸發(fā)詞。 如“貴人鳥(niǎo)通過(guò)自查獲悉公司部分銀行賬戶(hù)凍結(jié)的情況,累計(jì)被凍結(jié)金額為90.94萬(wàn)元。 上述凍結(jié)原因主要系公司未能按期兌付‘14 貴人鳥(niǎo)’債券本息,部分‘14 貴人鳥(niǎo)’債券持有人向司法機(jī)關(guān)提出財(cái)產(chǎn)保全申請(qǐng)。”這一事件屬于突發(fā)的股權(quán)變更事件,抽取的觸發(fā)詞為“凍結(jié)”,因此可以斷定“貴人鳥(niǎo)”這一實(shí)體與“90.94萬(wàn)元”的關(guān)系為“股權(quán)凍結(jié)金額”。
對(duì)于不便于預(yù)先定義的關(guān)系則轉(zhuǎn)化為開(kāi)放域關(guān)系抽取問(wèn)題。 研究借助LTP自然語(yǔ)言處理工具,運(yùn)用依存句法分析(Dependency Parsing),根據(jù)詞性及詞間的位置關(guān)系判斷句中各成分的語(yǔ)法依存關(guān)系,并設(shè)置相應(yīng)的抽取規(guī)則,當(dāng)以謂詞為代表的關(guān)系中含有論元時(shí),提取有效的語(yǔ)義三元組;后將表義模糊的實(shí)體和非表意關(guān)系進(jìn)行人工剔除、對(duì)相似關(guān)系進(jìn)行合并,最終保留能夠與事件元素抽取結(jié)果相對(duì)應(yīng)的實(shí)體及其語(yǔ)義關(guān)聯(lián)關(guān)系。
事件并非孤立存在的,事件之間往往存在某種語(yǔ)義上的關(guān)聯(lián)。 其中,因果關(guān)系是一類(lèi)重要的語(yǔ)義關(guān)系,表明了事件之間在時(shí)序上的先后順序以及引起與被引起的關(guān)系。 桑勇[35]認(rèn)為,在現(xiàn)實(shí)中,突發(fā)事件是以原發(fā)事件為起始點(diǎn)、處理結(jié)果為終點(diǎn)的一系列因果事件鏈。 相較于一般的順承關(guān)系,因果關(guān)系強(qiáng)調(diào)事件演化的本質(zhì)規(guī)律,從而避免了事件偶然共現(xiàn)帶來(lái)的噪聲。 利用突發(fā)事件之間的因果關(guān)系,可以將各事件本身直接關(guān)聯(lián),形成除主題關(guān)聯(lián)、時(shí)序關(guān)聯(lián)外的新關(guān)聯(lián)模式,對(duì)于理清金融突發(fā)事件發(fā)展和演化脈絡(luò)具有非常重要的作用。
本文參考Qiu等[36]對(duì)抽取規(guī)則的設(shè)計(jì)方案,基于設(shè)計(jì)的因果連詞庫(kù)、結(jié)果詞庫(kù)和因果模式規(guī)則庫(kù),利用LTP 平臺(tái)實(shí)現(xiàn)金融突發(fā)事件的因果對(duì)抽取,觸發(fā)詞詞庫(kù)與抽取規(guī)則如表3所示。 在抽取結(jié)果基礎(chǔ)之上,又進(jìn)行了清洗規(guī)則的制定,如刪除字?jǐn)?shù)少于8 個(gè)字的和表意不完整的因事件/果事件,補(bǔ)充指代不明的因事件/果事件等,以保證抽取出來(lái)的句子在具有因果語(yǔ)義關(guān)系的同時(shí)符合一定的表述規(guī)范。
表3 事件因果抽取規(guī)則表
續(xù)表3
在實(shí)際的抽取過(guò)程中,由于具體事件往往是非常稀疏的,抽取出的兩個(gè)因果對(duì)中包含完全相同事件的可能性非常小,難以將因果對(duì)連接成稠密的網(wǎng)絡(luò)。 因此,需要對(duì)抽取出的具體事件進(jìn)行抽象和泛化,從具體事件間的因果上升到抽象事件間的因果,從而發(fā)現(xiàn)更為一般的因果邏輯演化規(guī)律。 事件泛化是指將具有相近語(yǔ)義的事件概括為同一事件,研究采用node2vec算法將事件向量化,將維度設(shè)為60,以獲取事件的低維分布式向量表示。 而后選擇余弦相似度算法度量事件的相似性,將相似度高于0.8的事件劃歸為同一類(lèi)事件,并結(jié)合kmeans聚類(lèi)算法進(jìn)一步完成事件類(lèi)簇的劃分。
4.1.1 金融事件語(yǔ)料的獲取
新聞是對(duì)近期發(fā)生事實(shí)的客觀報(bào)道,是承載事件的載體,因而各類(lèi)財(cái)經(jīng)新聞網(wǎng)站是金融突發(fā)事件信息最有效的獲取渠道。 研究選取2018年10月1日至2021年10月31日發(fā)布于中國(guó)金融信息網(wǎng)、中國(guó)金融網(wǎng)“金融眼”欄目(該欄目的新聞主要是對(duì)金融突發(fā)事件和相關(guān)違紀(jì)違規(guī)事件的披露)及新浪財(cái)經(jīng)的金融新聞短訊作為金融事件的初始語(yǔ)料,然而很多事件中并不涉及事件主體,因此,需在事件元素抽取時(shí)將未抽取出任何實(shí)體的事件刪除,最終得到53721篇包含實(shí)體的金融新聞。
4.1.2 金融負(fù)面事件的識(shí)別
李娟[37]將金融突發(fā)事件定義為由隨機(jī)因素引發(fā)的、帶有負(fù)面金融風(fēng)險(xiǎn)效應(yīng)的突然性事件,基本特點(diǎn)之一就是負(fù)面性。 一般而言,金融機(jī)構(gòu)爆發(fā)的突發(fā)事件往往是風(fēng)險(xiǎn)發(fā)生的前奏或標(biāo)志,因此,需要首先將獲取的事件語(yǔ)料中的負(fù)面事件準(zhǔn)確識(shí)別,便于進(jìn)一步篩選代表性金融突發(fā)事件,從而利用圖譜的知識(shí)關(guān)聯(lián)特征找到關(guān)聯(lián)風(fēng)險(xiǎn)主體。
研究將負(fù)面事件的識(shí)別視為文本情感分類(lèi)問(wèn)題,為確定最適合于本研究的情感分析方法,從自建的53721篇金融新聞數(shù)據(jù)集中隨機(jī)抽取了11000條財(cái)經(jīng)新聞事件進(jìn)行人工標(biāo)注,并將其劃分為負(fù)面(包含風(fēng)險(xiǎn)因素,用“1”表示)和非負(fù)面(情感中性或正面事件,用“0”表示)兩類(lèi),隨后分別使用基于詞典的方法、機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法進(jìn)行分類(lèi)實(shí)驗(yàn),比較其準(zhǔn)確率。
在基于詞典的情感分析中,研究使用Bian等[38]編制的中文金融情感詞典(CFSD,Chinese Financial Sentiment Dictionary),并考慮程度副詞、否定詞、標(biāo)點(diǎn)符號(hào)以及特定的金融領(lǐng)域風(fēng)險(xiǎn)敏感詞對(duì)文本情感傾向的影響。 基于機(jī)器學(xué)習(xí)的情感分類(lèi)采用TF-IDF提取文本特征,并使用支持向量機(jī)(Support Vector Machine,SVM)和隨機(jī)森林(Random Forest,RF)算法進(jìn)行訓(xùn)練。 基于深度學(xué)習(xí)的情感分類(lèi)任務(wù)則使用了Bert和Finbert算法,學(xué)習(xí)率均為0.01,epochs為10,batch_size為32。 除基于情感詞典的方法是將標(biāo)注樣本與計(jì)算結(jié)果直接比較外,對(duì)于其他監(jiān)督類(lèi)算法,實(shí)驗(yàn)將數(shù)據(jù)集按7∶3的比例劃分為訓(xùn)練集和測(cè)試集。
實(shí)驗(yàn)結(jié)果表明,基于詞典的方法準(zhǔn)確率為88.72%;機(jī)器學(xué)習(xí)中SVM 分類(lèi)準(zhǔn)確率為86.16%,隨機(jī)森林準(zhǔn)確率為84.50%;深度學(xué)習(xí)中Bert準(zhǔn)確率為88.28%,F(xiàn)inBert準(zhǔn)確率則為90.03%。 由此可見(jiàn),基于詞典的方法和深度學(xué)習(xí)的方法準(zhǔn)確率均較高,其中FinBert預(yù)訓(xùn)練模型在金融文本情感分類(lèi)任務(wù)中也取得了最好的表現(xiàn),本文選擇該方法進(jìn)行情感分類(lèi),同時(shí)利用基于詞典的方法實(shí)現(xiàn)情感打分,為探究時(shí)序演化中事件的情感一致性提供數(shù)據(jù)支持。
通過(guò)訓(xùn)練和預(yù)測(cè),在包含事件主體的所有金融事件中,共有35363個(gè)負(fù)面事件,占全部事件的65.8%。 從整體上來(lái)看,這些負(fù)面事件涉及的主題內(nèi)容較廣,因此需要進(jìn)一步挖掘不同負(fù)面事件主題下的風(fēng)險(xiǎn)類(lèi)型;從時(shí)間維度上來(lái)看,負(fù)面事件的時(shí)間跨度普遍較短,說(shuō)明負(fù)面事件的爆發(fā)往往短暫而集中,這正是金融突發(fā)事件的典型特征之一。
4.1.3 代表性金融突發(fā)事件的確定
經(jīng)過(guò)負(fù)面事件的初篩,符合條件的文本數(shù)量已大幅減少。 然而,除負(fù)面性外,金融突發(fā)事件還具有突發(fā)性、不確定性、衍生性與社會(huì)擴(kuò)散性等核心特征,對(duì)于一些確定性的、緊迫性較小的事件和發(fā)生后沒(méi)有在社會(huì)系統(tǒng)產(chǎn)生影響或社會(huì)影響范圍較小的事件,并不在本研究范疇之列,也需要將其刪除,篩選的標(biāo)準(zhǔn)主要從事件緊迫度、事件知名度和事件擴(kuò)散效應(yīng)三個(gè)方面考慮。 其中,事件知名度可以根據(jù)新聞閱讀量、新聞熱度、用戶(hù)評(píng)論數(shù)等指標(biāo)直接得出結(jié)論;事件擴(kuò)散效應(yīng)指的是該突發(fā)事件是否具有衍生性,一般而言,重大的金融突發(fā)事件往往是系列事件,因此會(huì)有多篇相關(guān)報(bào)道,對(duì)于事件主體在全部的突發(fā)事件文本中出現(xiàn)頻率過(guò)低(小于3次)的情況,本文認(rèn)為該事件不具有代表性,也將其刪除;事件緊迫度則結(jié)合語(yǔ)義規(guī)則和人工判斷兩種方式確定,其中出現(xiàn)“突發(fā)”“突遭”“緊急”“嚴(yán)重”“來(lái)襲”等表述或情感分?jǐn)?shù)較低即負(fù)面情緒值較高(閾值設(shè)為低于0.1)的新聞被自動(dòng)判定為突發(fā)新聞事件,同時(shí)為了確保新聞事件的質(zhì)量,輔以人工識(shí)別,最終得到13186篇新聞作為代表性金融突發(fā)事件語(yǔ)料集。
傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)中,多表之間的連接操作導(dǎo)致性能低下,圖數(shù)據(jù)庫(kù)則專(zhuān)門(mén)針對(duì)跨復(fù)雜數(shù)據(jù)的關(guān)聯(lián)查詢(xún)進(jìn)行了優(yōu)化,因而更適用于存儲(chǔ)知識(shí)圖譜這種大規(guī)模復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)。研究采用Neo4j用于可視化展示和后續(xù)的關(guān)聯(lián)查詢(xún)分析。 Neo4j作為當(dāng)下知名度最高的圖數(shù)據(jù)庫(kù),同時(shí)具備圖分析、存儲(chǔ)和處理能力。此外,Neo4j圖數(shù)據(jù)庫(kù)突破了傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)無(wú)法處理數(shù)據(jù)間關(guān)系動(dòng)態(tài)變化的問(wèn)題,可以實(shí)現(xiàn)對(duì)實(shí)體和實(shí)體關(guān)系信息的動(dòng)態(tài)存儲(chǔ)和有效管理,因而非常適合對(duì)雙層結(jié)構(gòu)的“事理知識(shí)圖譜”的存儲(chǔ)。 圖5展示了將處理后數(shù)據(jù)批量導(dǎo)入Neo4j后的部分可視化結(jié)果。
圖5 基于Neo4j的金融突發(fā)事件事理知識(shí)圖譜存儲(chǔ)與可視化
事理知識(shí)圖譜本質(zhì)上是圖結(jié)構(gòu),圖G=(V,E)定義為節(jié)點(diǎn)和邊的集合,其中節(jié)點(diǎn)集合表示為V={v1,v2,…,v n},邊的集合表示為E。 圖上節(jié)點(diǎn)間路徑表示連接節(jié)點(diǎn)的一條通路,路徑問(wèn)題是最基本的圖查詢(xún)問(wèn)題之一,也是面向知識(shí)圖譜的價(jià)值分析與關(guān)系推演的基礎(chǔ)。
基于事理知識(shí)圖譜的事件演化過(guò)程如圖6所示,金融突發(fā)事件蘊(yùn)含的實(shí)體間具有一定的知識(shí)關(guān)聯(lián)特征,依據(jù)實(shí)體間的關(guān)聯(lián)可以發(fā)現(xiàn)事件間的關(guān)系,而這些關(guān)聯(lián)事件經(jīng)過(guò)泛化后可以從更高層次表示事件間的關(guān)系,形成抽象的事理邏輯鏈,從而便于突發(fā)事件演化和應(yīng)對(duì)規(guī)律的總結(jié)分析。 金融突發(fā)事件中各事件要素的知識(shí)關(guān)聯(lián)特征與事件間的事理邏輯特征,展現(xiàn)了事件在演變過(guò)程中客觀存在的規(guī)律和模式。 從知識(shí)管理角度來(lái)看,這種規(guī)律和模式是從大量數(shù)據(jù)中挖掘出來(lái)的隱性知識(shí),對(duì)于揭示重大金融突發(fā)事件的風(fēng)險(xiǎn)傳導(dǎo)機(jī)理、實(shí)現(xiàn)事件全流程管理尤為關(guān)鍵和重要。此外,事件演變的語(yǔ)義傳導(dǎo)路徑還與知識(shí)圖譜的關(guān)聯(lián)風(fēng)險(xiǎn)實(shí)體密切相關(guān),有利于借助突發(fā)事件的演變邏輯分析風(fēng)險(xiǎn)的傳導(dǎo)路徑。
圖6 “事件-實(shí)體”結(jié)構(gòu)事理知識(shí)圖譜的事件泛化及演化過(guò)程示意圖
事理知識(shí)圖譜關(guān)聯(lián)路徑的查詢(xún)方案不僅需要從底層圖數(shù)據(jù)結(jié)構(gòu)的角度出發(fā),還需要考慮 “知識(shí)”特性,即綜合考慮結(jié)構(gòu)特征和語(yǔ)義特征;對(duì)于本文構(gòu)建的事理知識(shí)圖譜而言,在路徑查詢(xún)時(shí)則需重點(diǎn)關(guān)注事件時(shí)序演化特性對(duì)路徑查詢(xún)方案選擇的影響。
本文選取包商銀行破產(chǎn)事件作為案例展開(kāi)實(shí)證研究,以分析金融突發(fā)事件的演化機(jī)理。
2019年5月24日,包商銀行因出現(xiàn)嚴(yán)重信用風(fēng)險(xiǎn),被人民銀行、銀保監(jiān)會(huì)聯(lián)合接管,成為近20年來(lái)首家被行政接管的中小商業(yè)銀行,并于2020年11月23日被批準(zhǔn)破產(chǎn)。 包商銀行破產(chǎn)這一突發(fā)事件的發(fā)生,集中暴露出當(dāng)前我國(guó)中小銀行發(fā)展過(guò)程中所存在的共性問(wèn)題,迅速引起了市場(chǎng)的強(qiáng)烈關(guān)注。
研究首先繪制了如圖7 所示的情感時(shí)序分布散點(diǎn)圖,可以發(fā)現(xiàn),相關(guān)事件中大部分都是負(fù)面事件,且集中在中后期,少部分的正面情感事件經(jīng)查詢(xún)后發(fā)現(xiàn)均與央行、銀保監(jiān)會(huì)對(duì)包商銀行的監(jiān)管取得成效或該事件對(duì)于其他金融機(jī)構(gòu)與企業(yè)的啟示有關(guān),因而一定程度上證實(shí)了金融突發(fā)事件的情感一致性。
圖7 包商銀行系列事件情感時(shí)序分布散點(diǎn)圖
結(jié)合具體的事件內(nèi)容來(lái)看,包商銀行的破產(chǎn)雖事發(fā)突然,屬重大金融突發(fā)事件,但其實(shí)早有端倪。 研究通過(guò)對(duì)已構(gòu)建的事理知識(shí)圖譜進(jìn)行關(guān)聯(lián)查詢(xún),得到如圖8 所示的以包商銀行為核心節(jié)點(diǎn)的事理知識(shí)圖譜(部分),其中紅色節(jié)點(diǎn)表示具體事件,綠色節(jié)點(diǎn)則表示包含因果邏輯的抽象事件。 具體事件包含了涉事主體、事件類(lèi)型、關(guān)鍵詞和發(fā)生時(shí)間,通過(guò)具體事件可視化可以梳理得到如圖9 所示的時(shí)序演化路徑,可以看到包商銀行自2019年5月24日被接管以來(lái),央行、銀保監(jiān)會(huì)采取了一系列有效的監(jiān)管措施,如深入開(kāi)展資產(chǎn)負(fù)債清查與賬務(wù)清理、引入戰(zhàn)略投資者、確定新設(shè)銀行即蒙商銀行股東的認(rèn)購(gòu)份額和入股價(jià)格等。 然而僅通過(guò)事件演化鏈無(wú)法揭示更深層次的內(nèi)涵,因而還需對(duì)抽取得到的相關(guān)因果抽象事件及其關(guān)聯(lián)知識(shí)進(jìn)行進(jìn)一步分析。
圖8 包商銀行破產(chǎn)事件事理知識(shí)圖譜(部分)
圖9 包商銀行破產(chǎn)事件時(shí)序演化路徑
如圖10所示,通過(guò)對(duì)包商銀行被接管前后的事件因果關(guān)聯(lián)關(guān)系挖掘發(fā)現(xiàn),造成其突發(fā)嚴(yán)重信用風(fēng)險(xiǎn)和流動(dòng)性風(fēng)險(xiǎn)的原因在于股權(quán)問(wèn)題,尤其是受制于背后的實(shí)控人——明天集團(tuán)。 右側(cè)的股權(quán)關(guān)系顯示了截至2018 年底包商銀行的重要股東,表面上看與明天系并無(wú)關(guān)聯(lián),但事件中多次提到明天集團(tuán)、明天系等,結(jié)合多層股權(quán)穿透后可知明天集團(tuán)控股比例高達(dá)89%,是隱藏在幕后的實(shí)控人。包含語(yǔ)義關(guān)聯(lián)的傳導(dǎo)路徑也印證了上述發(fā)現(xiàn),并認(rèn)為包商銀行涉嫌違規(guī)披露信息,誤導(dǎo)投資者。 此外,該路徑圖譜還揭示了包商銀行破產(chǎn)的多重原因與被接管后的應(yīng)急管理成效。 從中可以看出,除明天系的控股影響外,不良資產(chǎn)的持續(xù)攀升、大量資金被占用形成的債務(wù)逾期等,也是導(dǎo)致包商銀行出現(xiàn)嚴(yán)重風(fēng)險(xiǎn)的重要因素,并進(jìn)而導(dǎo)致了中小銀行收緊風(fēng)險(xiǎn)偏好、服務(wù)區(qū)域?qū)嶓w經(jīng)濟(jì)等系列決策。 而央行和銀保監(jiān)會(huì)監(jiān)管后也對(duì)中小銀行具有明顯的警示作用,有利于中小商業(yè)銀行進(jìn)一步明晰自身定位,及時(shí)回歸貸前調(diào)查、貸時(shí)審查、貸后檢查的“三查”制度,并改變“大行以低成本資金投同業(yè)市場(chǎng)、小行以高成本負(fù)債投高風(fēng)險(xiǎn)資產(chǎn)”的資金低效運(yùn)轉(zhuǎn)局面。
圖10 包商銀行因果邏輯關(guān)聯(lián)與股權(quán)關(guān)聯(lián)路徑
當(dāng)前我國(guó)經(jīng)濟(jì)正處于高質(zhì)量發(fā)展階段,然而,金融突發(fā)事件的發(fā)生嚴(yán)重阻礙了金融業(yè)的穩(wěn)定發(fā)展,并加劇了系統(tǒng)性風(fēng)險(xiǎn)發(fā)生的可能性。 在數(shù)智時(shí)代背景下,傳統(tǒng)的以領(lǐng)域?qū)<覟橹鞯耐话l(fā)事件應(yīng)對(duì)與管控模式效率低下,難以對(duì)海量的事件、輿情等數(shù)據(jù)進(jìn)行有效的關(guān)聯(lián)分析,亟需一種能夠分析復(fù)雜事件的研究思路和方法以更好地支持應(yīng)急管理工作的開(kāi)展。 本文從知識(shí)驅(qū)動(dòng)的事件關(guān)聯(lián)與演化視角出發(fā),通過(guò)建立金融突發(fā)事件事理知識(shí)圖譜,從事件和實(shí)體兩個(gè)層面分析突發(fā)事件的關(guān)聯(lián)及演化路徑,揭示事件演變的方向和邏輯線索,為金融突發(fā)事件的應(yīng)急決策提供了科學(xué)有效的現(xiàn)實(shí)依據(jù)。 以包商銀行破產(chǎn)事件為例的實(shí)證分析結(jié)果表明,對(duì)于重大金融突發(fā)事件而言,往往會(huì)涉及多個(gè)事件主體,除了直接受到?jīng)_擊和影響的核心主體外,與之相關(guān)聯(lián)的實(shí)體也隱含著不同程度的風(fēng)險(xiǎn)。 本文所構(gòu)建的基于“事件-實(shí)體”關(guān)聯(lián)模式的金融突發(fā)事件事理知識(shí)圖譜,能夠融合靜態(tài)知識(shí)與動(dòng)態(tài)事理邏輯規(guī)則,將重大金融突發(fā)事件的事理知識(shí)鏈接形成多層次演化鏈路圖,通過(guò)在圖譜上進(jìn)行事件建模和多層邏輯推理,從知識(shí)關(guān)聯(lián)的視角揭示重大突發(fā)事件的演變規(guī)律、模式和動(dòng)因,提升金融突發(fā)事件的態(tài)勢(shì)感知能力[39-40]。
此外,本文的研究思路方法及構(gòu)建的事理知識(shí)圖譜,對(duì)政府和相關(guān)金融監(jiān)管部門(mén)開(kāi)展輿情分析與應(yīng)急管理具有一定的實(shí)踐指導(dǎo)意義。 一方面,通過(guò)事理知識(shí)圖譜可以快速定位到與突發(fā)事件施事者與受事者相關(guān)的實(shí)體,依靠上級(jí)部門(mén)的協(xié)調(diào)干預(yù)或關(guān)聯(lián)實(shí)體的主動(dòng)協(xié)同配合共同行動(dòng),及時(shí)采取穩(wěn)控措施,以保證相關(guān)實(shí)體不受負(fù)面影響或最大限度地降低風(fēng)險(xiǎn)損失,使市場(chǎng)風(fēng)險(xiǎn)水平總體處于可控范圍內(nèi);另一方面,在突發(fā)事件常態(tài)化的形勢(shì)與趨勢(shì)下,事理知識(shí)圖譜可以輔助相關(guān)監(jiān)管部門(mén)和應(yīng)急管理部門(mén)研判事件發(fā)展方向和風(fēng)險(xiǎn)傳導(dǎo)路徑,及時(shí)規(guī)避相關(guān)衍生事件導(dǎo)致的重大風(fēng)險(xiǎn),從而構(gòu)建更為完善的應(yīng)急管理機(jī)制,進(jìn)一步提高相關(guān)金融機(jī)構(gòu)的營(yíng)運(yùn)能力和政府與監(jiān)管機(jī)構(gòu)的社會(huì)治理水平。
本研究也存在一定的局限性。 第一,在數(shù)據(jù)獲取與處理方面,文中使用政府網(wǎng)站和主流媒體發(fā)布的新聞報(bào)道作為金融突發(fā)事件的主要來(lái)源,數(shù)據(jù)源仍略顯單一,數(shù)據(jù)的價(jià)值稀疏性明顯。 未來(lái)將考慮結(jié)合上市公司發(fā)布的公告、社交媒體中的相關(guān)輿情信息以及咨詢(xún)報(bào)告、學(xué)術(shù)文獻(xiàn)等多源異構(gòu)甚至多模態(tài)數(shù)據(jù),構(gòu)建信息量更豐富的歷史重大金融突發(fā)事件事理知識(shí)圖譜。 第二,對(duì)于金融突發(fā)事件的識(shí)別與抽取,本文考慮采用識(shí)別負(fù)面、高熱度、高突發(fā)性新聞代替“突發(fā)事件”的方式,但對(duì)“突發(fā)性”這一核心特征的度量方法存在一定的局限,同時(shí)事件關(guān)系抽取僅考慮了因果事件的抽取,未考慮時(shí)序演化事件、順承事件、反轉(zhuǎn)事件等,且抽取方法較為簡(jiǎn)單。未來(lái)研究中將考慮采用大規(guī)模標(biāo)注與基于深度學(xué)習(xí)的聯(lián)合抽取方法,實(shí)現(xiàn)對(duì)金融突發(fā)事件的有效識(shí)別和抽取。 第三,本文結(jié)合實(shí)證案例分析了金融突發(fā)事件的演化邏輯和事件發(fā)生的原因與處置應(yīng)對(duì)方式,但突發(fā)事件具有多樣性,對(duì)于不同類(lèi)型不同級(jí)別的金融突發(fā)事件,能夠分析出的特征機(jī)理也不盡相同,未來(lái)應(yīng)當(dāng)在梳理更多案例的基礎(chǔ)上總結(jié)更為普適的演化規(guī)律,為事件演化方向的預(yù)測(cè)提供更多數(shù)據(jù)和理論的支持。