• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字人文視角下的《拉貝日記》情感識(shí)別與分析*

      2023-03-12 09:14:14黃紫荊邱玉倩趙小萱
      圖書館論壇 2023年3期
      關(guān)鍵詞:拉貝語(yǔ)句南京

      黃紫荊,邱玉倩,沈 彤,趙小萱,陳 剛

      0 引言

      文本情感分析是對(duì)文本數(shù)據(jù)進(jìn)行分析并判斷情感傾向的技術(shù)[1],廣泛應(yīng)用在輿情監(jiān)控、優(yōu)化決策等方面。近年在跨學(xué)科范式下,數(shù)字人文(Digital Humanities)發(fā)展迅速[2-5],采用情感分析等語(yǔ)義技術(shù)對(duì)歷史文獻(xiàn)和經(jīng)典文學(xué)進(jìn)行挖掘,對(duì)人文學(xué)科的創(chuàng)新發(fā)展具有重要意義[6]。南京大屠殺作為中國(guó)近代史上震驚世界的重大慘案,一直是學(xué)者關(guān)注熱點(diǎn)?!独惾沼洝酚傻聡?guó)商人約翰·拉貝所著[7],以第三方視角記述南京大屠殺見(jiàn)聞。由于當(dāng)時(shí)德國(guó)與日本結(jié)盟,拉貝是納粹黨南京小組組長(zhǎng),拉貝的特殊身份使其記述具有很高的歷史價(jià)值。過(guò)往《拉貝日記》主要為相關(guān)研究提供歷史依據(jù),研究?jī)?nèi)容主要包括探討南京國(guó)際安全區(qū)的成立與運(yùn)作[8-10]、南京大屠殺前后的市民生活[11-12]、揭示日軍暴行[13-14]等。也有部分學(xué)者對(duì)拉貝在中國(guó)的思想見(jiàn)聞及《拉貝日記》的真實(shí)性進(jìn)行探討[15-16]。目前關(guān)于《拉貝日記》內(nèi)容本身的研究并不多見(jiàn),也尚未引入量化方法對(duì)文本進(jìn)行整體解讀。

      戰(zhàn)爭(zhēng)往往會(huì)給民眾帶來(lái)劇烈的情感沖擊,與一般歷史檔案相比,《拉貝日記》包含更多情感層面的內(nèi)容。一方面其情感表達(dá)折射出拉貝個(gè)人立體的形象;另一方面,部分學(xué)者將理性與情感對(duì)立起來(lái)[17-18],認(rèn)為情感會(huì)讓史料記述存在立場(chǎng)、眼界的偏見(jiàn)[19]。數(shù)字人文視角下的歷史文本研究倡導(dǎo)量化、整體論的研究視角[20]。對(duì)日記全文進(jìn)行情感識(shí)別,探索日記情感書寫與歷史現(xiàn)實(shí)的關(guān)系,對(duì)厘清《拉貝日記》情感書寫是“敘事的前提”[21]還是“外部作用的結(jié)果”[15],以及補(bǔ)充揭示拉貝的人物形象,均具有探索價(jià)值。

      情感分析主要涵蓋情感識(shí)別、情感抽取與情感檢索等下游任務(wù),其中情感識(shí)別研究最為廣泛,主要通過(guò)人工標(biāo)注、情感詞典與機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)[22]。《拉貝日記》面臨語(yǔ)料稀缺和缺乏業(yè)內(nèi)標(biāo)注數(shù)據(jù)集等問(wèn)題,給情感識(shí)別帶來(lái)挑戰(zhàn)。完全靠人工標(biāo)注情感極性,精確度最高,但需耗費(fèi)大量人力資源[1]。NLP平臺(tái)為學(xué)者封裝便捷的接口,但存在對(duì)基準(zhǔn)詞的依賴問(wèn)題,由于史料具有專業(yè)性和特殊性,僅依賴平臺(tái)的模型方法,可能訓(xùn)練效果不佳[23-24]。情感詞典是文本情感分析的重要方法,但也存在不能聯(lián)系上下文語(yǔ)義、依賴先驗(yàn)知識(shí)的限制[25]。深度學(xué)習(xí)技術(shù)在語(yǔ)義分析領(lǐng)域日漸成熟,為情感研究帶來(lái)新機(jī)遇[26-29]。BERT(Bidirectional Encoder Representations from Transformers)是由多個(gè)Transformer雙向堆疊而成的預(yù)訓(xùn)練模型,已在多個(gè)NLP(Natural Language Processing)任務(wù)上取得最佳成績(jī)[30]。BERT對(duì)同一個(gè)詞在不同語(yǔ)境中動(dòng)態(tài)編碼,相比Word2Vec、Glove等傳統(tǒng)詞嵌入方法(Word Embedding),能有效解決《拉貝日記》中的一詞多義問(wèn)題[31-32]。目前針對(duì)特定領(lǐng)域的數(shù)據(jù)標(biāo)注項(xiàng)目,人工與模型混合的工作方案被證明可以在降低人力成本的同時(shí)兼顧準(zhǔn)確率[33-34]。

      本文基于人工標(biāo)注與BERT模型對(duì)《拉貝日記》進(jìn)行分句情感極性識(shí)別,通過(guò)時(shí)序統(tǒng)計(jì)、地圖映射和史料對(duì)照,探索性分析南京大屠殺前后拉貝的情感分布特征、變化趨勢(shì)和對(duì)不同人物的情感傾向,以期為研究《拉貝日記》、南京大屠殺歷史提供新視角和參考資料。

      1 研究對(duì)象與數(shù)據(jù)預(yù)處理

      1.1 研究對(duì)象

      《拉貝日記》包括拉貝從1937年9月7日到1938年2月26日記錄的南京戰(zhàn)時(shí)日記和相關(guān)報(bào)告文件,全文共計(jì)約37.7萬(wàn)字。戰(zhàn)時(shí)日記的起始日期為1937年9月7日,結(jié)束日期為1938年2月26日,共計(jì)159天,13.3萬(wàn)字。期間包括1937年11月12日日軍占領(lǐng)上海、12月1日南京保衛(wèi)戰(zhàn)打響和12月13日南京城市淪陷3個(gè)重大歷史節(jié)點(diǎn)。

      日記中拉貝的活動(dòng)范圍集中在中山大道沿線和國(guó)際安全區(qū)為主的主城區(qū)。國(guó)際安全區(qū)位于南京主城西北,占地3.86平方千米,是南京淪陷后拉貝等為來(lái)不及撤退的難民創(chuàng)建的避難所。日本對(duì)安全區(qū)的存在呈含糊的默許態(tài)度[35],但占領(lǐng)南京后經(jīng)常強(qiáng)行闖入安全區(qū)犯下暴行[36]。

      約翰·拉貝于1882年11月23日出生,先后在德國(guó)西門子駐北京分公司、南京分公司工作。1937年11月12日,上海淪陷后日軍直逼南京,拉貝冒著生命危險(xiǎn)堅(jiān)守于此保護(hù)人民。拉貝因其德國(guó)公民身份及出色的個(gè)人能力被推舉為南京國(guó)際安全區(qū)主席。拉貝本為商人,無(wú)心政治,但在南京城淪陷前后參與庇護(hù)超過(guò)20萬(wàn)中國(guó)難民。該時(shí)期恐怖經(jīng)歷使得拉貝思想和行動(dòng)產(chǎn)生巨大變化[16],情感隨之轉(zhuǎn)變。

      1.2 數(shù)據(jù)說(shuō)明與處理

      情感極性識(shí)別是對(duì)帶有感情色彩的主觀性文本判斷情感傾向的過(guò)程,本文選取《拉貝日記》的個(gè)人日記部分作為研究對(duì)象,并將全文語(yǔ)句分為積極、中性、消極3個(gè)情感極性,以句子作為識(shí)別粒度。積極情感包含期待、快樂(lè)、信任等,消極情感包含生氣、恐懼、悲傷等,中性情感表示該語(yǔ)句沒(méi)有明顯的情感傾向。原始數(shù)據(jù)剔除非日記內(nèi)容后,使用Python進(jìn)行分句與結(jié)構(gòu)化處理,得到有效數(shù)據(jù)4,416條①。由于缺乏語(yǔ)料數(shù)據(jù)集,首先綜合百度智能云(cloud.baidu.com)的NLP情感傾向分析模塊的識(shí)別結(jié)果與人工判讀,對(duì)2,500條隨機(jī)數(shù)據(jù)建立標(biāo)注數(shù)據(jù)集。由于《拉貝日記》是戰(zhàn)時(shí)敘事,拉貝的情感起伏相比人對(duì)產(chǎn)品或輿情的情感起伏要更強(qiáng)烈,情感語(yǔ)境也讓標(biāo)注人員的主觀認(rèn)同問(wèn)題更突出,同一語(yǔ)句需要更多的人員參與標(biāo)注。為降低結(jié)果的主觀性,人工階段采取3輪的情感標(biāo)注流程,最終同意百分比為98%。針對(duì)數(shù)據(jù)量偏少問(wèn)題,采用小樣本數(shù)據(jù)增強(qiáng)中的“回譯”方法[37],擴(kuò)充數(shù)據(jù),以減輕模型過(guò)擬合影響。本文基于百度翻譯接口,將對(duì)已標(biāo)注的語(yǔ)句進(jìn)行3次連續(xù)批量翻譯(中文>日語(yǔ)>英文>中文),以降低語(yǔ)義的重復(fù)率,同時(shí)防止語(yǔ)義失真。得到2,500條回譯數(shù)據(jù),與已標(biāo)注的數(shù)據(jù)組成5,000條模型訓(xùn)練數(shù)據(jù),其中“訓(xùn)練集:驗(yàn)證集:測(cè)試集”比例設(shè)定為“3∶1∶1”,剩余的1,916條數(shù)據(jù)后續(xù)通過(guò)訓(xùn)練后的模型預(yù)測(cè)情感極性。此外,將1937年南京城市地圖、《拉貝日記》中的主要建筑和事件點(diǎn)在Arc GIS軟件中進(jìn)行配準(zhǔn)和分層數(shù)字化,還原《拉貝日記》時(shí)期的南京城市空間格局以用作后續(xù)分析的輔助資料。

      表1 人工數(shù)據(jù)標(biāo)注規(guī)則及示例

      2 研究方法

      2.1 模型原理

      本文在人工標(biāo)注基礎(chǔ)上,采用BERT模型對(duì)未標(biāo)注數(shù)據(jù)進(jìn)行詞嵌入與情感極性分類。在日記情感分析中,文本有復(fù)雜豐富的情感語(yǔ)義特征,首先需要進(jìn)行詞嵌入處理。BERT是由多個(gè)Transformer雙向堆疊而成的預(yù)訓(xùn)練模型,通過(guò)注意力機(jī)制來(lái)建模輸入序列中的單詞之間的關(guān)聯(lián)。BERT模型的輸入處理模塊將每個(gè)句子序列處理為3個(gè)[1]向量的和:詞向量(Token embeddings)、段向量(Segment embeddings)與位置向量(Position embeddings)。詞向量表示對(duì)當(dāng)前詞對(duì)應(yīng)的向量;段向量表示對(duì)當(dāng)前詞所在句子的位置編碼,該向量用于刻畫文本的全局語(yǔ)義信息,并與單字/詞的語(yǔ)義信息相融合;位置向量表示對(duì)當(dāng)前詞的位置編碼,由于出現(xiàn)在文本不同位置的字/詞所攜帶的語(yǔ)義信息存在差異,如“拉貝擔(dān)心難民”與“難民擔(dān)心拉貝”,因此需要附加位置向量以作區(qū)分。將輸入處理模塊結(jié)果再輸入BERT的雙向Transformer編碼模塊,使用Encode特征抽取器進(jìn)行文本特征提取,最終將得到具有雙向上下文敏感的話語(yǔ)特征的詞向量。

      2.2 實(shí)驗(yàn)參數(shù)

      選取Bert-base-chinese,一種采用中文詞典且粒度到標(biāo)點(diǎn)符號(hào)的BERT模型處理數(shù)據(jù)。該模型采用12層Transformer,隱藏層大小為768,Multi-head Attention參數(shù)為12。實(shí)驗(yàn)中每次訓(xùn)練樣本數(shù)(batchsize)為16句,訓(xùn)練迭代次數(shù)為4,序列長(zhǎng)度為140,優(yōu)化器為Adam,損失函數(shù)為交叉熵?fù)p失函數(shù)。為了防止模型過(guò)擬合的影響,學(xué)習(xí)率稍作降低,保持在0.000009。首先在詞嵌入環(huán)節(jié),通過(guò)Berttokenizer預(yù)訓(xùn)練模型處理輸入的語(yǔ)句,查詢字向量表將每個(gè)字轉(zhuǎn)換為一維向量;得到Berttokenizer輸出的向量后,將詞向量、段向量和位置向量的和輸入BertForSequenceClassification模型,進(jìn)行編碼和情感極性分類,得到識(shí)別結(jié)果。

      2.3 訓(xùn)練結(jié)果

      本研究數(shù)據(jù)量偏少,可能導(dǎo)致訓(xùn)練準(zhǔn)確率與驗(yàn)證、測(cè)試準(zhǔn)確率差距變大,模型過(guò)擬合。因此實(shí)驗(yàn)降低學(xué)習(xí)率以縮短訓(xùn)練準(zhǔn)確率與測(cè)試、驗(yàn)證準(zhǔn)確率的差距,最終訓(xùn)練結(jié)果見(jiàn)表2。BERT的適宜迭代次數(shù)(epochs)為2~4次,從第1次到第4次訓(xùn)練,訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率不斷提高,平均訓(xùn)練損失下降速率變緩,平均驗(yàn)證損失收斂在0.67。最終的訓(xùn)練準(zhǔn)確率為0.91,驗(yàn)證準(zhǔn)確率為0.81,測(cè)試準(zhǔn)確率為0.84,BERT模型能在樣本量偏小的情況下較為準(zhǔn)確地識(shí)別出情感傾向,具有較好的適用性。之后將剩余的1,916條數(shù)據(jù)通過(guò)模型預(yù)測(cè)進(jìn)行情感極性識(shí)別,最終整理得到《拉貝日記》個(gè)人日記部分的分句情感極性表,其中積極情感語(yǔ)句743條、中性情感語(yǔ)句1,964條、消極情感語(yǔ)句1,709條。

      表2 模型訓(xùn)練情況

      3 情感可視化分析

      結(jié)合上文情感識(shí)別的數(shù)據(jù)結(jié)果從整體和分人物兩個(gè)維度對(duì)《拉貝日記》進(jìn)行情感可視化分析。首先將個(gè)人日記的全部結(jié)果進(jìn)行整體性分析,旨在探析《拉貝日記》呈現(xiàn)什么樣的情感敘事特征?情感變化是否深切受到外部局勢(shì)的影響?情感敘事是否具有明顯的情節(jié)編排?之后探討拉貝對(duì)不同人物的情感傾向。日記作者對(duì)所記述的不同人物有不同的情感態(tài)度,并且隨著時(shí)間推移對(duì)同一人物的情感往往也有所變化。分析《拉貝日記》情感敘事在不同對(duì)象之間的差異化表現(xiàn),不僅可反映出拉貝的社交圈層和性格特點(diǎn),也為分析其記述是否有明顯的立場(chǎng)偏見(jiàn),是否明顯受到外界局勢(shì)和他人行為的影響提供參考信息。

      3.1 整體性情感分析

      將全部數(shù)據(jù)進(jìn)行數(shù)量統(tǒng)計(jì)與情感曲線制圖(圖1),以獲得全文的情感分布特征及各類情感語(yǔ)句占比。從語(yǔ)句的每日分布情況看,雖然受限于精力、記錄環(huán)境等因素,但即使在情況最惡劣時(shí)期,拉貝仍然有著一定篇幅的文字記錄內(nèi)容,體現(xiàn)了拉貝記錄暴行的決心。在殘酷戰(zhàn)爭(zhēng)背景下,全文中性情感語(yǔ)句數(shù)量最多,整體占比0.44,拉貝寫作風(fēng)格偏向理性。觀察全時(shí)期的情感曲線,發(fā)現(xiàn)日記的情感曲線趨勢(shì)變化會(huì)先于重大歷史節(jié)點(diǎn)出現(xiàn),反映出拉貝對(duì)形勢(shì)敏銳的洞察力,印證拉貝未雨綢繆的處事性格[38]。整體逐漸下落的情感曲線展現(xiàn)出拉貝在戰(zhàn)爭(zhēng)局勢(shì)不斷惡化下,心理壓力持續(xù)加重的精神狀態(tài);而情感曲線下降速率則與外部形勢(shì)的變化相契合,表明拉貝情感波動(dòng)主要受到不明朗時(shí)局的顯著影響。

      圖1 全文情感曲線及各類情感極性語(yǔ)句計(jì)數(shù)

      第1天到第53天拉貝的情感曲線呈現(xiàn)緩慢下落趨勢(shì),第53天內(nèi)累計(jì)情感得分為“-160”分。此時(shí)期是淞滬會(huì)戰(zhàn)和南京空襲時(shí)期,拉貝情緒受到頻繁空襲的負(fù)面影響。經(jīng)統(tǒng)計(jì)原文中這段時(shí)期含有“天氣”語(yǔ)句出現(xiàn)29次,美好天氣意味著空襲威脅,“陽(yáng)光明媚,天氣晴朗!”“上午9時(shí)多壞的天氣——就是說(shuō),天空陽(yáng)光燦爛!”等語(yǔ)句透露出拉貝的負(fù)面情緒。

      第53天日軍正式占領(lǐng)上海,到第72天南京保衛(wèi)戰(zhàn)打響,拉貝的情感曲線整體下落到-238分。情感曲線先快速下降,在第60天開(kāi)始變得平緩,積極情感占比變大。南京形勢(shì)惡化使得拉貝倍感壓力,但之后也發(fā)生了一些帶給他希望的事情。第60天(1937年11月19日)委員會(huì)成立[7]92。第61天(1937年11月20日)拉貝收到妻子來(lái)信[7]93。第64天(1937年11月23日)拉貝因55歲生日的到來(lái)感到快樂(lè),并收到了妻子的電報(bào)與禮物[7]102。第66天(1937年11月25日)拉貝收到日本對(duì)安全區(qū)成立的友好回應(yīng),獲知國(guó)民黨軍隊(duì)正面抗敵的信息,收到妻子的來(lái)信并與鄰里互幫互助[7]105。第70天(1937年11月29日),他看到了希特勒的照片,幻想自己的元首會(huì)幫助中國(guó),并帶給他勇氣和力量[7]117。

      第72天到第84天南京城市淪陷,此段時(shí)期是拉貝情感曲線在全時(shí)期下降最迅速的時(shí)期,情感得分從“-238”下降到“-427”,平均每天有超過(guò)16句負(fù)面語(yǔ)句,高于每日均值。此時(shí)中外人士利用一切可能的交通工具逃離[16],留在南京意味著要冒生命的危險(xiǎn),同時(shí)拉貝寄希望于希特勒的想法破滅,他面臨著前所未有的壓力。

      從第84天南京城市淪陷到日記結(jié)束,此段為南京大屠殺時(shí)期,情感曲線整體持續(xù)下降,在第95-97天曲線下降平緩,正向情感語(yǔ)句偏多。此時(shí)為圣誕節(jié)時(shí)期,大家一起度過(guò)了短暫的溫馨時(shí)光[7]278,安置在拉貝居所中朝不保夕的難民“爭(zhēng)先恐后想讓拉貝有更大的圣誕喜悅”[7]272,甚至布置了圣誕樹(shù)和蠟燭,令拉貝非常感動(dòng)。

      情感曲線也是文學(xué)、電影作品中辨別情節(jié)類型的方法[39],起伏變化透露出作者隱含的敘事意圖。參考文學(xué)作品的情感曲線分類研究[40],如《拉貝日記》敘事中有親近中國(guó)或強(qiáng)化日軍暴行的主觀意圖,其情感曲線通常會(huì)呈現(xiàn)出“盛轉(zhuǎn)衰的跌落”或“落-起-落”的悲劇敘事特征。但由圖1看出,《拉貝日記》的情感曲線持續(xù)下落,沒(méi)有明顯起伏,其情感敘事沒(méi)有明顯的情節(jié)編排。在日記伊始的南京相對(duì)和平時(shí)期,情感曲線便呈現(xiàn)出緩慢下落的特征,拉貝并未刻畫出對(duì)中國(guó)的積極情緒,他對(duì)中國(guó)底層民眾亦未流露出同情心,罵疲倦的人力車夫[7]6,鄙視鄰居鞋匠[7]14;全文情感曲線下降最為迅速的時(shí)期是南京保衛(wèi)戰(zhàn)到南京城市淪陷前,拉貝并沒(méi)有強(qiáng)化南京大屠殺給他帶來(lái)的負(fù)面情緒。

      3.2 分人物情感分析

      參考相關(guān)研究[23],本文將提及相關(guān)人物的語(yǔ)句情感極性視為拉貝對(duì)此人物的情感傾向。因?yàn)橐跃渥訛閱卧R(shí)別的結(jié)果代表該語(yǔ)句的整體情感傾向,本文得出的人物情感值包括3種情況:拉貝對(duì)該人物的態(tài)度、拉貝與該人物共同經(jīng)歷事件后的情感波動(dòng)、拉貝對(duì)人物和事件的整體態(tài)度,需要相關(guān)史料和研究輔以判斷。

      本文選取全文出現(xiàn)次數(shù)排名前20的高頻人物進(jìn)行情感傾向統(tǒng)計(jì),正向、中性、負(fù)向語(yǔ)句數(shù)量見(jiàn)圖2。除妻子多拉和朋友魏特琳,其他所有人物的中性情感語(yǔ)句占比都最高,拉貝對(duì)不同人物的情感傾向整體偏向理性,但對(duì)中國(guó)的國(guó)民黨高層幾乎沒(méi)有積極情感語(yǔ)句,在日記原文中不乏對(duì)國(guó)民黨和中國(guó)軍隊(duì)的批評(píng)。從語(yǔ)句數(shù)量上看,德國(guó)大使館秘書羅森、拉貝秘書韓湘琳、委員會(huì)財(cái)務(wù)主管克勒格爾與妻子多拉是全文提及最多的4個(gè)人物。羅森和克勒格爾與拉貝同為德國(guó)同胞,既有工作關(guān)系,又在難民救助上積極互動(dòng)。妻子多拉的積極情感占比最高,60句相關(guān)語(yǔ)句中有43句為正向情感。

      圖2 高頻人物情感極性統(tǒng)計(jì)

      在人員歸屬上,前20人中參與難民救助的中外人士占9人、日本大使館成員4人、國(guó)民黨政要4人、家庭成員2人、公司下屬1人,可以看出《拉貝日記》中拉貝的主要社交圈集中在難民救助事務(wù)上。由于人物較多,本文針對(duì)拉貝在戰(zhàn)爭(zhēng)期間的主要社交圈層,分類探索拉貝對(duì)相關(guān)人物的情感傾向。

      3.2.1 日本大使館成員

      對(duì)日本大使館全體成員和出現(xiàn)頻次前三成員的相關(guān)語(yǔ)句進(jìn)行情感統(tǒng)計(jì)與可視化(圖3),發(fā)現(xiàn)拉貝對(duì)日本大使館成員總體呈現(xiàn)多元情感態(tài)度。拉貝對(duì)日本人并不持一刀切立場(chǎng),雖然對(duì)日軍暴行表現(xiàn)出厭惡的負(fù)面情緒,但并不諱言日本大使館的禮貌形象,他的情感態(tài)度是日方行為的寫照。

      圖3 日本大使館成員情感曲線和不同情感極性語(yǔ)句的數(shù)量統(tǒng)計(jì)

      從語(yǔ)句情感極性的數(shù)量統(tǒng)計(jì)看,日本大使館全體成員的中性情感語(yǔ)句數(shù)量最多,占比0.57,3名大使館成員的不同情感極性語(yǔ)句數(shù)量占比不同,但也是中性情感語(yǔ)句占比最多。尤其是福井的負(fù)面情感語(yǔ)句數(shù)量占比為0.16,小于其他人物和整體均值,他的態(tài)度較為溫和有禮,拉貝在日記中稱他為“日本大使館全體成員中我唯一寄贈(zèng)西門子日歷記事簿的人”[7]277。他認(rèn)可大使館成員為安全區(qū)的維持付出了努力[7]297,也發(fā)現(xiàn)“他們中有人長(zhǎng)時(shí)間以來(lái)對(duì)日軍的做法深感羞恥”[7]506。

      從情感曲線的時(shí)序變化看,第84天南京城市淪陷起始,日本大使館成員的情感波動(dòng)開(kāi)始出現(xiàn),此時(shí)拉貝通過(guò)外交方式和日本大使館頻繁交涉,希望以此阻止日軍暴行,守護(hù)安全區(qū)秩序。而日本大使館全體人物的情感曲線整體呈現(xiàn)出波折下降的趨勢(shì),反映出交涉結(jié)果的不如意。但是也出現(xiàn)了兩次明顯的短暫上升,這些積極情感是日方行為引發(fā)的結(jié)果:在第96-97天,全體成員的情感曲線有小幅度的上升,拉貝對(duì)態(tài)度溫和的大使館成員有正面描寫[7]281。而在第116-118天,拉貝等人為難民募集到600噸食品,需要日本大使館簽發(fā)入城許可證[7]414,日本大使館為委員會(huì)成員舉行便宴[7]416,肯定他們的工作,使拉貝對(duì)日本大使館的情感曲線有小幅度上升。

      3名日本大使館成員的情感曲線時(shí)序變化是多元化的。福井和田中是日本大使館秘書,情感曲線波動(dòng)較為平穩(wěn),趨于中性情感傾向。參贊福田的情感曲線從南京淪陷后整體呈現(xiàn)顯著下降趨勢(shì),回歸文本,發(fā)現(xiàn)拉貝并不是厭惡福田本人。由于拉貝經(jīng)常向福田提交日軍暴行的事態(tài)報(bào)告,通過(guò)地圖可視化,可以看出多次交涉后,僅僅讓日本大使館周邊小范圍區(qū)域(圖4藍(lán)色橢圓范圍)沒(méi)有被搜集到暴行,收效甚微令他失望。這與早于《拉貝日記》面世的1985年版《侵華日軍南京大屠殺史料》記錄的“經(jīng)拉貝與國(guó)際安全區(qū)委員會(huì)的竭力交涉,敵兵明目張膽的獸行略見(jiàn)減少,但其滅絕人性的殘暴程度,并未降低”史實(shí)相互印證[41]。福田和日本大使館整體在南京城淪陷初期迅速下落情感曲線,也從側(cè)面印證此時(shí)日本軍隊(duì)已在安全區(qū)內(nèi)犯下暴行[15]。

      圖4 事態(tài)報(bào)告地空間分布

      3.2.2 委員會(huì)成員及其他難民救助者

      由于參與難民救助的中外人士較多,本文對(duì)參與難民救助的中立國(guó)全體成員和這其中出現(xiàn)頻次前三的成員進(jìn)行情感分析(圖5)。拉貝對(duì)全體成員的情感曲線隨時(shí)序經(jīng)歷了從平緩波動(dòng)到短期緩慢上升再到迅速持續(xù)下落的變化。情感曲線上升發(fā)生于第63-72天,彼時(shí)為安全區(qū)籌備時(shí)期,拉貝起初期待通過(guò)希特勒來(lái)迫使日本同意設(shè)立安全區(qū),直到第72天(1937年12月1日),拉貝仍然在日記中記錄:“謝天謝地,現(xiàn)在我敢肯定,我們有救了,元首不會(huì)丟下我不管的!”[7]123但第73天(1937年12月2日)開(kāi)始,全體成員的情感曲線開(kāi)始持續(xù)下降至日記結(jié)束。當(dāng)日日本政府否決安全區(qū)的存在,但表示尊重這片區(qū)域,拉貝也獲知不能再指望希特勒的幫助[7]125。南京淪陷后,拉貝和委員們努力通過(guò)外交途徑制止暴行,但日本大使館權(quán)力有限,他們只能在阻止暴行和救助難民上不斷疲于奔波[16]。拉貝對(duì)這些難民救助者的情感曲線展現(xiàn)出他們無(wú)奈又缺乏支援的處境。

      圖5 難民救助者情感曲線及不同情感極性語(yǔ)句數(shù)量統(tǒng)計(jì)

      喬治·羅森是德國(guó)大使館秘書,是《拉貝日記》中提及最多的人物。拉貝得到羅森竭力幫助[7]111,他的相關(guān)語(yǔ)句達(dá)95句。羅森的情感曲線自第21天開(kāi)始出現(xiàn)并長(zhǎng)期波動(dòng)平緩,但從1938年1月初開(kāi)始大幅下降。此時(shí)日本組織成立自治委員會(huì),剝削了國(guó)際安全區(qū)委員會(huì)權(quán)力[42],羅森返回南京,為維護(hù)委員會(huì)利益與日方針?shù)h相對(duì)。羅森在與日方相處時(shí)不掩飾對(duì)日本人的厭惡[43-44],給拉貝與日方的周旋帶來(lái)了麻煩,令拉貝感到無(wú)奈?!安豢煞裾J(rèn),日本大使館的官員們是對(duì)我們有過(guò)一些幫助的唯一的人們?!盵7]418拉貝對(duì)羅森情感曲線的變化也反映出拉貝理智克制、顧全大局的性格特點(diǎn)。

      委員會(huì)中克勒格爾的情感曲線波動(dòng)先于斯邁思出現(xiàn),在南京淪陷后開(kāi)始持續(xù)降低,在第116天后變得平緩。克勒格爾是拉貝的德國(guó)同胞和同事,始終沖鋒在阻攔日軍暴行的第一線,給拉貝帶來(lái)令人心情沉重的暴行信息,后期他前往上海結(jié)婚[7]416,情感曲線便趨于平緩。斯邁思是委員會(huì)秘書,情感波動(dòng)在大屠殺開(kāi)始后出現(xiàn),整體持續(xù)向下。南京淪陷后他負(fù)責(zé)與拉貝一起與日本大使館周旋,但并不能解決日本軍隊(duì)的作風(fēng)問(wèn)題,情感曲線不斷下降也體現(xiàn)了拉貝與斯邁思的焦急和對(duì)交涉結(jié)果的不斷失望。

      3.2.3 妻子

      在所有人物中,拉貝對(duì)妻子的正面情感語(yǔ)句數(shù)量遠(yuǎn)遠(yuǎn)多于負(fù)面和中性情感語(yǔ)句(圖6),情感曲線隨時(shí)序整體持續(xù)爬升,波動(dòng)較低,最高值32分出現(xiàn)在日記結(jié)束。妻兒是拉貝留在南京保護(hù)人民的情感支柱,正面影響貫徹日記各時(shí)段。由圖6可知妻子情感曲線的上升主要來(lái)自在南京保衛(wèi)戰(zhàn)前,截至第72天,妻子的情感累計(jì)得分為20分。彼時(shí)南京局勢(shì)逐漸惡化,拉貝早已將家人送離南京,而自己堅(jiān)守此地。期間,他經(jīng)常通過(guò)電報(bào)與書信與妻子互道想念。在南京保衛(wèi)戰(zhàn)開(kāi)始至淪陷期間,妻子的情感波動(dòng)較和緩,此時(shí)南京局勢(shì)也進(jìn)一步惡化,通訊設(shè)施被破壞,拉貝忙于與各方人士尋求庇護(hù)南京人民的方法。南京城市淪陷后,拉貝更加難以與家人取得聯(lián)系[7]302,但妻子的情感曲線呈現(xiàn)出緩慢上升趨勢(shì),可見(jiàn)在殘酷的大屠殺時(shí)期,妻子是拉貝的重要情感寄托。對(duì)妻子的牽掛展現(xiàn)出拉貝對(duì)家人的脈脈溫情,其情感敘事是自然的、人性化的表達(dá)。

      圖6 妻子情感曲線及不同情感極性語(yǔ)句數(shù)量統(tǒng)計(jì)

      4 結(jié)論

      本文通過(guò)人工標(biāo)注與BERT模型,對(duì)南京大屠殺的重要史料《拉貝日記》進(jìn)行分句情感極性識(shí)別,結(jié)合史料對(duì)照、時(shí)序分析和地圖映射,分析拉貝的情感分布特征、變化趨勢(shì)和對(duì)不同人物的情感傾向,從數(shù)字人文的遠(yuǎn)讀與近讀視角為研究拉貝及南京大屠殺史提供了參考思路。

      (1)補(bǔ)充和完善了拉貝在南京時(shí)期生活的側(cè)面,有助于對(duì)拉貝形成多層次、多角度的認(rèn)識(shí)。全文情感曲線的變化拐點(diǎn)早于重大歷史節(jié)點(diǎn),表明拉貝具有敏銳的洞察力。拉貝對(duì)日本大使館不同成員的情感曲線展現(xiàn)出他客觀、理性的處事態(tài)度。拉貝對(duì)羅森逐漸下落的情感曲線,體現(xiàn)出拉貝謹(jǐn)慎、克制的處事特點(diǎn)。拉貝對(duì)妻子在全時(shí)期持續(xù)上升的情感曲線,折射出拉貝關(guān)愛(ài)家人和極具責(zé)任感的一面。

      (2)與既有的南京大屠殺研究相互驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,日記中性情感語(yǔ)句數(shù)量最多,占比達(dá)44%,為《拉貝日記》敘事的客觀性提供佐證。日軍暴行事態(tài)報(bào)告的地圖映射印證了日軍暴行只是在日本大使館附近略顯減少的事實(shí)。日本大使館在南京城市淪陷初期迅速下落的情感曲線側(cè)面印證此時(shí)日本軍隊(duì)已在安全區(qū)內(nèi)犯下暴行。當(dāng)越多信息匹配起來(lái),有助于建立關(guān)于歷史更為真實(shí)的圖景,為南京淪陷前后提供相關(guān)的輔助資料。

      (3)發(fā)現(xiàn)拉貝的情感書寫主要因外部局勢(shì)與人物行為而觸發(fā),并無(wú)明顯的預(yù)設(shè)偏見(jiàn)。日記全文情感曲線呈現(xiàn)持續(xù)下落趨勢(shì),且未體現(xiàn)明顯的悲劇型情節(jié)編排,表明他并未強(qiáng)化日軍暴行的敘事意圖;而下降速率與戰(zhàn)爭(zhēng)局勢(shì)的變化相契合,反映出拉貝的情感表達(dá)受外界變化的緊密影響。拉貝因日本大使館成員禮貌的工作方式對(duì)他們呈現(xiàn)出客觀多元的情感傾向,因國(guó)民黨高層對(duì)底層民眾安危的不作為而對(duì)他們呈現(xiàn)相對(duì)負(fù)面的情感傾向,說(shuō)明他的史料表述并沒(méi)有明顯的立場(chǎng)偏見(jiàn)。

      本研究展現(xiàn)出數(shù)字人文技術(shù)應(yīng)用于史學(xué)研究的優(yōu)勢(shì),但存在可深化之處。因?yàn)橛邢薜臉颖玖咳菀滓鹉P瓦^(guò)擬合,本文采用數(shù)據(jù)增強(qiáng)和降低模型學(xué)習(xí)率的方式避免這一問(wèn)題,將來(lái)可考慮構(gòu)建垂直領(lǐng)域的相應(yīng)語(yǔ)料數(shù)據(jù)集,對(duì)樣本進(jìn)行補(bǔ)充,以實(shí)現(xiàn)在降低人工成本的同時(shí)提高模型的準(zhǔn)確率和普適性。

      注釋

      ①開(kāi)源項(xiàng)目地址:https://gitee.com/scroll_icon/rabe-diary.git

      猜你喜歡
      拉貝語(yǔ)句南京
      南京比鄰
      “南京不會(huì)忘記”
      阿司匹林、拉貝洛爾聯(lián)合治療妊娠期高血壓
      拉貝洛爾聯(lián)合硫酸鎂治療妊高征的臨床價(jià)值體會(huì)
      重點(diǎn):語(yǔ)句銜接
      精彩語(yǔ)句
      南京·九間堂
      金色年華(2017年8期)2017-06-21 09:35:27
      雪祭
      又是磷復(fù)會(huì) 又在大南京
      硫酸鎂聯(lián)合拉貝洛爾治療妊娠期高血壓的效果分析
      清苑县| 拜泉县| 濉溪县| 永新县| 柘荣县| 伊金霍洛旗| 涿鹿县| 阿克陶县| 田东县| 广灵县| 裕民县| 建始县| 浑源县| 桦南县| 瑞丽市| 东丽区| 历史| 佳木斯市| 白银市| 济宁市| 玛曲县| 林甸县| 独山县| 三江| 黄骅市| 辰溪县| 石柱| 准格尔旗| 泰来县| 永济市| 瑞昌市| 凉城县| 句容市| 肇源县| 咸宁市| 垣曲县| 彭阳县| SHOW| 突泉县| 衢州市| 万山特区|