摘? 要:本文以川端康成代表性作品《雪國》為例,對原著文本進行統(tǒng)一整合,以HTML標(biāo)記方式,將文本中的章,節(jié)及段落內(nèi)容進行細(xì)致劃分后,采用文本分析軟件KH Coder對標(biāo)記后的整篇文本文檔進行相關(guān)系列數(shù)據(jù)挖掘。在挖掘出的相關(guān)文本數(shù)據(jù)的基礎(chǔ)上,計算出高頻詞匯,再以共起網(wǎng)絡(luò)效果圖的形式,展現(xiàn)出彼此相互之間的對應(yīng)關(guān)系以及各自所對應(yīng)的文本內(nèi)容,進而對文本中的女性形象進行數(shù)據(jù)化實證分析。
關(guān)鍵詞:雪國;數(shù)據(jù)挖掘;女性形象
作者簡介:陶建明(1992-),男,漢族,湖北武漢人,文學(xué)碩士,武漢文理學(xué)院助教,研究方向:日本文學(xué)、日語教育、社會語言學(xué)。
[中圖分類號]:I106? [文獻標(biāo)識碼]:A
[文章編號]:1002-2139(2021)-08--02
1.研究背景
文學(xué)作品是時代社會發(fā)展的產(chǎn)物。通過對不同國家文學(xué)作品中的細(xì)節(jié),語言,人物形象進行研究解讀,能夠在一定程度上,窺探出不同國家在具體時代的社會歷史特征。在對日本文學(xué)的研究中,新感覺派代表作家川端康成的文學(xué)作品,因文筆新穎,人物形象刻畫細(xì)致,具有較高的美學(xué)藝術(shù)價值,因此一直備受國內(nèi)外研究學(xué)者的青睞。而川端康成的文學(xué)作品中,由于存在大量關(guān)于女性角色的刻畫描寫,因此針對作品中女性形象的分析也是歷來研究的焦點之一。然而眾多先行研究多傾向于主觀判斷,研究成果缺乏相關(guān)理論數(shù)據(jù)支撐。
近年來,數(shù)字人文研究方法在文學(xué)研究領(lǐng)域取得不斷發(fā)展和創(chuàng)新,基于數(shù)據(jù)人文視角,本文以川端康成的代表作品《雪國》為例,利用文本分析軟件KH Coder,對標(biāo)記后的整篇文本文檔進行相關(guān)系列數(shù)據(jù)挖掘,通過文本中的高頻詞匯,建立起共起網(wǎng)絡(luò)效果圖,以此為基礎(chǔ)整合相關(guān)數(shù)據(jù),進一步探究《雪國》文學(xué)作品文本中出現(xiàn)的女性形象。
2.文本整理與分析
2.1 文本預(yù)前處理
將日語原版《雪國》作品文檔,輸入整理成txt文本文檔形式,以HTML方式將整篇文本文檔劃分為倆章,分別以
2.2文本導(dǎo)入與分析
將預(yù)前處理好的《雪國》文本文檔導(dǎo)入軟件KH Coder,對整篇文本中的高頻詞匯進行數(shù)據(jù)化抽取,在導(dǎo)出的文本Excel中,人物名詞島村,駒子和葉子的出現(xiàn)次數(shù)分別以322次,214次,78次位居前列。拋出文本內(nèi)容的影響,僅從這組數(shù)據(jù)觀察,便可斷定這三人在文本內(nèi)容中的主人公地位。而駒子和葉子這兩位女性形象的高頻出現(xiàn),同樣為本文研究的開展,進一步提供了理論數(shù)據(jù)支撐。
為進一步探究文本內(nèi)容要素的相關(guān)性,深入挖掘駒子和葉子這兩位女性形象相關(guān)數(shù)據(jù)信息,結(jié)合以上數(shù)據(jù),以文本段落為計算單位,其中在語言的取舍上,最小段落單位為1,最少詞頻出現(xiàn)次數(shù)為20,利用KH Coder,對整篇文本文檔中抽取出的高頻詞匯,進行共起網(wǎng)絡(luò)可視化分析,中心媒介網(wǎng)絡(luò)共起效果圖如下圖1所示。結(jié)合圖1右邊的Centrality參考值(中心度越高,顏色越深)以及Frequency參考值(出現(xiàn)頻率越高,圓圈面積越大)。
綜合比對后,可以再次很明顯發(fā)現(xiàn)島村,駒子以及葉子這三位人物形象,在整篇文本內(nèi)容網(wǎng)絡(luò)共起效果圖中的中心地位,進一步對圖1中的結(jié)論進行了證明。同時,在圖1中駒子和島村在整篇文本中的出現(xiàn)頻率數(shù)值雖然不同,但是從效果圖的顏色進行判斷,其呈現(xiàn)出和島村十分接近的顏色,而相較于島村和駒子,葉子在整篇共起網(wǎng)絡(luò)效果圖中,顏色呈深藍色,在整篇文本內(nèi)容中中心度最高。由此可見對兩位女性形象進行深入挖掘的必要性和可行性?;谝陨习l(fā)現(xiàn),繼續(xù)深挖相關(guān)內(nèi)容和數(shù)據(jù),對圖1中駒子和葉子周圍出現(xiàn)的相關(guān)聯(lián)高頻詞匯進行觀察和分析,與葉子關(guān)聯(lián)度最高的高頻詞匯分別為“聲”“美しい”“胸”“目”“顔”“家”等,而與駒子關(guān)聯(lián)度最高的高頻詞匯分別為“手”“自分”“思う”“言う”“顔”等詞。然而圖1呈現(xiàn)出的共起網(wǎng)絡(luò)效果圖,在對應(yīng)高頻詞匯的數(shù)據(jù)分析上,難以精準(zhǔn)判斷,因此利用KH Coder的關(guān)鍵詞索引功能,輸入關(guān)鍵詞葉子和駒子后,以葉子為例,抽出結(jié)果如下圖2所示,。
根據(jù)圖2,呈現(xiàn)出的相關(guān)數(shù)據(jù),可以對照圖1得出的相關(guān)結(jié)果,進行佐證以及進一步細(xì)化說明。圖2中,關(guān)于葉子的高頻詞匯,除了可以精確到文本文段中抽出的關(guān)鍵詞前后具體位置之外,還可以繼續(xù)進行數(shù)據(jù)統(tǒng)計補充說明,其中的高頻詞匯按照分?jǐn)?shù)高低, 可依次排列為“顔”(2.200)“聲”(1.450)“美しい”(1.333)“目”(1.083)“胸”(1.000)“家”(0.833),除此之外還有如“腓”(1.000)“胯”(0.917)等相關(guān)高頻詞匯的補充。參考圖2,同樣關(guān)于駒子的高頻詞匯,依舊可以精確到所抽出的關(guān)鍵詞前后具體位置,根據(jù)分?jǐn)?shù)高低,依次進行排序“言う”(5.333)“顔”(3.083)“自分”(2.000)“手”(1.450)“思う”(0.850),除此之外在抽取的圖片中還出現(xiàn)了“目”(1.533)“姿”(1.500)“肩”(1.500)“髪”(1.000)等詞,并且附上了有關(guān)個人性格的表達性詞匯,如“愛情”(1.000)“笑う”(1.450)等。結(jié)合文本中對應(yīng)的內(nèi)容,通過這些數(shù)據(jù)對比,足以佐證葉子是一個極具女性之美的人物形象,是日本現(xiàn)實社會中忠實家庭婚姻的典型傳統(tǒng)女性形象的代表。而與之相對應(yīng)的駒子,結(jié)合對應(yīng)的文本內(nèi)容,其除了具備像葉子那種日本女性之美外,還是一個性格活潑,善于健談的女性形象。但是反觀圖1中,出現(xiàn)的“自分”“思う”以及后續(xù)有關(guān)駒子的抽取圖片中“愛情”等高頻詞匯,可以看出文本呈現(xiàn)出的駒子,又不同于葉子那種典型傳統(tǒng)日本女性形象,是一個擁有女性獨立意識,敢于追求屬于自己愛情的典型女權(quán)主義女性社會形象。
3.結(jié)語
基于數(shù)字人文視角,本文采用KH Coder文本計量分析軟件,對川端康成文學(xué)代表作品《雪國》文本進行數(shù)據(jù)挖掘,通過高頻詞匯的統(tǒng)計和網(wǎng)絡(luò)共起效果圖,確定文本中的主要代表人物后,對文本中的駒子和葉子倆位女性人物形象,進行進一步的數(shù)據(jù)挖掘與分析。采用關(guān)鍵詞信息抽取功能,將倆者分別作為中心詞進行數(shù)據(jù)提取,補充與分析。結(jié)果表明文本中呈現(xiàn)出的倆位女性形象既有共性即女性外在軀體之美外,又存在彼此的個性之美。其中葉子是典型的具有日本家庭傳統(tǒng)女性之美的人物形象,而相比之下的駒子卻有著不同于葉子的形象特征,結(jié)合相關(guān)數(shù)據(jù)支撐,文本中刻畫是一個性格活潑樂觀,擁有女性獨立意識,在現(xiàn)實生活中不拘泥于社會婚姻制度,敢于追求自身愛情的典型女權(quán)主義女性社會形象。除此之外,根據(jù)中心媒介共起網(wǎng)絡(luò)效果圖中提供的相關(guān)信息,并結(jié)合Centrality參考值,可以很客觀發(fā)現(xiàn)“葉子”在整篇文本中的中心度值位居首位,這一新發(fā)現(xiàn)為后續(xù)對“葉子”這個女性人物形象的進一步深入挖掘分析,提供了理論數(shù)據(jù)支撐。
本文采用數(shù)據(jù)人文研究方法,對日本文學(xué)作品《雪國》進行了大膽嘗試與分析,通過KH Coder制作出相關(guān)圖文和數(shù)據(jù),對以往先行研究中的結(jié)論進行了驗證,豐富并初步取得了一定的進展,然而對葉子這一女性形象的研究仍有進一步挖掘和分析的空間,相關(guān)圖文信息由于版面受限不能一一展示,后續(xù)仍需要進一步豐富和完善。文章中諸多不足之處,還請多多指正。
參考文獻:
[1]梅沢亜由美.川端康成『雪國』 : その世界と視點人物についての考察[J].日本文學(xué)誌要 (46), p50-61, 1992.
[2]樋口耕一.『社會調(diào)査のための計量????分析-內(nèi)容分析の継承と発展を目指して』[M]?????出版,2014.
[3]松井幸子.田村俊子『木乃伊の口紅』の女[J].日本語と???????第12號,2012.
[4]劉克華;白露.論村田沙耶香《方舟》中的性別意識[J].當(dāng)代外國文學(xué),2018.
[5]李圣杰.反烏托邦視閾下的《薔薇香》[J].日本學(xué)刊,2019.
[6]李先瑞.論日本女性主義文學(xué)文本中女性形象的嬗變[J].日語教育與日本學(xué)研究,2015.
[7]譚晶華.川端康成文學(xué)的藝術(shù)性·社會性研究[D]. 上海外國語大學(xué) 2009.
[8]項蕾; 許婷; 譚天; 雷寧; 蔡翔宇.數(shù)字與文學(xué)的對話——“數(shù)字人文規(guī)范對傳統(tǒng)文學(xué)研究方法的挑戰(zhàn)”研討會紀(jì)要[J].中國現(xiàn)代文學(xué)研究叢刊,2020.