王弘睿,于 東
(1. 中央民族大學(xué) 國際教育學(xué)院,北京 100081;2. 北京語言大學(xué) 信息科學(xué)學(xué)院,北京 100083)
做出道德判斷的能力是人類智力的一個獨特元素。例如,對于“惡意謀殺”這一行為,人們普遍認為其是不道德的,因為它危害了他人的生命。在計算機技術(shù)迅速發(fā)展的今天,人工智能不斷模糊著物理世界與個人生活的界限,延伸出復(fù)雜的倫理和安全問題,如歧視、隱私侵權(quán)、造謠傳播等。如何將人類的價值觀和道德規(guī)范嵌入人工智能系統(tǒng),讓機器學(xué)會人類的道德知識,具備做出道德判斷的能力,成為機器倫理領(lǐng)域的重要研究問題[1]。
現(xiàn)有的研究工作多集中于粗粒度的道德判斷[2-8],如Jentzsch等[6]通過劃分道德和不道德兩種極性,對道德行為進行傾向性判斷;Araque等[7]突破道德判斷的二元屬性,增加了中性的概念。Yan等[8]則在判斷方法上進行了優(yōu)化,先判斷動作行為與道德行為相關(guān)或無關(guān),再進一步判斷相關(guān)事件的道德傾向性。中文道德詞典[9]在進行傾向性判斷的基礎(chǔ)上,引入了詞性特征,除了道德行為動作,還增加了道德行為對象、地點、媒介等概念,對道德事件有了更為全面的描述。除了簡單的傾向性判斷,道德基礎(chǔ)理論(moral foundations theory, MFT)[10-12]提出了五種美德類型,對道德行為進行細粒度的理解和歸類,并構(gòu)造了對應(yīng)的詞典資源,成為西方較為主流的道德分類系統(tǒng)。但是,道德作為一種獨特的文化現(xiàn)象,在不同的社會背景下會有不同的表現(xiàn)。人類的道德觀念是復(fù)雜的,難以形成為絕大多數(shù)國家地區(qū)所公認的道德規(guī)則。盡管道德基礎(chǔ)理論宣稱其具有不同群體、不同地區(qū)的廣泛適應(yīng)性,但事實上, Haidt選用的幾乎全部是美國案例,并沒有意識到他們的地區(qū)狹隘性,所以由此得出的道德基礎(chǔ)理論主要體現(xiàn)的還是美國的價值觀與話語方式,其道德分類不完全適用于強調(diào)集體主義的漢語環(huán)境[13]。鑒于道德觀念在不同地區(qū)和社會政治制度中解釋各不相同的復(fù)雜現(xiàn)實,不同社會設(shè)計和采用細粒度道德判斷的方式也會相應(yīng)有所差異。因此,如何能夠基于地域群體特征,對不同社會、文化和政治環(huán)境進行有針對性的道德判斷問題進行研究,有著更為重要的現(xiàn)實意義。
目前,中文方面缺少適用于中國社會環(huán)境的、對道德行為進行細粒度語義劃分的相關(guān)研究。考慮到道德判斷的復(fù)雜性,我們在《新時代公民道德建設(shè)實施綱要》(以下簡稱《新綱要》)的啟發(fā)下,將重點放在《新綱要》所體現(xiàn)的當下時期中國社會的道德行為類型研究。盡管中國社會本身由多種民族文化和傳統(tǒng)組成,但中國作為一個統(tǒng)一的社會政治、法律結(jié)構(gòu),《新綱要》作為中共中央、國務(wù)院印發(fā)的全面、系統(tǒng)、完整的道德建設(shè)綱領(lǐng)性文件,能夠反映當下中國社會內(nèi)部最廣泛適用和制度化的共識道德觀及道德原則。
綜上,針對目前缺乏適用于中國社會環(huán)境的、細粒度語義劃分的中文道德知識資源這一問題,本文提出了面向機器道德判斷任務(wù)的細粒度中文道德語義知識庫構(gòu)建任務(wù)。本研究的主要貢獻包括以下4個方面:
(1) 設(shè)計了道德行為歸類體系,深入分析詞的語義特征,對道德行為進行多維度、多層面的審查和拆分。
(2) 設(shè)計了道德框架表示體系,依據(jù)道德行為發(fā)生的場景環(huán)境,選取以框架的方式進行表示。每個框架包括框架名、定義、框架元素、框架關(guān)系和框架詞元五部分。
(3) 探索同一框架詞元的內(nèi)部特征,設(shè)計了道德強度衡量體系,進一步標注和區(qū)分詞元強度。
(4) 構(gòu)建了中文道德語義知識庫數(shù)據(jù)資源,共15 371詞,并驗證了理論體系的合理性和可行性。
本節(jié)對道德判斷的相關(guān)理論研究進行梳理,包括普世價值觀念下的道德內(nèi)容二元論與道德內(nèi)容多元論,以及基于地域文化背景下的歐盟文化道德體系與中國文化道德體系。
1.1.1 認知道德發(fā)展理論
基于個人主義文化下的道德體系,主張道德基礎(chǔ)二元論,其所使用的情境集中于公正與幸福兩方面道德內(nèi)容上。這一理論涉及的道德問題局限于個體間的關(guān)系與規(guī)則方面,然而在社會生活中,道德判斷更多地處于關(guān)系情境中,人際層面的道德內(nèi)容不能充分解決社會關(guān)系中的實際沖突。因此,這一理論解釋范圍有限,在現(xiàn)實中難以準確地描述道德行為。
1.1.2 道德基礎(chǔ)理論
在認知道德發(fā)展理論的基礎(chǔ)上進行了進一步探索,認為人類的道德內(nèi)容遠不止公正與幸福的這二元基礎(chǔ),而是具有包含“關(guān)愛/傷害”“公平/欺騙”“忠誠/背叛”“權(quán)威/顛覆”“圣潔/墮落”等在內(nèi)的多元基礎(chǔ)。五元道德內(nèi)容可以被劃分為兩個層面: 關(guān)愛、公平從個體層面強調(diào)了應(yīng)該如何與他人相處、如何保護和尊重他人,屬于個體化的道德基礎(chǔ);忠誠、權(quán)威和圣潔則著重解決將個體聯(lián)結(jié)到群體或道德共同體之內(nèi)的問題,屬于聯(lián)結(jié)性的道德基礎(chǔ)。
已有研究表明,不同文化之間存在道德狹隘主義[14-16]。長期進化雖然使人類形成了共享的道德基礎(chǔ),但不同的社會主要依據(jù)的道德基礎(chǔ)卻有所不同,有的社會僅選取一種或兩種道德基礎(chǔ)來建立自己的道德秩序,而有的社會卻五種都用到。例如,游牧民族比耕種民族的組織結(jié)構(gòu)更為松散,流動性也更大,對于群體忠誠和權(quán)威性層級關(guān)系的要求也就相對較低[17]。因此,根據(jù)不同社會、文化和政治環(huán)境進行有針對性的道德判斷研究,有著重要的應(yīng)用價值。
幾千年來,人類一直在思考道德問題。蘇格拉底、柏拉圖和亞里士多德注重幸福、正義和勇氣,而孔子則強調(diào)仁、義、禮的重要性。馬克思主義倫理學(xué)在歷史唯物主義基礎(chǔ)上,將道德作為社會歷史現(xiàn)象加以研究,認為沒有任何一種道德是永恒不變的,不同的時代、不同的國家有不同的道德觀念[18]。
Evgeni等[19]認識到,不同文化和社會政治制度中可能存在不同的價值選擇,因此,他們選取《歐洲聯(lián)盟基本權(quán)利憲章》作為理論指導(dǎo),認為其代表了歐盟成員國之間最廣泛共享和制度化的一套共識價值觀和倫理原則,并基于該憲章提出了適用于歐盟文化背景的道德分類體系,分為尊嚴、自由、平等和團結(jié)四類,用以解釋歐盟社會內(nèi)部的核心價值觀。
我國歷來重視倫理道德觀的建設(shè)。繼2001年頒布《公民道德建設(shè)實施綱要》(以下簡稱《綱要》)后,又于2019頒布《新時代公民道德建設(shè)實施綱要》(以下簡稱《新綱要》),對《綱要》中提出的社會主義公民道德建設(shè)內(nèi)容體系進行完善,是馬克思主義倫理學(xué)在中國當代發(fā)展的一大成果,標志著社會主義公民道德建設(shè)內(nèi)容體系在新時代的新升華[20]。
《新綱要》中劃分的社會公德、職業(yè)道德、家庭美德和個人品德覆蓋了道德活動的主要領(lǐng)域,一個社會的文明進步和風氣好壞,都集中體現(xiàn)在這四個社會生活領(lǐng)域中。《新綱要》中的道德內(nèi)容部分的探索則經(jīng)過了一個不斷深化的過程,通過總結(jié)18年來我國加強公民道德建設(shè)的經(jīng)驗,汲取理論界、學(xué)術(shù)界已有的研究成果,對《綱要》中倡導(dǎo)的“20字”基本道德規(guī)范加以調(diào)整、提煉和凝結(jié),設(shè)定了具體明確的美德行為,為四大領(lǐng)域的道德建設(shè)提供了權(quán)威依據(jù)[21]。
《新綱要》中覆蓋的道德內(nèi)容類型既代表了道德建設(shè)中最重要和最基本的道德內(nèi)容,也是每一個公民進德、修業(yè)、立人之本。一方面,《新綱要》基于我國的文化背景,體現(xiàn)了傳統(tǒng)道德和時代精神的統(tǒng)一: 愛國、誠信、勤勞等中國人古已有之,自強、敬業(yè)、奉獻,則更多地體現(xiàn)出當下社會對個體行為的要求。另一方面,《新綱要》具有道德實踐的普適性: 《新綱要》簡約、現(xiàn)實、易行,適宜于各個階層、各種身份、各種黨派的社會公民,是每個公民的道德實踐和道德生活都適用的行為規(guī)范。
因此,本文選取《新綱要》作為本文分類的重要理論參考,使用其研究當下時期中國社會重點領(lǐng)域的重要道德行為內(nèi)容。
目前,中文方面缺少在中國社會文化背景下對道德事件進行細粒度語義歸類的相關(guān)研究。在此背景下,我們在中文道德詞典資源的基礎(chǔ)上,提出了中文道德語義知識庫的構(gòu)建任務(wù)。通過綜合道德判斷的理論研究、我國的文化背景及當下的時代特征,選取《新綱要》作為理論指導(dǎo),嘗試對道德行為進行細粒度的語義歸類和特征研究。
本節(jié)首先對道德行為進行個體與聯(lián)結(jié)層面的審查和拆分,然后,依據(jù)道德行為發(fā)生的場景環(huán)境進行選取和歸類,并使用框架的方式進行表示,每個框架包括框架名、定義、框架元素、框架關(guān)系和框架詞元五個部分。最后,對同一框架中詞元的內(nèi)部特征進行探索分析,進一步標注和區(qū)分詞元的強度差異。
首先從個體和聯(lián)結(jié)層面對《新綱要》中的道德分類進行了分析和審查,然后從場景環(huán)境維度將道德行為概括劃分為四大場景類型,最后對每個場景內(nèi)部的具體美德行為進行了拆分和篩選,構(gòu)建起道德行為歸類體系。
道德判斷相關(guān)理論研究表明,道德行為包括個體化的道德行為和聯(lián)結(jié)性的道德行為兩部分,既要從個體層面理解學(xué)習如何與他人相處,又要解決將個體聯(lián)結(jié)到群體或道德共同體之內(nèi)的問題。這一劃分方式不僅在測量方面有一定合理性,也存在多種的神經(jīng)生理基礎(chǔ)[22-23]。
《新綱要》從中國社會文化環(huán)境出發(fā),總結(jié)描述社會環(huán)境中多種層面的道德行為,分類和內(nèi)容全面總結(jié)了個體與聯(lián)結(jié)兩個層面的道德內(nèi)容?!皞€人品德”列舉了包括勤勞、善良、自強等個體化的道德行為,“社會公德”“職業(yè)道德”“家庭美德”三類則分類解釋了個體與特定群體或道德共同體之間的道德關(guān)系,描述了聯(lián)結(jié)性的道德行為。
通過對中文道德詞典中的語料分析發(fā)現(xiàn),實際現(xiàn)實環(huán)境中的道德行為更為復(fù)雜多樣。在不同的場景環(huán)境下,人類往往需要遵循特定的道德規(guī)則[24]。例如,一位工作的已婚男性除了需要遵循作為公司員工的職業(yè)道德,還需要承擔作為丈夫的家庭責任。
基于此,本文對道德行為進行了場景環(huán)境層面的劃分,劃分為社會公德、職業(yè)道德、家庭美德和個人品德四種道德場景,每種場景與其對應(yīng)的描述場景范圍如表1所示。
表1 道德場景及其描述范圍
道德行為的形成和選擇經(jīng)歷了長期的文化積累和歷史傳承,人類對符合社會發(fā)展需要的行為進行總結(jié)和概括,提煉出提倡人們?nèi)プ龅拿赖滦袨?。因此,具體到每個道德場景內(nèi)部,每個場景中又都覆蓋了大量具體的道德行為。
本文基于中國的文化背景和時代特征,對《新綱要》中列舉的具體美德行為進行了拆分,每種道德場景的具體道德行為示例如表2所示。其中,社會公德場景包括文明禮貌、助人為樂、愛護公物、保護環(huán)境和遵紀守法;職業(yè)道德場景包括愛崗敬業(yè)、誠實守信、辦事公正、熱情服務(wù)和奉獻社會;家庭美德場景包括尊老、愛幼、男女平等、家庭和睦、勤儉持家和鄰里互助。個人品德場景包括愛國、奉獻、勤勞、善良、寬厚、正直、自強和自律。
表2 具體道德行為示例
為了驗證道德歸類體系對現(xiàn)實道德行為的覆蓋程度,本文選取人民網(wǎng)社會板塊(1)http://society.people.com.cn/中的“社會萬象”和“民生報道”兩個欄目從2020年8月到2020年11月共4個月的新聞報道進行道德場景及道德行為歸類的匹配驗證。本文將新聞報道的標題及內(nèi)容進行了匯總,并通過人工標注的方式對新聞逐篇進行分類判斷。首先,標注人員需要判斷該新聞是否與道德相關(guān),與道德無關(guān)的新聞將不被標注,然后,標注人員按照道德行為歸類體系對帶有道德極性的新聞報道進行道德行為歸類,最后,本文對新聞報道的歸類情況進行了統(tǒng)計。最終標注結(jié)果顯示,道德歸類體系可以覆蓋97.6%的道德相關(guān)新聞事件,如“防汛工作常備不懈 他把雨聲當‘鬧鈴’”可以歸類為職業(yè)道德中的愛崗敬業(yè)。這表明了道德歸類體系能夠較好地覆蓋真實道德文本語料,能夠?qū)Ξ斚轮袊鐣h(huán)境中的道德行為進行合理的描述和歸類。
道德事件往往發(fā)生在一個綜合化的情境中,除了道德行為本身,還有著復(fù)雜的背景信息,比如道德事件的參與者、道德事件發(fā)生的場所等。Flame將“框架”定義為跟激活性語境相一致的結(jié)構(gòu)化的范疇系統(tǒng),是儲存在人類認知經(jīng)驗中的圖式化情境[25]。使用框架來表示道德事件,能夠描述儲存在人類認知經(jīng)驗中,與道德行為、道德事件相關(guān)的圖示化情境。因此,本文使用框架的方法來表示道德事件復(fù)雜的情景概念。
道德框架庫中的每個框架都按以下五個方面進行描述: ①框架名; ②框架定義; ③框架元素; ④框架關(guān)系; ⑤框架詞元。完整道德框架內(nèi)容示例如表3所示。
表3 完整道德框架內(nèi)容示例
框架名框架的名稱。根據(jù)道德行為歸類體系劃分為一級框架和二級框架。
一級框架包括社會公德、職業(yè)道德、家庭美德和個人品德四大道德場景,二級框架為其場景下對應(yīng)的具體道德行為。
框架定義參考《新綱要》及相關(guān)文件,對每一個框架進行概念區(qū)分,給出詳細的定義。
框架元素框架中的參與者稱為框架元素,框架元素再分為核心框架元素和非核心框架元素。
核心框架元素是理解框架的必有成分,非核心框架元素則表達空間、環(huán)境條件等外圍語義成分。
框架關(guān)系不同框架間的關(guān)聯(lián)關(guān)系。目前框架間的關(guān)系主要包括繼承關(guān)系(父框架與子框架)和總分關(guān)系(總框架與分框架)兩種關(guān)系。
其中,繼承關(guān)系體現(xiàn)了道德場景與道德行為類型之間的包含關(guān)系,總分關(guān)系則體現(xiàn)了個體道德行為與聯(lián)結(jié)道德行為的交叉性。
框架詞元該框架所覆蓋的中文道德詞典資源中的具體詞元。
通過框架的表示方法,可以將不同的道德場景和道德類型進行串聯(lián),形成完整的道德場景及其行為的描述體系,能夠更為系統(tǒng)地對道德行為進行歸類和描述。
本節(jié)通過道德框架的標注,對道德行為進行了進一步的分析觀察,發(fā)現(xiàn)在同一框架內(nèi)部,詞元的道德強度也是道德行為非常重要的一個特征。例如,“殺人”和“亂扔垃圾”都是不道德的,且同屬于“社會公德”這一道德場景,但人們會覺得“殺人”的不道德程度更高。該現(xiàn)象廣泛存在,我們將其定義為道德行為的強度,并從道德強度衡量指標和衡量方法兩個維度設(shè)計了道德強度的衡量體系。
2.3.1 衡量指標
Jones提出了道德強度(moral intensity)的概念以及衡量道德強度的幾個維度,包括結(jié)果嚴重度、社會輿論、效應(yīng)可能性、時間即刻性、接近性和效應(yīng)集中性[26]。
社會輿論討論的是同一行為在不同社會的共識程度,由于本文討論的環(huán)境是新時代中國社會的道德行為現(xiàn)象,故不涉及社會輿論問題。效應(yīng)可能性是指行為引起損害的可能性,如把槍賣給一個搶劫犯比把槍賣給一個守法公民所引起損害結(jié)果的可能性更大;時間即刻性是指行為造成損害結(jié)果何時產(chǎn)生,是立即產(chǎn)生還是經(jīng)過一段時間才會顯現(xiàn);接近性是指行為受害對象與行為人的遠近程度,如解雇總公司的員工給人的感覺比解雇分公司的員工更不道德;效應(yīng)集中性是指行為損害結(jié)果的聚集程度,損害結(jié)果是集中在幾個人身上還是分散在很多人身上。然而,詞級別語料覆蓋信息量往往比較有限,以“殺人”為例,未能包含行為的具體結(jié)果及聚集程度、對象關(guān)系、發(fā)生時間等信息。結(jié)果嚴重度指不符合道德規(guī)范行為導(dǎo)致?lián)p害結(jié)果的程度,例如,“致人死亡”比“致人受傷”的結(jié)果嚴重度更高。因此,我們選取結(jié)果嚴重度作為道德強度的衡量指標,根據(jù)常識對道德詞匯可能發(fā)生的嚴重結(jié)果進行可能性推斷。
我們將詞歸屬到社會公德、職業(yè)道德、家庭美德和個人品德四個場景框架中。在每個場景內(nèi)部區(qū)分道德強度,從而更好地衡量同一類別詞的道德行為。比如我們很難直接比較社會公德中的“連環(huán)殺人”和職業(yè)道德中的“巨額腐敗”哪個行為的道德強度更高。但對同樣是“社會公德-遵紀守法”框架中的“偷錢包”和“連環(huán)殺人”則能很好做出強度判斷,這一點也體現(xiàn)了類別框架內(nèi)部的語義特征對于道德強度的影響。
2.3.2 衡量方法
我們將道德強度放在一個7級的量表中。如圖1所示,每個詞對應(yīng)[-3,3]區(qū)間內(nèi)的一個強度值,越靠近-3的詞,越接近非常不道德,越接近3的詞,越接近非常道德,中間值0代表中性。
圖1 道德強度示例
本節(jié)首先介紹中文道德語義知識庫數(shù)據(jù)資源的標注方法及標注流程安排,然后分析標注過程的一致性情況和覆蓋道德文本語料情況,最后對最終標注結(jié)果的分布進行了統(tǒng)計和分析。
中文道德語義知識庫資源構(gòu)建語料來自中文道德詞典[9],該詞典共包含25 012個詞,其中正向道德詞7 912個,負向道德詞7 647個,中性詞8 963個,被動詞490個。標注工作再分為兩個任務(wù),任務(wù)一是按照道德行為歸類體系,為每個框架標注其框架詞元,任務(wù)二是在框架標注的基礎(chǔ)上,在同一框架內(nèi)部標注詞元的道德強度,具體標注流程如圖2所示。
圖2 標注流程
3.1.1 道德行為歸類
本任務(wù)選取中文道德詞典[9]中帶有道德極性標簽的詞,共15 559詞。通過人工標注的方法對其進行道德行為歸類并填充進所屬框架。
標注人員4名培養(yǎng)層次為碩士的在校學(xué)生。
標注內(nèi)容根據(jù)道德行為歸類體系和框架內(nèi)容對詞進行道德判斷,選取其所屬的道德框架,進行細粒度語義歸類。
標注流程首先對標注人員進行培訓(xùn)和試標注,保留試標注正確率在85%以上的標注人員,進行正式標注。正式標注過程中,首先,標注四種道德場景,即社會公德、職業(yè)道德、家庭美德和個人品德。然后標注每個道德場景對應(yīng)的具體道德行為類型。檢查無誤后提交標注結(jié)果。
3.1.2 道德強度標注
本任務(wù)選取已標注框架標簽的15 371個詞,按照道德強度衡量體系進行二次標注。
標注人員3名培養(yǎng)層次為碩士的在校學(xué)生。
標注內(nèi)容根據(jù)道德強度衡量體系對詞進行道德強度標注,標值為-3、-2、-1、0、1、2、3。
標注流程經(jīng)過培訓(xùn)和試標注后,每個詞由三個人進行標注。檢查無誤后提交標注結(jié)果。
在試標注和正式標注環(huán)節(jié)中,對標注人員的具體標注情況進行了一致性檢測,并對最終標注結(jié)果與原詞典資源進行了覆蓋度分析。通過分析發(fā)現(xiàn),該理論體系具有良好的內(nèi)部一致性,能夠覆蓋絕大部分的道德行為,從而在一定程度上支持了道德歸類體系理論的合理性。
3.2.1 標注一致性情況
在道德框架詞元的標注中,每個詞由兩人同時進行標注,不一致的詞將交由第三個人進行檢查,有爭議的標注結(jié)果將被剔除。標注人員通過培訓(xùn)答疑,熟悉標注流程后,正式標注的一致性為85.3%,其中,框架大類的一致性為83%,框架小類的一致性為87.3%。這一結(jié)果顯示出道德歸類體系和框架表示體系定義較為明確,能夠幫助標注人員做出合適的決定。
在不一致的情況中,框架大類的不一致情況主要集中在“社會公德”和“個人品德”之間,這是因為部分詞所描述的場景不夠具體,導(dǎo)致標注人員對其發(fā)生場景的判斷不一致,例如,“弄虛作假”一詞,有標注人員判斷為“社會公德-遵紀守法”框架,另一標注人員判斷為“個人品德-正直”框架。框架小類的不一致情況則主要集中在個人品德內(nèi)部,自強和自律、寬厚和正直等的界限區(qū)分。例如,“反思”,有標注人員判斷為“自強”框架,另一標注人員判斷為“自律”框架。這也是因為詞級別的知識所覆蓋的信息量有限所造成的。
3.2.2 標注覆蓋道德詞典語料情況
經(jīng)過兩輪標注,最終獲得有效標注結(jié)果共15 371個詞,占全部標注詞的98.8%,只有1.2%的詞被剔除。被剔除的詞中,一部分是較為抽象的詞,比如“仁義道德”,雖然被判斷為道德,但難以確定其所歸屬的框架。另一部分是超過公民能力層面的道德行為,如“軍事援助”,屬于國家層面的道德行為,因此難以歸入框架。
中文道德語義知識庫數(shù)據(jù)資源構(gòu)建任務(wù)的最終標注結(jié)果共15 371個詞,本節(jié)對兩個標注任務(wù)分別進行了標注結(jié)果的統(tǒng)計和分析。
3.3.1 道德行為歸類
道德行為歸類任務(wù)最終標注結(jié)果的分布情況如圖3所示。通過分析標注結(jié)果可以看出,道德場景方面,道德詞典語料中發(fā)生在社會公德場景的事件占比最多,發(fā)生在家庭美德場景的事件占比最少。這體現(xiàn)出道德事件發(fā)生的場景環(huán)境: 大多數(shù)道德相關(guān)行為還是發(fā)生在公共環(huán)境中,發(fā)生在社會生活和交往的各個環(huán)節(jié)當中。而家庭美德由于所涉及的道德類型相對較為單一,因此數(shù)量較少。
圖3 道德場景分布情況
具體到每個道德場景內(nèi)部,如圖4~圖6所示,社會公德一類里,遵紀守法所占比例最高,這是由于相當一部分不道德行為本身又是違法行為所造成的,如殺人、拐賣人口等。職業(yè)道德一類里,愛崗敬業(yè)所占比例最高,這是因為在這一場景下,許多道德行為即為對自身工作職責的履行,如教書育人、救死扶傷等。
圖4 道德行為類型熱力圖
圖5 道德行為類型分布情況
圖6 道德極性分布情況
家庭美德一類里,各分類比例相對均衡,家庭和睦類不道德詞相對較多,這是因為家暴、出軌相關(guān)的詞較多所造成的。個人品德方面,幾種道德行為在語料中分布較為分散,這體現(xiàn)出在詞匯使用中,社會對各類道德行為的描述較為均勻,詞匯使用沒有過于明顯的數(shù)量差異。其中自強類道德詞相對較多,這是因為許多跟個人品德相關(guān)的行為屬于對個人自身的修養(yǎng)提升所造成的。
另外,通過詞云可視化分析可以看出,不同道德場景詞云有較明顯的區(qū)別和差異。如圖7所示,道德極性均為正向道德的詞中,不同場景道德框架下的詞具有比較明顯的語義差別。如職業(yè)道德中的“敬業(yè)”“服務(wù)”和家庭美德中的“敬老”“贍養(yǎng)”等,體現(xiàn)出框架對道德詞的區(qū)分和歸類作用。
圖7 道德場景可視化示例
3.3.2 道德強度標注
道德強度標注結(jié)果如圖8所示??梢钥闯?,道德詞的道德強度大部分集中在[1,2]的區(qū)間內(nèi),強度大于2的詞較少。這是因為人類進行道德判斷的時候,除了“為國犧牲”等美德行為,其他行為較難達成一致的強度值3造成的。
圖8 道德強度區(qū)間分布情況
不道德詞方面,社會公德場景類詞在[-2,-1.667]區(qū)間聚集明顯,這是因為這部分詞大多是有一定嚴重后果、違反法律的行為,因此較多人判斷為2。而其他幾類場景中,大部分詞在[-1.667,-1]之間,這是因為這幾類涉及的道德行為往往程度較輕,造成嚴重后果的行為相對較少。
各類道德場景及其道德行為類型的平均強度值如圖9所示??傮w來看,道德方面的平均強度值排序為個人品德>社會公德>職業(yè)道德>家庭美德,不道德方面的平均強度值排序為社會公德>職業(yè)道德>個人品德>家庭美德。涉及愛國、奉獻的個人品德類平均道德強度值最高,涉及違法行為的社會公德類平均不道德強度值最高,涉及親密關(guān)系的家庭美德類平均強度值均較低,從中可以看出,人們對道德場景是有不同程度要求的,對作用于家庭成員之間的行為準則道德程度要求較低,這也體現(xiàn)出家庭美德通常被劃分為“私德”的原因,其作用范圍往往是比較親密的家庭環(huán)境,各分類下屬行為較明確,涉及違法的嚴重不道德行為和對社會能造成重大道德貢獻的行為都相對較少所造成的。
圖9 道德平均強度值熱力圖
具體到各類道德行為類型內(nèi)部,在道德行為方面,個人品德中的愛國類平均強度值是最高的,個人品德中的奉獻、職業(yè)道德中的奉獻社會兩類平均強度值也較高,體現(xiàn)出我國集體主義的道德觀和精忠報國的文化傳統(tǒng)。
另一方面,家庭美德中男女平等、社會公德中的保護環(huán)境兩類的平均強度值也較高,體現(xiàn)出當下中國社會的群體特征和時代要求。
在不道德行為方面,不愛國的強度值最接近于非常不道德,其次是違背奉獻社會、保護環(huán)境和遵紀守法,這體現(xiàn)出對目前道德原則的理解和認同,而勤勞、自強類的強度值最接近-1,體現(xiàn)出人們對懶惰、不努力等行為的寬容。
現(xiàn)有道德知識庫的對比情況如表4所示。從表中可以看出,中文道德知識庫基于中國社會的道德理論,不僅包含極性特征和強度特征,而且將道德種類細化為24種,可以幫助更好地解釋不同場景的道德行為。
表4 道德知識庫對比
本文提出了中文道德語義知識庫構(gòu)建任務(wù),深入分析詞的語義特征,設(shè)計了包括道德行為歸類體系、道德框架表示體系和道德強度衡量體系三部分內(nèi)容的理論體系,并構(gòu)建了包含15 371詞的中文道德語義知識庫。其中,道德行為歸類體系對道德事件進行了劃分,歸類為4種道德場景和24種道德行為類型。在道德框架表示體系中,每個框架由框架名、框架定義、框架元素、框架關(guān)系和框架詞元五個部分組成。在道德強度衡量體系中,每個詞擁有[-3,3]區(qū)間內(nèi)的一個強度值。
由于不同社會環(huán)境中人們的道德觀念是不同的、多樣的。因此,我們無意將《新綱要》的道德觀強加給其他地區(qū),而是希望這項工作能夠成為具有包容性的模式范例,這種模式可以應(yīng)用于其他文化環(huán)境,從而支持不同社會觀點下的道德判斷設(shè)計。
另外,人類的道德判斷是一個復(fù)雜的動態(tài)的推理過程,除了靜態(tài)的道德知識之外,還有很多更加復(fù)雜的、有條件成立的道德行為。如何結(jié)合目前的命名實體、關(guān)系抽取技術(shù)對其進行識別和分析,未來我們會進行進一步的深入研究。