李雙雙,楊旭,陳曉紅
(1.華東政法大學(xué)刑事法學(xué)院,上海 200042; 2.司法鑒定科學(xué)研究院上海市司法鑒定專業(yè)技術(shù)服務(wù)平臺司法部司法鑒定重點實驗室,上海 200063; 3.南京警察學(xué)院刑事科學(xué)技術(shù)學(xué)院,江蘇南京 210023)
筆跡鑒定是司法鑒定領(lǐng)域和計算機領(lǐng)域的重要工作。 如今,筆跡鑒定檢驗人員仍然運用傳統(tǒng)的技術(shù)方法并根據(jù)相關(guān)經(jīng)驗對筆跡的書寫人作出判斷。 關(guān)于筆跡鑒定有效性和可靠性的爭論由來已久,傳統(tǒng)上用來證明筆跡可變性和個性的基本原則受到了挑戰(zhàn)和批判[1-2]。 與此同時,基于計算機的筆跡鑒定系統(tǒng)開始了個體識別的研究,并嘗試在司法鑒定領(lǐng)域開展應(yīng)用。 然而,目前計算機離線筆跡驗證系統(tǒng)是基于靜態(tài)(離線)二維圖像的測量,而圖像本身很容易被偽造,因此此類筆跡驗證系統(tǒng)判斷摹仿筆跡的能力較弱。 此外,這一領(lǐng)域的研究往往集中在缺乏規(guī)模和多樣性的數(shù)據(jù)集上,致使由此訓(xùn)練出來的系統(tǒng)魯棒性不能滿足實踐應(yīng)用需求。 以上這些缺點阻礙了計算機技術(shù)在筆跡鑒定中的應(yīng)用。
隨著科技的快速發(fā)展,計算機圖像處理技術(shù)、光學(xué)、統(tǒng)計學(xué)等學(xué)科為筆跡特征量化研究提供了可利用的技術(shù)和方法,筆跡特征的統(tǒng)計分析能夠客觀反映筆跡檢驗結(jié)果,科學(xué)評估筆跡鑒定意見是筆跡鑒定的發(fā)展方向之一。 目前,筆跡量化鑒定與統(tǒng)計分析研究主要集中在計算機筆跡個體識別與筆跡鑒定兩個領(lǐng)域。 計算機筆跡個體識別系統(tǒng)主要可分為兩種類型:在線筆跡個體識別和離線筆跡個體識別,離線筆跡個體識別系統(tǒng)處理書寫完成的靜態(tài)圖像,而在線筆跡個體識別系統(tǒng)處理從采集硬件實時獲得的數(shù)據(jù)。 筆跡鑒定的任務(wù)與離線筆跡驗證最為接近。 本文針對筆跡特征量化、筆跡特征數(shù)據(jù)分析以及基于似然比模型評估筆跡鑒定意見準確性與可靠性的研究進行梳理和總結(jié),并對筆跡量化鑒定與統(tǒng)計學(xué)分析研究在司法鑒定領(lǐng)域面臨的問題以及未來的發(fā)展方向進行討論。
本文中筆跡特征的量化是指以測量的方法檢測筆跡,并以數(shù)據(jù)形式表示特征的大小和變化。
書寫時間、書寫速度與加速度、書寫壓力、執(zhí)筆傾斜角度、字的大小、抬筆次數(shù)等是常用的在線筆跡動態(tài)特征,由數(shù)字化采集設(shè)備直接測量或計算得出。 為構(gòu)建更能豐富反映書寫運動特點的特征集,研究人員進一步細化在線筆跡的運動學(xué)變量:在書寫速度與加速度分析中,由采樣點X/Y軸坐標計算得出線速度、線加速度、角速度與角加速度[3],由加速度的時間導(dǎo)數(shù)得出變加速度(也稱為“躍度”)[4];在分析書寫時間時,將書寫時間分為筆畫持續(xù)時間與空中時長[5],有研究人員還通過計算從零到峰值速度的時間與筆畫持續(xù)時間的比率來反映書寫運動效率[6]。 這些細化的運動學(xué)變量的數(shù)值與變化有助于分析書寫運動的具體情況。
在筆跡鑒定中,研究在線筆跡動態(tài)特征的一個重要目的是確認和驗證離線筆跡中基于形態(tài)特征預(yù)測的書寫運動。 可用的方法有建立在線筆跡動態(tài)特征數(shù)值與紙質(zhì)筆跡靜態(tài)特征相對值的相關(guān)性[7-8],為分析紙質(zhì)筆跡的動態(tài)變化提供依據(jù)。 HECKEROTH等[9]發(fā)現(xiàn)筆跡鑒定檢驗人員在電子簽名與紙質(zhì)簽名中關(guān)于筆跡真實性的結(jié)論并不存在顯著差異,表明電子簽名在筆跡識別中是可行的。 雖然之后HECKEROTH 等[10]發(fā)現(xiàn)電子簽名和紙質(zhì)簽名在簽名大小與書寫壓力上存在明顯差異,但這種影響受書寫區(qū)域與手寫筆的限制,因此這些不同并不代表書寫行為明顯不同。
離線筆跡特征的量化是通過分析來自掃描儀或數(shù)碼相機轉(zhuǎn)化形成的二維靜態(tài)圖像文件來實現(xiàn)的,過去多數(shù)研究關(guān)注離線筆跡的形態(tài)特征,多種多樣的量化方法已經(jīng)或正在開展,可歸納為特征賦值與特征測量兩種。
1.2.1 特征賦值
在筆跡鑒定中,可用的離線筆跡形態(tài)特征多種多樣,概貌、布局、寫法、運筆等均是常見的形態(tài)特征,主要依據(jù)檢驗人員對特征的認知進行分類描述,并按照一定的標準對分類結(jié)果設(shè)定等級與賦值,用數(shù)字的大小來表達筆跡特征的表現(xiàn)程度,在一定意義上量化了筆跡特征數(shù)據(jù),但這種特征賦值方法具有很強的主觀性,且分類標準因人而異,得到的特征數(shù)據(jù)不夠客觀。 于彬[11]提出在筆跡鑒定檢驗人員根據(jù)專業(yè)知識與經(jīng)驗積累對筆跡特征賦值的基礎(chǔ)上,通過數(shù)據(jù)建模的方式求得每個筆跡特征指標的權(quán)重值并形成量化系統(tǒng),以量化特征數(shù)值來增加賦值結(jié)果的可靠性,但此法仍無法有效排除人為因素的干擾。 特征賦值的方法一般用于無法測量的主觀感受或判斷,常用于社科類研究中,且具有一定的意義。 這種方法雖然表現(xiàn)為數(shù)值形式,但是實質(zhì)上仍然是專家的經(jīng)驗, 存在較大的主觀性,并未完全解決筆跡特征客觀量化的問題。
1.2.2 特征測量
運用幾何方法測量筆跡形態(tài)特征,是離線筆跡形態(tài)特征量化研究有所進步的表現(xiàn)。 衛(wèi)燕茹等[12]手工測量了紙質(zhì)上筆跡的布局、 字行方向等特征,為筆跡鑒定檢驗人員評判特征價值提供了較為客觀的依據(jù),但人為測量偏差仍是一大難題。 借助儀器設(shè)備測量筆跡形態(tài)特征為筆跡鑒定的量化研究提供了科學(xué)方法,如在文檢儀下測量字符的長度與角度[13],再如測量筆跡圖像字符大小、字符間距[14]與筆畫長度[15]等宏觀筆跡特征,均是簡單快捷的形態(tài)特征量化方法。 但以上測量方法為手工測量,測量結(jié)果因人而異,基于此,研究人員考慮對筆跡圖像進行預(yù)處理,分析二值化的筆跡圖像,并進行自動化的特征測量。 MARQUIS 等[16]采用Visilog 1 Xpert 6.11 軟件自動提取二值化筆跡圖像中字母“O”的輪廓,用輪廓的點與質(zhì)心間的長度以及該直線與橫軸的夾角來表示該點的輪廓特征向量,經(jīng)傅里葉分析后用于精確描述字母的外形特征;此后,該團隊[17]還對字母“a、d、o、q”的形狀進行分析,為多變量統(tǒng)計模型提供了測量數(shù)據(jù)。 王相臣等[18]借助Matlab 軟件測量二值化筆跡圖像中字與字之間的質(zhì)心距離來確定字間距數(shù)據(jù),實現(xiàn)了字間距特征的量化。秦曄[19]使用計算機技術(shù)自動標記筆跡的字符布局特征、字符間分布特征、字符形狀特征等,并通過軟件程序量化標記的特征數(shù)據(jù),這是探索筆跡智能化檢驗的路徑,但受限于圖像處理的標準化水平與筆跡特征數(shù)據(jù)庫的規(guī)模,在實踐中尚不足以承擔(dān)鑒定任務(wù)的應(yīng)用。
此外,從立體空間角度來看,筆跡是三維的,筆痕深度是筆尖作用于紙張使之變形的程度,反映了筆力輕重。 利用精密儀器觀測筆畫壓痕,結(jié)合計算機技術(shù)獲取筆畫各采樣點的壓痕深度值,也是離線筆跡圖像特征的一種量化方法。 研究人員通過大量的實驗,探索了筆跡三維信息提取分析儀檢測獲取的筆畫壓痕在區(qū)分摹仿簽名筆跡與摹本簽名筆跡書寫壓力特征[20]、認識書寫紙張與襯墊條件變化對簽名筆跡壓痕影響[21]、分析速度變化筆跡書寫壓力變化規(guī)律[22]、比較同一人運動前后簽名筆跡與臨摹簽名筆跡差異[23]等中具有可行性,為輔助筆跡檢驗提供了客觀依據(jù);但該技術(shù)的掃描系統(tǒng)靈敏度高,測量精度達微米級,實驗中對書寫材料有著嚴格要求,若紙張褶皺,觀測的筆畫壓痕數(shù)據(jù)可能存在偏差。 一些筆跡三維形貌測量儀器也可以測量、分析筆畫各采樣點的凹痕深度數(shù)據(jù)[24]和筆畫的角度、寬度[25],這些儀器與方法為筆跡檢驗提供了更多維度、更為多樣化的特征信息,是對現(xiàn)有筆跡鑒定特征體系的一種有益補充。
筆跡的形成是一個物理過程,書寫運動中作用力、書寫速度與加速度等物理量的大小和變化是筆跡形成過程中運動變化狀態(tài)的表現(xiàn)[3,26],即壓力與速度的作用形成了筆跡動態(tài)特征的具體征象。 從離線筆跡圖像中挖掘筆跡動態(tài)信息是筆跡鑒定研究的新角度,但由于其最終以靜態(tài)圖像的形式呈現(xiàn)出來,無法實時獲取壓力與速度信息,實踐中多從墨跡濃淡、筆畫粗細、筆畫線條質(zhì)量、連筆多寡以及紙張正面與背面的凹凸程度等方面定性推斷書寫壓力與書寫速度的變化[26-29],為初步認識并預(yù)測筆跡動態(tài)信息積累了經(jīng)驗。 但這些方法更多的是基于主觀經(jīng)驗判斷,檢驗結(jié)果易受筆跡鑒定檢驗人員視覺感知與主觀認知的影響,若筆跡鑒定檢驗人員能力不足或認知存在偏見,所得結(jié)果的可靠性將大打折扣。
開發(fā)和建立檢測、提取離線筆跡動態(tài)信息的工具與方法是筆跡鑒定的迫切需要,是筆跡鑒定從定性分析向定量測量逐漸轉(zhuǎn)變的關(guān)鍵階段。 在近期的研究中,研究人員提出了“相對動態(tài)特征”的概念,即在靜態(tài)筆跡圖像中恢復(fù)筆跡的書寫軌跡,并按照書寫軌跡的順序獲取筆畫寬度、灰度、弧度等信息。因為其與在線筆跡的動態(tài)特征不同,不是實時提取的信息,但是反映相對的書寫順序,所以稱為相對動態(tài)特征[3]。 為了區(qū)別于在線筆跡的動態(tài)特征,也有研究人員將這類特征稱為“偽動態(tài)特征”,從靜態(tài)筆跡圖像的灰度級、筆畫寬度、運筆走勢等方面恢復(fù)書寫時的運動信息,在計算機筆跡個體識別中使用較多[30-33]。
1988 年,AMMAR 等[34]將簽名圖像的灰度信息作為一種偽動態(tài)特征用于離線簽名鑒定,需要注意的是,這里所提到的偽動態(tài)特征是二維圖像的灰度變化分布,有別于上文所提到的“偽動態(tài)特征”。 也有研究借助文檢儀捕獲簽字筆油墨對紅外光的吸收反射圖,利用灰度分析量化筆畫的灰度,但書寫壓力所致的灰度值變化的區(qū)分度并不明顯[35]。 周鵬等[36]提出精確定位簽名筆跡立體形態(tài)特征區(qū)域的特征提取算法,以區(qū)分不同區(qū)域筆跡的灰度差異。
基于書寫機理與書寫經(jīng)驗可知,書寫壓力、書寫速度影響筆畫的粗細,在一定程度上筆畫的寬度反映了書寫的動態(tài)信息,是離線筆跡特征的另一重要內(nèi)容。 但受不同書寫工具等因素影響,形成筆畫的寬度本身就不一樣,因此單純的筆畫寬度值無法真正反映書寫習(xí)慣,而利用筆畫寬度斜度[30]、筆畫寬度變化率[32]可間接反映書寫速度/加速度特征。筆畫弧度反映了運筆走勢與方向特征,運筆走勢與方向的變化必定引發(fā)書寫速度的改變,故筆畫弧度是認識書寫速度的一個重要參考依據(jù)。 研究人員多從筆畫行筆[37]或端點[32,38-39]兩個方面認識書寫時的動態(tài)變化,得到反映筆畫動態(tài)變化的特征向量,這在計算機筆跡個體識別中研究較為常見。 以筆畫為研究對象的筆跡特征提取方法不依賴于文本,只要兩份筆跡包含相同筆畫就可適用;但若樣本字數(shù)太少,可利用的筆畫不多,將不利于發(fā)現(xiàn)真實的特征。
總體來看,目前基于筆畫灰度、寬度、弧度提取離線筆跡特征的研究取得了一定的進展,但在對特征數(shù)據(jù)的統(tǒng)計學(xué)分析方面仍然有待加強,需要進一步構(gòu)建筆跡特征量化比較分析的方法體系。 此外,目前這些研究多處于實驗階段,這是由于筆畫灰度、寬度、弧度是一種精細信息,實驗研究設(shè)置的條件十分理想化,使用的承受紙張基本是平整干凈的。而實際筆跡鑒定工作中遇到的紙張可能發(fā)生污損、折疊等變化,其承載的筆跡動態(tài)信息也必然發(fā)生變化,實驗所得結(jié)果與規(guī)律是否可用于實際工作仍有待進一步的探究。 但筆跡的量化鑒定不能始終停留在實驗研究中,走向?qū)嵺`是其最終目標,將實驗研究向?qū)嵺`應(yīng)用研究發(fā)展,提高方法的使用效率,這應(yīng)是今后研究人員與檢驗人員共同思考、相互合作的現(xiàn)實問題。
2.1.1 頻數(shù)分析
“頻數(shù)”又稱為“次數(shù)”,在筆跡檢驗中,頻數(shù)分析是對某種筆跡特征出現(xiàn)次數(shù)進行的研究,以查看特征的基本分布情況,是一種常見的特征統(tǒng)計分析方法。 頻數(shù)與總數(shù)的比值為頻率,頻率反映了該特征對總體水平的作用程度,用于量化筆跡特征的價值,在離線筆跡形態(tài)特征分析中應(yīng)用普遍[40-42]。研究人員還注重特征組合在筆跡檢驗中的作用,將多個單一特征的出現(xiàn)頻率相乘得到特征組合的出現(xiàn)率,以反映書寫習(xí)慣的特定性[43],相較于單一特征的頻數(shù)分析,組合特征的頻數(shù)分析結(jié)果說服性更強,但各特征是否具有獨立性尚未明確。 頻數(shù)分析為初步分析筆跡特征提供了數(shù)據(jù)基礎(chǔ),筆跡樣本的充分性、代表性影響分析結(jié)果的準確性,若研究中筆跡樣本數(shù)量不足、代表性不強,所得結(jié)果可能存在誤差,建立充足的人群筆跡特征數(shù)據(jù)庫是一種有效的解決方法。
此外,特征出現(xiàn)頻率在DNA 證據(jù)研究中有非常廣泛的應(yīng)用,這是基于DNA 生物模型的理論已經(jīng)非常明確和成熟,不同基因座之間是獨立的。 由于筆跡特征之間并非是統(tǒng)計學(xué)意義上的獨立變量,恰恰相反,很多傳統(tǒng)形態(tài)學(xué)證據(jù),如筆跡、指印等,特征變量之間往往是相關(guān)的。 因此,在筆跡鑒定中,僅僅評估特征的出現(xiàn)頻率可能并不能發(fā)揮非常強大的作用。
2.1.2 統(tǒng)計量的計算
在筆跡特征分析中,經(jīng)儀器設(shè)備或計算機技術(shù)采集的原始數(shù)據(jù)是筆畫中各采樣點的信息,數(shù)據(jù)龐大且繁雜,而筆跡檢驗是對組合字(如簽名)、單字、偏旁部首、筆畫的具體征象進行分析與比較,為快速獲取有價值的信息,需用簡潔的統(tǒng)計量來描述龐雜的特征數(shù)據(jù),常用的統(tǒng)計量有均值、標準差、方差、極差、最值、變異系數(shù)等。 特征均值用于分析書寫運動的整體情況[5,20-24,36,44];標準差用以描述某具體特征數(shù)值與均值的標準距離, 以衡量均值的代表性,是常用的統(tǒng)計量[5,23,36],其次是方差[22]、極差[24]、最值[24];變異系數(shù)因消除了均值不同和度量單位不同對多組數(shù)據(jù)比較的影響,比較結(jié)果更為客觀,目前在筆跡檢驗中逐漸得到關(guān)注與應(yīng)用,多用以分析同一人書寫筆跡的穩(wěn)定性[44]與不同人書寫筆跡的變異性[4],但其缺點是若均值接近于零,微小的波動也會對變異系數(shù)造成巨大影響,造成精確度不準等問題。 因此,分析筆跡特征時,應(yīng)根據(jù)特征數(shù)據(jù)的具體情況選擇相適應(yīng)的統(tǒng)計量。
筆跡鑒定中相關(guān)性分析有兩個目的:一是確定兩份或多份筆跡的相似程度,二是分析書寫因素與筆跡特征的相關(guān)關(guān)系。 前者的變量為筆跡特征數(shù)據(jù),后者的變量有筆跡特征數(shù)據(jù)、書寫因素,其中筆跡特征數(shù)據(jù)在統(tǒng)計分析中是一種數(shù)值變量,書寫因素則是分類變量。 在筆跡鑒定中,常用于表述筆跡相關(guān)性的方法有相關(guān)系數(shù)的計算、相似性度量。
2.2.1 相關(guān)系數(shù)的計算
相關(guān)系數(shù)是用以度量變量之間相關(guān)程度的統(tǒng)計指標,Pearson 相關(guān)系數(shù)、Spearman 相關(guān)系數(shù)、Kendall 相關(guān)系數(shù)是三種常用的相關(guān)系數(shù)。 Pearson相關(guān)系數(shù)在筆跡特征的統(tǒng)計分析中使用較多,用于比較兩份筆跡的穩(wěn)定性與變化性[4,44],進而分析筆跡的相關(guān)性。 實驗研究筆跡特征時,為保證結(jié)果的可靠性,通常會收集大量筆跡樣本,兩兩計算得到的相關(guān)系數(shù)十分龐大,為簡化數(shù)據(jù)、選擇有效的相關(guān)系數(shù),有研究[45]選取相關(guān)系數(shù)最大值作為待檢驗樣本與參考樣本之間的相關(guān)系數(shù),有研究[24]則使用平均相關(guān)系數(shù)來量化書寫人與某一書寫條件下筆跡特征的相關(guān)性,兩種選擇均具有合理性。 雖然使用Spearman 相關(guān)系數(shù)、Kendall 相關(guān)系數(shù)分析筆跡相關(guān)性的研究尚不普及,但因其通用性強,應(yīng)逐漸得到筆跡鑒定檢驗人員的關(guān)注。
2.2.2 相似性度量
將筆跡特征視為特征向量,每個特征下有多種具體表現(xiàn),作為特征向量中的維度,在樣本筆跡較少的情況下,以某特征來確定兩份筆跡相關(guān)性時,可以通過計算兩個N維特征向量的距離來實現(xiàn)。兩份筆跡之間的測量距離越大,是同一人書寫的可能性越?。环粗?,距離越近,越有可能來自同一書寫人,通常認為與參考筆跡距離最小的待檢驗樣本是同一人書寫,這就是筆跡的相似性度量。 目前此法在計算機筆跡個體識別中應(yīng)用普遍。
距離度量方式是鑒別筆跡相似性準確率的重要影響因素,常用的度量方式有歐式距離、曼哈頓距離、卡方距離、余弦距離。 歐式距離是最簡單的距離度量方法,即兩點間的實際直線距離,在低維的筆跡特征數(shù)據(jù)中其適用效果較好[37,46]。 曼哈頓距離與卡方距離的鑒別率與采用的特征有關(guān)[47],在沈潔等[48]的研究中,曼哈頓距離比歐式距離獲得更好的鑒別率;而在古孜麗塔吉·乃拜[49]的研究中,卡方距離是鑒別率最好的距離度量方法。 余弦距離通過計算兩個特征向量方向夾角的余弦值來衡量兩份筆跡的差異大小,更加強調(diào)方向上的差異性,在高維的筆跡特征數(shù)據(jù)距離度量中應(yīng)用頻繁[39,50]。 此外,因馬氏距離考慮了筆跡特征之間的聯(lián)系程度與差異性,在計算機筆跡個體識別中也具有較好的鑒別率[51-52]。
在筆跡特征數(shù)據(jù)較多的情況下,不同維度的特征出現(xiàn)率不同,這時需要考慮筆跡特征之間的差異,通過對特征數(shù)值賦予不同權(quán)重可以改進計算方法。 研究表明,使用加權(quán)的距離度量方式比使用不加權(quán)距離度量方式的鑒別效果更好[53-54],即加權(quán)距離度量可以提高筆跡鑒別的正確率。
在筆跡鑒定中,利用統(tǒng)計學(xué)方法驗證不同筆跡之間的特征是否存在顯著差異,實質(zhì)上是判斷筆跡差異是抽樣誤差引起的還是本質(zhì)差別造成的,這是進行筆跡鑒別的依據(jù)。在不同情形下形成的筆跡,其筆跡特征只有存在顯著差異時,才能據(jù)此進行筆跡判別。t檢驗與方差分析是常用的差異顯著性檢驗方法,目前在筆跡特征數(shù)據(jù)分析中已逐漸得到應(yīng)用。
2.3.1t檢驗
t檢驗用來驗證兩類筆跡中特征均值是否存在顯著差異,包括單樣本t檢驗、獨立樣本t檢驗、配對樣本t檢驗。 單樣本t檢驗比較樣本均值與總體均值之間的差異,通常用于判斷所選筆跡樣本是否具有代表性;獨立樣本t檢驗判斷從兩個不同總體中抽取的兩個樣本的均值是否存在顯著差異,是組間差異分析的一種方法,多用于比較分析不同身體狀態(tài)或精神狀態(tài)對筆跡變異的影響[55-57];配對樣本t檢驗的樣本數(shù)據(jù)是通過觀測相同人群兩次得到的,是組內(nèi)差異分析的一種方法,通常用于判斷同一人在不同條件下書寫的筆跡是否具有明顯差異。
目前,研究人員更多關(guān)注某一書寫因素變化對筆跡特征的影響是否存在顯著差異,因此配對樣本t檢驗在筆跡鑒定中應(yīng)用較多,用于分析不同時間書寫的筆跡[58]、患病前后形成的筆跡[59-61]是否存在明顯變化。使用配對樣本t檢驗時,特征指標多為兩組數(shù)據(jù)的均值差,通常通過與數(shù)值零對比,來分析書寫因素變化對筆跡特征的影響。
使用t檢驗的前提條件是數(shù)據(jù)符合正態(tài)分布,而并非所有的筆跡特征數(shù)據(jù)都符合正態(tài)分布。Wilcoxon 帶符號秩檢驗也是均值差異檢驗方法之一,黃飛騰[44]在分析坐姿與站姿筆跡的書寫時長、書寫速度、平均壓力差異時,因數(shù)據(jù)不滿足正態(tài)性,便通過Wilcoxon 帶符號秩檢驗來判斷改變書寫姿勢對筆跡動態(tài)特征的影響。 因此,分析筆跡特征數(shù)據(jù)差異性時,應(yīng)根據(jù)數(shù)據(jù)的分布情況來選擇合適的檢驗方法。
2.3.2 方差分析
當(dāng)比較三組或三組以上筆跡的特征均值是否具有顯著差異性時,需要使用方差分析,包括單因素方差分析、雙因素方差分析、多因素方差分析。 單因素方差分析可以比較一種書寫因素變化對多組筆跡特征數(shù)值的影響,而雙因素方差分析可比較兩種因素變化的影響,多因素方差分析則可比較三個及以上書寫因素變化的影響。
單因素方差分析要求多組筆跡樣本之間控制其他不相關(guān)書寫因素,保證沒有其他因素對結(jié)果產(chǎn)生影響,以準確檢驗不同組別筆跡的顯著性差異,在實驗研究中使用較多[62-65]。 而實際上筆跡通常會受到多個因素影響,雙因素方差分析與多因素方差分析在判斷多個因素對筆跡特征數(shù)據(jù)的影響時,可進一步分析究竟幾個因素產(chǎn)生了顯著影響、是否為幾個因素之間的交互作用對筆跡特征數(shù)據(jù)產(chǎn)生了顯著影響。 如SLAVIN 等[6]通過雙因素方差分析考察了書寫人的年齡、書寫時的視覺條件對在線筆跡動態(tài)特征的影響,發(fā)現(xiàn)兩種書寫因素變化在筆跡動態(tài)特征中存在交互作用,老年人書寫筆跡時更依賴外部視覺刺激;類似的,還有MOHAMMED 等[66]判斷簽名風(fēng)格與簽名行為對筆跡動態(tài)特征的影響。 可見,雙因素方差分析與多因素方差分析在筆跡特征數(shù)據(jù)差異性分析中更普遍、更實用。
總體來看,描述性統(tǒng)計因原理簡單、計算方便,在筆跡特征統(tǒng)計分析中應(yīng)用普遍,在實踐中也常作為一種參考依據(jù)。 而相關(guān)性分析與差異顯著性檢驗多用于分析在線筆跡動態(tài)特征,離線筆跡中使用較少,且尚未應(yīng)用于實踐。 實際上相關(guān)性分析與差異顯著性檢驗在筆跡特征的統(tǒng)計分析中更具現(xiàn)實意義,是筆跡鑒定走向科學(xué)的有效依據(jù),這需要加強筆跡鑒定量化的實踐探索,更需要研究人員將實踐探索轉(zhuǎn)化為實踐運用。
基于筆跡特征量化與分析得到的鑒定意見的準確程度與可靠程度需經(jīng)科學(xué)評估才有可能用于實踐,一種方法是利用似然比(likelihood ratio,LR)模型評價筆跡鑒定意見。 從21 世紀初,國外法庭科學(xué)便展開了將LR 模型用于筆跡鑒定的研究[67-68]。在筆跡鑒定中,LR 是認定檢材筆跡與樣本筆跡為同一人書寫的概率(控方假設(shè))與否定同一的概率(辯方假設(shè))的比值,其中分子量化了檢材筆跡與樣本筆跡的相似程度,分母量化了檢材筆跡與樣本筆跡在人群中分布的典型性[69]。 傳統(tǒng)筆跡檢驗方法多偏重筆跡特征的相似性,忽略了特征的典型性,對于兩份筆跡,如果發(fā)現(xiàn)不了其筆跡特征明顯不同,通常即認為是同一人書寫,方法存在一定的缺陷,得到的鑒定意見容易引起質(zhì)疑。 基于LR 模型得到的數(shù)值用來客觀評估筆跡特征對鑒定意見的相對支持強度,評估方法更有邏輯性,有助于化解筆跡鑒定意見科學(xué)性不足的問題。
LR 模型可分為評分LR 與基于特征的LR。 在筆跡鑒定中,評分LR 是基于檢材筆跡與樣本筆跡的相似性度量值來計算LR,將多變量特征減少為單變量特征,實現(xiàn)了數(shù)據(jù)降維,減少了運算量;特征LR 則直接將概率分配給多變量特征來計算LR,保留更多筆跡信息,但操作復(fù)雜。 目前,評分LR 方法因具有數(shù)據(jù)降維與模型簡單的優(yōu)勢,在評估司法鑒定證據(jù)中普遍存在[67,70-71],筆跡證據(jù)價值評估也多為此法。
利用LR 評估筆跡鑒定意見時,筆跡鑒定檢驗人員的任務(wù)是計算LR 值,LR 中分子與分母的概率值源于筆跡樣本數(shù)據(jù)庫和LR 統(tǒng)計模型,主觀賦值法[72]、特征頻率統(tǒng)計法[73]、多變量LR 模型法[16,74]是三種常用的統(tǒng)計計算方法。 無論LR 是否基于數(shù)據(jù)庫來分配,主觀賦值法都可以量化LR 的分子與分母,該方法具有很強的主觀色彩,MORRISON 等[75]認為對于主觀判斷生成的LR 的分子與分母,必須經(jīng)過校準與檢驗來減少認知偏差的可能性,LR 的取值應(yīng)以相關(guān)數(shù)據(jù)、定量測量與統(tǒng)計模型為依據(jù)。特征頻率統(tǒng)計法與多變量LR 模型法基于大規(guī)模的數(shù)據(jù)進行訓(xùn)練與驗證,得到的LR 評估方法更具合理性與適用性。 在筆跡鑒定中,特征頻率統(tǒng)計法通常假定筆跡特征是獨立的,減少了待估參數(shù)的個數(shù),實際上筆跡特征之間存在某些相關(guān)性,這意味著單變量特征不足以用于證據(jù)評估,可能會產(chǎn)生極端的證據(jù)價值,為了更好地評估證據(jù),有必要進行多變量數(shù)據(jù)評估[76]。TARONI 等[77]使用多變量LR 模型法計算LR 值時,發(fā)現(xiàn)相較于單變量LR 模型,前者在女性群體中正確分類率上升,這是因為多變量LR 模型考慮了更復(fù)雜、更詳細的字符輪廓形態(tài)特征。LINDEN 等[68]認為多變量LR 模型應(yīng)考慮同源與非同源變異性的不同建模,以減少較差背景數(shù)據(jù)對模型性能的影響。 此外,MARQUIS 等[16]通過多變量數(shù)據(jù)設(shè)計LR 模型時,還計算了對數(shù)似然比(loglikelihood ratio,LLR),根據(jù)LLR 的正負指向性表示對筆跡鑒定意見支持性,這也是評估筆跡鑒定意見的一種科學(xué)方法。
基于LR 模型評估筆跡鑒定意見時,LR 模型系統(tǒng)的性能決定了檢驗結(jié)果的準確性,因此有必要對系統(tǒng)性能進行評估,常見的性能評估指標有CLLR(LLR 消耗)、RME(rate of misleading evidence,證據(jù)誤導(dǎo)率)、EER(equal error rate,等錯誤率)。CLLR是準確性的主要指標,可分為CcalLLR、CminLLR,CcalLLR用于判斷證據(jù)的標準化程度,是判別能力的指標[78];RME 用于表示精確度[76],CminLLR可分為RMED(支持辯方假設(shè)的錯誤率)、RMEP(支持控方假設(shè)的錯誤率),通過計算RMED、RMEP 可得知所使用鑒定方法的錯誤率,這是評估筆跡證據(jù)不可缺少的指標[68,71,76],因為多伯特(Daubert)準則要求鑒定人在出具鑒定意見時報告鑒定方法的錯誤率[79],以保證結(jié)果是準確可靠的。 EER 是判別能力的主要指標,是錯誤認定率和錯誤否定率相等時的錯誤率,EER 值越小,系統(tǒng)性能越好。 此外,研究人員常結(jié)合圖形來評價LR 模型的計算結(jié)果,常見圖形有直方圖、Tippett 圖、DET圖、ECE 圖,前三種圖形均可反映LR 模型的識別力,ECE 圖則可反映LR 模型的識別力與區(qū)分力[80]。
目前,基于LR 模型的筆跡自動識別系統(tǒng)的驗證已存在部分成果。 CHEN 等[78]基于LR 模型建立筆跡自動識別系統(tǒng),在使用偽動態(tài)特征區(qū)分Sig-Comp2011 中簽名筆跡真?zhèn)螘r,結(jié)果顯示該系統(tǒng)相較于其他參賽系統(tǒng)更具識別力,證據(jù)誤導(dǎo)率更低,這表明利用LR 模型評估筆跡鑒定意見具有較好的可行性。但應(yīng)注意的是,基于LR 模型評估筆跡鑒定證據(jù)時,樣本數(shù)據(jù)庫與特征統(tǒng)計數(shù)據(jù)會影響系統(tǒng)的性能[16,76]。下一步應(yīng)不斷擴大筆跡樣本數(shù)據(jù)庫以及筆跡特征的種類與數(shù)量,以增強LR 模型系統(tǒng)的有效性與可靠性。
當(dāng)前,國內(nèi)外筆跡量化鑒定和統(tǒng)計學(xué)分析的研究主要圍繞以下幾個方面:筆跡特征量化為筆跡鑒定提供了客觀的數(shù)據(jù)支撐,統(tǒng)計學(xué)分析為筆跡鑒定提供科學(xué)系統(tǒng)的方法,基于貝葉斯框架的證據(jù)價值評估有助于科學(xué)表達證據(jù)的不確定度。 目前,國內(nèi)外筆跡鑒定實踐主要依靠專家經(jīng)驗判斷,筆跡量化鑒定的研究雖然取得了豐碩成果,但這僅僅是個開始,要將科學(xué)研究應(yīng)用于法庭科學(xué)實踐,學(xué)者和科研人員仍需付出更多的努力。 首先,科學(xué)研究需要不斷接受真實數(shù)據(jù)的檢驗,并對系統(tǒng)進行完善和修正,特征選擇影響模型性能,選擇特定的、有效的筆跡特征尤為重要,這在很大程度上需要一個具有代表性的數(shù)據(jù)庫,因此建立多樣化、普適的筆跡樣本數(shù)據(jù)庫是未來研究的一個重點;其次,拓展認識筆跡特征的途徑,挖掘筆跡的動態(tài)與靜態(tài)信息,需要依靠科學(xué)技術(shù)充分提取可靠的、客觀的數(shù)據(jù),這是筆跡鑒定檢驗人員與科研人員需要考慮的現(xiàn)實問題;最后,量化、分析筆跡特征并評估筆跡證據(jù)的技術(shù)與方法涉及龐大的學(xué)科知識體系,研究人員需要熟悉多學(xué)科交叉研究工具和方法,這對筆跡鑒定檢驗人員也提出了更高的要求,如何讓筆跡鑒定檢驗人員信任、熟悉新的方法和手段,也是新技術(shù)在筆跡鑒定應(yīng)用中需要著手解決的問題。