趙曉林
(貴州省司法廳, 貴州 貴陽 550001)
近幾年,司法系統(tǒng)逐漸與多種現(xiàn)代化的信息技術(shù)相結(jié)合?,F(xiàn)代科技為促進(jìn)司法領(lǐng)域與時代發(fā)展趨勢的緊密結(jié)合提供了支持,但與此同時也造成了不利影響。例如由于司法本身是具有固定屬性的,因此在與更多現(xiàn)代化信息技術(shù)融合的過程中,會在不同程度上受到?jīng)_擊,進(jìn)而產(chǎn)生新的風(fēng)險。同時,由于風(fēng)險存在潛在性、非指涉性等特點,因此當(dāng)前現(xiàn)有法律規(guī)范與信息技術(shù)倫理之間無法實現(xiàn)全覆蓋。在該背景下,如何認(rèn)清司法大數(shù)據(jù)在應(yīng)用過程中可能潛在的風(fēng)險成為實現(xiàn)新型技術(shù)風(fēng)險預(yù)防過程中亟需解決的問題。針對司法場景的特殊性,采用傳統(tǒng)的信息技術(shù)已經(jīng)無法準(zhǔn)確地對其存在的風(fēng)險以及問題進(jìn)行評估,針對該問題,該文引入人工智能技術(shù)。當(dāng)前,人工智能技術(shù)在各領(lǐng)域中應(yīng)用得十分廣泛,在不同領(lǐng)域中具備輔助、預(yù)測等功能,并最大程度地利用數(shù)據(jù)信息。因此,結(jié)合人工智能技術(shù)的應(yīng)用優(yōu)勢,通過該技術(shù)對司法大數(shù)據(jù)應(yīng)用風(fēng)險評估方法進(jìn)行研究。
人工智能技術(shù)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的一系列理論和方法,是計算機(jī)領(lǐng)域的重要分支。目前,可以利用人工智能技術(shù)完成部分以往僅有人工才能完成的工作,自然也可以完成對司法大數(shù)據(jù)應(yīng)用風(fēng)險的評估。因此,為提升司法大數(shù)據(jù)應(yīng)用的風(fēng)險評估效果和速度,該文利用人工智能技術(shù)設(shè)計了一種司法大數(shù)據(jù)應(yīng)用風(fēng)險評估方法,其設(shè)計步驟如圖1所示。
圖1 設(shè)計方法操作步驟
由于風(fēng)險因素處于一種動態(tài)變化的過程中,在不同階段,其影響有強(qiáng)有弱,如果不對其進(jìn)行分析,就有可能導(dǎo)致需要分析的數(shù)據(jù)過多,為風(fēng)險評價帶來更多的數(shù)據(jù)負(fù)擔(dān),降低評價效率。而且對司法系統(tǒng)的運行和應(yīng)用環(huán)境來說,在對其存在的風(fēng)險問題進(jìn)行評估時,風(fēng)險因素關(guān)聯(lián)規(guī)則通常是靜態(tài)不變的。但當(dāng)前司法系統(tǒng)引入大數(shù)據(jù)技術(shù)后,司法大數(shù)據(jù)運行環(huán)境發(fā)生了改變,相應(yīng)的信息管理平臺也發(fā)生了改變,如果在管理過程中仍然采用傳統(tǒng)的靜態(tài)關(guān)聯(lián)規(guī)則對風(fēng)險進(jìn)行評估,就無法確保評估結(jié)果的準(zhǔn)確性。因此,基于該問題,該文首先引入人工智能技術(shù),利用人工智能技術(shù)的強(qiáng)大數(shù)據(jù)分析能力對不同風(fēng)險因素的支持度和置信度進(jìn)行計算,再對風(fēng)險因素動態(tài)關(guān)聯(lián)規(guī)則在時間變化過程中的動態(tài)特性進(jìn)行詳細(xì)描述。其中,支持度表示某一安全應(yīng)用風(fēng)險事件與某一風(fēng)險因素同時出現(xiàn)的概率,如公式(1)所示。
式中:為支持度,即某一安全應(yīng)用風(fēng)險事件與某一風(fēng)險因素同時出現(xiàn)的概率;為存在和同時發(fā)生的事件次數(shù);為所有事件發(fā)生的次數(shù)。
根據(jù)公式(1)求出支持度,再計算它的置信度,置信度可以用來表示在出現(xiàn)某一風(fēng)險因素的同時造成某一安全應(yīng)用風(fēng)險事件發(fā)生的概率,如公式(2)所示。
式中:為置信度,即出現(xiàn)某一風(fēng)險因素同時造成某一安全應(yīng)用風(fēng)險事件發(fā)生的概率;為發(fā)生某一安全應(yīng)用風(fēng)險事件的總次數(shù)。
在公式(1)和公式(2)的基礎(chǔ)上,根據(jù)對支持度和置信度的計算可以排除無關(guān)的因素,減少數(shù)據(jù)分析的數(shù)量,提升風(fēng)險評估的動態(tài)化水平和準(zhǔn)確度。在司法大數(shù)據(jù)信息管理平臺中,對所選擇的評估樣本進(jìn)行分塊處理,并將處理后的結(jié)果輸入相應(yīng)的集群節(jié)點中,利用現(xiàn)有靜態(tài)關(guān)聯(lián)規(guī)則對每個節(jié)點的支持度和置信度進(jìn)行計算。同時,在司法大數(shù)據(jù)中尋找頻繁項集時,引入關(guān)聯(lián)規(guī)則可有效排除支持度和置信度過低的數(shù)據(jù),從而進(jìn)一步減輕評估的負(fù)擔(dān),如圖2所示。
圖2 風(fēng)險因素動態(tài)關(guān)聯(lián)規(guī)則示意圖
風(fēng)險因素在不同過程中的重要程度也不同,當(dāng)其為不頻繁因素時,與其相關(guān)的所有數(shù)據(jù)的支持度和置信度均過低,應(yīng)該刪除相關(guān)風(fēng)險因素。而一旦其為頻繁因素,就可以認(rèn)為該風(fēng)險因素十分關(guān)鍵,需要對其進(jìn)行著重分析。例如如果某一風(fēng)險因素為不頻繁因素,即支持度和置信度過低,則與相關(guān)的、、以及等都不頻繁,則可直接將其刪除。而如果某一風(fēng)險因素為頻繁因素,即支持度和置信度較高,則與相關(guān)的、、以及等都較為頻繁,需要對所有相關(guān)因素進(jìn)行分析。在完成上述操作后,從信息管理平臺中獲取本地相關(guān)司法大數(shù)據(jù)信息集合,并在mapper中輸入1個已知的數(shù)據(jù)進(jìn)行記錄.除此之外,還要盡可能地在信息管理平臺中完成對內(nèi)容的簡單合并,并將關(guān)鍵值統(tǒng)一分配到reducer中,從而對數(shù)據(jù)進(jìn)行簡化、統(tǒng)計。最后,還要根據(jù)支持度從小到大的順序?qū)︼L(fēng)險因素進(jìn)行排列,并按照置信度從小到大的順序?qū)︼L(fēng)險因素中的子因素進(jìn)行排列,排除那些支持度和置信度過低的風(fēng)險因素,以此減少無關(guān)數(shù)據(jù)的干擾,提升分析速度,從而獲取風(fēng)險因素動態(tài)關(guān)聯(lián)規(guī)則。
在獲取司法大數(shù)據(jù)風(fēng)險因素動態(tài)關(guān)聯(lián)規(guī)則的基礎(chǔ)上,對司法大數(shù)據(jù)應(yīng)用風(fēng)險顯著性因素進(jìn)行計分,在司法大數(shù)據(jù)信息管理平臺中,根據(jù)上述內(nèi)容按照從小到大的順序?qū)λ写嬖诘娘L(fēng)險因素進(jìn)行排序,在該基礎(chǔ)上進(jìn)一步排列出4種不同等級程度的應(yīng)用風(fēng)險第二次出現(xiàn)的概率級別。其中,較差等級的計分范圍為0~3,一般等級的計分范圍為3~5,較好等級的計分范圍為5~8,最好等級的計分范圍為8~10。在劃定好以上等級計分范圍后,還需要對以上內(nèi)容的含義進(jìn)行深入認(rèn)識。該文設(shè)定上述風(fēng)險顯著性因素的計分?jǐn)?shù)值越高,則說明再次出現(xiàn)該應(yīng)用風(fēng)險事件的概率越高;如果風(fēng)險顯著性因素的計分?jǐn)?shù)值越低,則說明再次出現(xiàn)應(yīng)用風(fēng)險事件的概率越低。
同時,在計分過程中,對計分的標(biāo)準(zhǔn)進(jìn)行設(shè)定,例如對已經(jīng)發(fā)生過的應(yīng)用風(fēng)險次數(shù)進(jìn)行再次計分,如果沒有出現(xiàn)類似風(fēng)險問題,則記為3分;如果出現(xiàn)一次,則記為2分;如果出現(xiàn)2次或3次,則記為1分;如果出現(xiàn)4次及以上,則記為0分,以此類推完成對其他風(fēng)險顯著性因素的計分工作。而且還可以對已經(jīng)發(fā)生過的應(yīng)用風(fēng)險事件持續(xù)時間進(jìn)行打分,如果持續(xù)時間小于1 min,則記為3分;如果持續(xù)時間為1 min~5 min,則記為2分;如果持續(xù)時間為5 min~60 min,則記為1分;如果持續(xù)時間超過60 min,則記為0分。利用3種打分標(biāo)準(zhǔn)可以減少單一打分容易出錯的問題,提高分析的準(zhǔn)確性。
在按照上述打分標(biāo)準(zhǔn),針對所有風(fēng)險顯著性因素進(jìn)行打分后,可以為后續(xù)的司法大數(shù)據(jù)應(yīng)用風(fēng)險的量化提供重要數(shù)據(jù)支持。
將司法大數(shù)據(jù)信息管理平臺中所有需要進(jìn)行風(fēng)險評估的樣本作為評估集合,通過量化所有風(fēng)險結(jié)果的方式對司法大數(shù)據(jù)應(yīng)用風(fēng)險進(jìn)行評估。由于NSS具有系統(tǒng)交換和數(shù)據(jù)庫的功能,可以存儲相關(guān)數(shù)據(jù)并進(jìn)行分析管理。因此,在量化過程中引入網(wǎng)絡(luò)子系統(tǒng)(NSS)完成這一部署,如圖3所示。
圖3 NSS部署流程示意圖
由圖3可知,將不同的司法大數(shù)據(jù)輸入NSS中,經(jīng)由NSS分析處理并對其進(jìn)行量化,可以輸出對應(yīng)的風(fēng)險態(tài)勢。在量化時,假設(shè)某一種司法大數(shù)據(jù)應(yīng)用風(fēng)險事件發(fā)生時,其對應(yīng)的風(fēng)險顯著性因素權(quán)重為,則在某一節(jié)點上,發(fā)生這一風(fēng)險事件的概率為,結(jié)合得到如公式(3)所示的量化公式。
式中:()為通過量化后得到的司法大數(shù)據(jù)應(yīng)用風(fēng)險評估結(jié)果。
將公式(3)帶入司法大數(shù)據(jù)信息管理平臺中,對不同時刻下平臺的運行情況進(jìn)行分析,并對其可能存在的司法大數(shù)據(jù)應(yīng)用風(fēng)險進(jìn)行評估。同時,引入NSS后,能夠結(jié)合量化后的評估結(jié)果對司法大數(shù)據(jù)應(yīng)用運行風(fēng)險的態(tài)勢進(jìn)行評估,再根據(jù)量化結(jié)果數(shù)據(jù)的變化,直觀地描述司法大數(shù)據(jù)應(yīng)用運行風(fēng)險未來發(fā)生概率增高或降低的趨勢,如果量化結(jié)果數(shù)值逐漸降低,則說明該風(fēng)險事件發(fā)生的概率將會逐漸增加;反之,如果量化結(jié)果數(shù)值逐漸升高,則說明該風(fēng)險事件發(fā)生的概率將會逐漸降低,從而為后續(xù)司法大數(shù)據(jù)的應(yīng)用策略提出與設(shè)計提供更加直觀的事實依據(jù)。同時,在對司法大數(shù)據(jù)信息管理平臺進(jìn)行維護(hù)時,也可以根據(jù)風(fēng)險評估量化結(jié)果對平臺運行等級進(jìn)行劃分,從而對整個司法大數(shù)據(jù)應(yīng)用環(huán)境進(jìn)行評估。
通過該文的論述,從理論方面實現(xiàn)了對基于人工智能技術(shù)的評估方法設(shè)計。為進(jìn)一步驗證該方法在真實司法大數(shù)據(jù)應(yīng)用環(huán)境中的風(fēng)險評估水平,將該評估方法與傳統(tǒng)評估方法(基于貝葉斯網(wǎng)絡(luò)的風(fēng)險評估方法)進(jìn)行對比,使2種方法同時對相同的司法大數(shù)據(jù)應(yīng)用問題進(jìn)行風(fēng)險評估。在評估時,選擇司法系統(tǒng)中的部分案例作為評價對象,分別利用2種評估方法對其進(jìn)行評價,為確保試驗結(jié)果的客觀性,將2種評估方法的最終結(jié)果按照表1的內(nèi)容劃分為5個不同等級。
表1 司法大數(shù)據(jù)應(yīng)用風(fēng)險評估等級
由于2種評估方法得出的評分結(jié)果標(biāo)準(zhǔn)不同并且由于傳統(tǒng)評估方法未對不同風(fēng)險因素的支持度和置信度進(jìn)行計算,無法對其評估過程進(jìn)行量化,因此,需要按照如公式(4)所示的方式對傳統(tǒng)評估方法得出的結(jié)果進(jìn)行初步量化。
式中:()為傳統(tǒng)基于改進(jìn)猶豫模糊集的評估方法評估結(jié)果的量化數(shù)值;p為司法系統(tǒng)中某一試驗應(yīng)用實例發(fā)生安全風(fēng)險事件時的概率;w為司法系統(tǒng)中某一試驗應(yīng)用實例在評估過程中的權(quán)重數(shù)值。
按照上述內(nèi)容,對傳統(tǒng)評估方法的評估結(jié)果進(jìn)行量化,并對2種評估方法得到的量化結(jié)果進(jìn)行歸一化處理,如公式(5)所示。
式中:為2種評估方法得出的評估結(jié)果歸一化處理結(jié)果;為2種風(fēng)險評估方法的評估量化結(jié)果;為不同評估指標(biāo)下評估結(jié)果變化參數(shù)的平均值;為均值標(biāo)準(zhǔn)差。
根據(jù)公式(5),對2種方法評估結(jié)果進(jìn)行歸一化處理后,按照表1中的風(fēng)險評估等級對其進(jìn)行分類,并將分類結(jié)果與實際司法大數(shù)據(jù)應(yīng)用實例的風(fēng)險等級進(jìn)行對比,從而驗證2種評估方法的評估精度,方法A表示該文提出的基于人工智能技術(shù)的評估方法;方法B表示傳統(tǒng)評估方法,試驗結(jié)果見表2。
表2 2種評估方法評估結(jié)果等級劃分
根據(jù)表2中的數(shù)據(jù)可以看出,在不同風(fēng)險評估等級實例數(shù)量的影響下,該文方法評估結(jié)果與實際結(jié)果完全一致,而傳統(tǒng)評估方法得出的結(jié)果與實際相差較大,差距最大可達(dá)到64例。由此可以證明與傳統(tǒng)評估方法相比,該文設(shè)計方法的風(fēng)險評估效果更好。
綜上所述,將該文提出的基于人工智能技術(shù)的應(yīng)用風(fēng)險評估方法應(yīng)用到實際司法大數(shù)據(jù)應(yīng)用環(huán)境中,可提高安全風(fēng)險事件評價的精度。將該方法應(yīng)用于實際,可為司法大數(shù)據(jù)應(yīng)用策略提供重要的事實依據(jù),具有一定應(yīng)用價值。
針對當(dāng)前信息管理平臺在對司法系統(tǒng)在運行過程中存在的風(fēng)險事件無法進(jìn)行準(zhǔn)確評估的問題,該文對其風(fēng)險評估方法進(jìn)行設(shè)計研究。通過引入人工智能技術(shù)提出了一種全新的評估方法,并結(jié)合對比試驗驗證了該方法的應(yīng)用效果。但由于研究能力有限,該文在試驗過程中所選擇的對照條件只能夠?qū)︼L(fēng)險事件進(jìn)行定性評估,在對其量化時采用的方式可能不適用于該方法,因此造成了傳統(tǒng)評估方法試驗結(jié)果與實際出入較大的問題,使影響因素增加,最終得出的試驗結(jié)果存在一定的不確定性。因此,針對這一問題,在后續(xù)的研究中,還將選擇更符合試驗需要的對照條件以及試驗操作環(huán)節(jié),從而確保試驗結(jié)果的客觀性,也為該文評估方法的進(jìn)一步優(yōu)化提供重要依據(jù)。