陳 港 應(yīng)一豪 王 鈺
1.浙江公共安全技術(shù)研究院有限公司,浙江 杭州 310052;
2.浙江省玉環(huán)市人民法院,浙江 玉環(huán) 317600;
3.浙江公共安全技術(shù)研究院有限公司,浙江 杭州 310052
失信被執(zhí)行人目前并沒有明確的概念,從廣義上而言,失信行為的范圍可以包括日常生活、經(jīng)濟(jì)領(lǐng)域、政治領(lǐng)域以及司法領(lǐng)域等當(dāng)中的失信行為。在民事執(zhí)行程序當(dāng)中,失信被執(zhí)行人的失信行為主要從狹義角度分析,在司法領(lǐng)域當(dāng)中對失信行為特有的內(nèi)涵及特征進(jìn)行提取。根據(jù)不同的失信行為嚴(yán)重程度,將失信行為分為失信和嚴(yán)重失信行為,前者通常嚴(yán)重程度較低,對他人或社會造成損害較小,而后者會對他人及社會的合法權(quán)益造成嚴(yán)重的損害[1]。當(dāng)前針對被執(zhí)行人特征提取的相關(guān)技術(shù),無論是在學(xué)術(shù)研究還是在應(yīng)用上都存在較大的發(fā)展空間[2]。對此,本文提出一種基于多元異構(gòu)數(shù)據(jù)融合的失信被執(zhí)行人特征提取研究。
在利用多元異構(gòu)數(shù)據(jù)融合技術(shù)對失信被執(zhí)行人特征進(jìn)行提取前,首先應(yīng)當(dāng)根據(jù)失信被執(zhí)行人的行為特征,構(gòu)建面向失信被執(zhí)行人的多維數(shù)據(jù)標(biāo)簽體系,見圖1。
由圖1可知,本文構(gòu)建的面向失信被執(zhí)行人的多維數(shù)據(jù)標(biāo)簽體系中共包含九個維度,分別覆蓋失信被執(zhí)行人的基本信息、日常生活信息、經(jīng)濟(jì)信息、政治信息等。失信被執(zhí)行人基本信息主要包括:姓名、性別、年齡等。[3]。將九個維度數(shù)據(jù)標(biāo)簽存儲為不同的屬性Property,并將屬性存儲在圖的頂點(diǎn)或邊上。以此實(shí)現(xiàn)對大規(guī)模數(shù)據(jù)進(jìn)行存儲,對千億級特征數(shù)據(jù)實(shí)時檢索、分析、計算達(dá)到秒級響應(yīng)速度。
圖1 面向失信被執(zhí)行人的多維數(shù)據(jù)標(biāo)簽體系
根據(jù)本文上述構(gòu)建的失信被執(zhí)行人多維數(shù)據(jù)標(biāo)簽體系,針對多維數(shù)據(jù)對其進(jìn)行基于多元異構(gòu)數(shù)據(jù)融合的特征提取計算。利用曲線排齊算法對兩種數(shù)據(jù)特征進(jìn)行融合。假設(shè)兩個序列分別為X1和X2,在X1和X2之間的錯位函數(shù)為:
當(dāng)通過公式(3)計算得出的相關(guān)系數(shù)最大值達(dá)到實(shí)現(xiàn)特征提取方位時,則說明該人員屬于失信被執(zhí)行人屬性,其相關(guān)信息將立即被提取。
對于本身不存在相關(guān)性的序列,不需要進(jìn)行序列的曲線排齊。針對如何選擇需要進(jìn)行排齊的序列的問題,本文首先將所有的多維數(shù)據(jù)標(biāo)簽進(jìn)行分類,將相同維度數(shù)據(jù)標(biāo)簽分為一組。假設(shè)在同一組維度數(shù)據(jù)標(biāo)簽中,其內(nèi)部的數(shù)據(jù)有著一定的相關(guān)性,則說明,在同一組維度數(shù)據(jù)標(biāo)簽中,可以進(jìn)行隨機(jī)的選擇,選出任意一個作為參照序列都不會對后續(xù)的曲線排齊產(chǎn)生影響。
由于失信被執(zhí)行人的相關(guān)信息在一定程度上還屬于隱私信息,以此本文實(shí)驗(yàn)主要采用公開的UCI smartphone數(shù)據(jù)集作為實(shí)驗(yàn)對象,從數(shù)據(jù)集中選取30名參與者,年齡分布在25-45周歲之間。根據(jù)本文構(gòu)建的面向失信被執(zhí)行人的多維數(shù)據(jù)標(biāo)簽體系,提取九個維度的數(shù)據(jù)信息。分別選取6-8個圖像作為訓(xùn)練樣本。實(shí)驗(yàn)組采用本文提出的基于多元異構(gòu)數(shù)據(jù)融合的失信被執(zhí)行人特征提取方法對特征進(jìn)行提取,對照組采用傳統(tǒng)方法對特征進(jìn)行提取。根據(jù)上述實(shí)驗(yàn)準(zhǔn)備,完成對比實(shí)驗(yàn),將實(shí)驗(yàn)結(jié)果記錄,見表1。
表1 實(shí)驗(yàn)結(jié)果對比表
對表1中的數(shù)據(jù)進(jìn)行縱向比較可以得出,實(shí)驗(yàn)組通過增加訓(xùn)練樣本的個數(shù)可以有效提高對特征信息數(shù)據(jù)的提取量,而對照組通過增加訓(xùn)練樣本的個數(shù)無法實(shí)現(xiàn)對特征信息數(shù)據(jù)提取量的增加。通過對比實(shí)驗(yàn)可知,本文提出的基于多元異構(gòu)數(shù)據(jù)融合的失信被執(zhí)行人特征提取的提取效率明顯優(yōu)于傳統(tǒng)提取方法,可以有效保證后續(xù)失信被執(zhí)行人特征識別的準(zhǔn)確性,具有更高的應(yīng)用價值。
本文通過對失信被執(zhí)行人行為的研究,提出一種基于多元異構(gòu)數(shù)據(jù)融合的特征提取方法,從一定程度上減輕了傳統(tǒng)特征提取方法由于受到外界和內(nèi)在因素影響造成提取信息不完整的問題。在后續(xù)的研究中還將對后續(xù)特征提取和識別進(jìn)行更加深入的研究,從而降低失信被執(zhí)行人對社會造成的不利影響。