卜燦燦
(山東英才學(xué)院 山東 濟(jì)南 250104)
目前,要提升物聯(lián)網(wǎng)區(qū)塊鏈的數(shù)據(jù)挖掘水平,關(guān)鍵在于對數(shù)據(jù)進(jìn)行聚類處理,而區(qū)塊鏈數(shù)據(jù)挖掘的基礎(chǔ)在于數(shù)據(jù)信息識別與特征提取,選擇模糊信息識別技術(shù)開發(fā)區(qū)塊鏈數(shù)據(jù),并與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)特性相結(jié)合,創(chuàng)建區(qū)塊鏈數(shù)據(jù)信息分析模型,借助資源優(yōu)化調(diào)度與信息融合,實現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類分析[1]。 對物聯(lián)網(wǎng)區(qū)塊鏈進(jìn)行數(shù)據(jù)挖掘,是以數(shù)據(jù)的特性抽取和信息辨識為依據(jù),運用模糊信息辨識技術(shù),設(shè)計物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的存鏈結(jié)構(gòu),并與其大數(shù)據(jù)的特性分布相結(jié)合,進(jìn)行異質(zhì)重組,實現(xiàn)對大數(shù)據(jù)的聚類分析。
現(xiàn)階段對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)進(jìn)行聚類的方法,包括K-Means 聚類法、網(wǎng)格區(qū)域聚類方法、粒子群聚類方法等。本文提出深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)分片峰值聚類算法,首先分析區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)特征,其次實施區(qū)塊鏈數(shù)據(jù)特征提取,與分片峰值聚類方法相結(jié)合,實現(xiàn)數(shù)據(jù)聚類優(yōu)化,最后展開仿真測試,并獲得有效性結(jié)論。
數(shù)據(jù)和事務(wù)都不會被第三方所掌控,這就是分布式賬本。 最早被Nakamoto 介紹為比特幣(Bitcoin,BTC)的一個重要組成部分,而在此之后,又有許多新的區(qū)塊鏈被應(yīng)用到了各個領(lǐng)域。 但是,區(qū)塊鏈具有一定的共性,具體表現(xiàn)為:(1)復(fù)制賬本:將區(qū)域內(nèi)的各節(jié)點交易記錄保存在一個獨立的區(qū)域內(nèi),并將最近一次事件封裝為一個區(qū)域,使得各區(qū)域內(nèi)事件都可進(jìn)行分配和拷貝。 (2)點對點網(wǎng)絡(luò)結(jié)構(gòu):各結(jié)點共用一個公用賬冊,沒有因特網(wǎng)的中心式管理參與方。 換句話說,所有的結(jié)點都是經(jīng)由一個點到點的網(wǎng)絡(luò)聯(lián)結(jié)的,并經(jīng)由這個網(wǎng)絡(luò)來將交易與區(qū)塊進(jìn)行同步。(3)密碼學(xué):在一個數(shù)據(jù)塊被接入到另一個數(shù)據(jù)塊上之前,整個數(shù)據(jù)塊上的數(shù)據(jù)必須是一致性。 其中,工作證明、利益證明以及拜占庭等是最為典型的一致性算法。 (4)加密:加密技術(shù)是區(qū)塊鏈網(wǎng)絡(luò)安全的基礎(chǔ)。 在區(qū)塊鏈的環(huán)境下,一個事務(wù)的完整性應(yīng)該包含數(shù)字簽名以及私有數(shù)據(jù)結(jié)構(gòu)(例如,梅克爾樹等)。 采用不對稱加密技術(shù)可以實現(xiàn)數(shù)據(jù)的隱私保護(hù)。 區(qū)塊鏈把不同的數(shù)據(jù)塊以一定的時間序列相互聯(lián)系起來,形成一種鏈狀的組織形式,每一個模塊都有各自的頭部和主體。
在這些區(qū)域中,區(qū)域頭等部分包含大部分確認(rèn)信息,如版本號、時間戳、區(qū)域頭等。 模塊是對電網(wǎng)物聯(lián)網(wǎng)內(nèi)部和外部的信息進(jìn)行收集和處理。 以區(qū)塊鏈為基礎(chǔ),通過與其他節(jié)點之間的間接相互作用,可以避免在相互作用過程中受到網(wǎng)絡(luò)攻擊時密鑰泄露,保證數(shù)據(jù)的安全。 另外,這些信息僅由數(shù)字簽字組成,大大減少在區(qū)塊鏈中的數(shù)據(jù)傳送,從而可以縮短建立區(qū)塊鏈所需時間,確保資料的時效性。
現(xiàn)階段,物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類分析法包括K-Means聚類法、粒子群聚類法以及網(wǎng)格區(qū)域聚類法等,創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的特征提取與大數(shù)據(jù)分析模型,借助特征分布式檢測方法,實現(xiàn)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類。
通過有向圖模型對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)模型進(jìn)行構(gòu)建,選用統(tǒng)計分析法,獲得區(qū)塊鏈數(shù)據(jù)異構(gòu)存儲模型,對其模糊聚類特征分布集進(jìn)行計算,從而獲得融合度函數(shù)式
(1):
對區(qū)塊鏈數(shù)據(jù)集差異分布特征進(jìn)行分析,獲得各插值點如式(2)所示:
式(2)中,dm+1(m)表示第m 點的區(qū)塊鏈數(shù)據(jù)預(yù)測值,dm+1(m)表示第m 點所采集區(qū)塊鏈數(shù)據(jù)特征量,依照區(qū)塊鏈數(shù)據(jù)特征,通過模糊C 均值聚類提取結(jié)果,并展開信息處理,假設(shè)全局變量,創(chuàng)建區(qū)塊鏈數(shù)據(jù)挖掘分割系數(shù)[2],即式(3)所示:
式(3)中Mi表示區(qū)塊鏈數(shù)據(jù)挖掘平均數(shù),Lm表示區(qū)塊鏈數(shù)據(jù)挖掘下界,fm表示區(qū)塊鏈數(shù)據(jù)均值,fless表示不同維度下的區(qū)塊鏈數(shù)據(jù)統(tǒng)計特征最小值[3]。
基于大數(shù)據(jù)背景,建立節(jié)點分布模型,并聚類優(yōu)化設(shè)計區(qū)塊鏈數(shù)據(jù)的分片峰值。 假設(shè)區(qū)塊鏈數(shù)據(jù)聚類節(jié)點屬性集是X={x1,x1,…,xn} ,設(shè)計聚類節(jié)點圖模型,通過語義本體模型構(gòu)造處理區(qū)塊鏈數(shù)據(jù),借助自相關(guān)特征匹配,研究相似區(qū)塊鏈數(shù)據(jù)貼近度φ1,如式(4)所示:
假設(shè)(s1,a1),(s2,a2),…,(sn,an)是區(qū)塊鏈數(shù)據(jù)聚類的一組分布集,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類模型,并統(tǒng)計分析數(shù)據(jù)聚類,實現(xiàn)自適應(yīng)調(diào)度。 基于模糊語義融合聚類展開區(qū)塊鏈數(shù)據(jù)加權(quán)分析,從而獲得模糊加權(quán)分布向量,考慮到等價語義映射,展開物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的融合分析。 創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)統(tǒng)計特征量,借助映射函數(shù)M 表示,M:C*C→r 對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)相似度信息進(jìn)行描述,采用空間聚類分析分布式調(diào)度區(qū)塊鏈數(shù)據(jù),創(chuàng)建本體模型,以展開區(qū)塊鏈數(shù)據(jù)特征聚類處理與語義相似度融合。
通過有向圖模型,對區(qū)塊鏈數(shù)據(jù)聚類節(jié)點結(jié)構(gòu)模型進(jìn)行構(gòu)建,并在區(qū)塊鏈數(shù)據(jù)庫提取資源信息特征,假設(shè){(s1,a1),(s2,a2),…,(sn,an)} 為區(qū)塊鏈數(shù)據(jù)語義特征分量,通過異構(gòu)有向圖分析設(shè)計區(qū)塊鏈數(shù)據(jù)存儲結(jié)構(gòu),與特征空間重組相結(jié)合,實現(xiàn)區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)的充足,以獲得優(yōu)化加權(quán)系數(shù)[4],即:w =((w1,a′1), (w2,a′2),…,(wn,a′n)T),wj∈[0,1] 。 通過統(tǒng)計分析實現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類檢測,以獲得關(guān)聯(lián)性本體結(jié)構(gòu)模型如式(5)所示:
轉(zhuǎn)化區(qū)塊鏈數(shù)據(jù)聚類特征問題為二元語義決策問題,其模糊特征匹配評估指標(biāo)集Ek∈E(k =1,2,…,t),選擇主體詞匹配,對X 相似度函數(shù)進(jìn)行分析,獲得區(qū)塊鏈數(shù)據(jù)隸屬度函數(shù)如式(6)所示:
選擇決策樹模型實現(xiàn)區(qū)塊鏈數(shù)據(jù)特征重構(gòu),遞歸圖模型內(nèi),選擇相空間重構(gòu)法,進(jìn)行模糊特征信息采樣,以獲得區(qū)塊鏈數(shù)據(jù)信息加群權(quán)重向量,其特征分布矩陣為式(8)所示:
式(8)中,c 表示區(qū)塊鏈數(shù)據(jù)聚類搜索步數(shù),μik表示區(qū)塊鏈數(shù)據(jù)關(guān)聯(lián)決策系數(shù)[5]。
基于以上分析,實現(xiàn)區(qū)塊鏈數(shù)據(jù)優(yōu)化調(diào)度與特征分析,獲得區(qū)塊鏈數(shù)據(jù)聚類中心。 通過分塊特征演化,檢測區(qū)塊鏈數(shù)據(jù)關(guān)聯(lián)特征,從而獲得模糊檢測向量,如式(9)所示,再與模糊相關(guān)性融合法相結(jié)合,展開區(qū)塊鏈分片峰值聚類分析。
通過模糊C 類均值聚類展開區(qū)塊鏈數(shù)據(jù)網(wǎng)格分片屬性分類與峰值聚類識別,通過深度學(xué)習(xí)法實現(xiàn)數(shù)據(jù)聚類的分片峰值融合與聚類分析,從而獲得區(qū)塊鏈數(shù)據(jù)在線聚類準(zhǔn)則[6],即式(10):
區(qū)塊鏈數(shù)據(jù)聚類節(jié)點的深度學(xué)習(xí)加權(quán)系數(shù)是We =(wj(e),0)。 通過修正各聚類自適應(yīng)加權(quán)學(xué)習(xí)系數(shù)vi,即可獲得聚類有效性評估矩陣R =(rij,aij)m×n與指標(biāo)權(quán)重W=((w1,β1),(w2,β2),…,(wn,βn)) 。 綜上所述,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類的深度學(xué)習(xí)模型,對區(qū)塊鏈數(shù)據(jù)模糊特征分布集進(jìn)行構(gòu)建,以獲得區(qū)塊鏈數(shù)據(jù)約束規(guī)劃模型見式(11)、(12):
根據(jù)式(11)、(12),可以獲得物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)鏈最優(yōu)評價集是L1,L2,…,Ln 與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類模型為式(13)所示:
式(13)中,cosinij→x(dij,dxv)表示物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)融合聚類特征集,基于以上分析,滿足區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類目標(biāo)。
區(qū)塊鏈數(shù)據(jù)聚類分析中,為對語義相關(guān)性融合性方法應(yīng)用性能進(jìn)行驗證,展開實驗測試分析,通過Matlab7 與C++混合編程展開區(qū)塊鏈數(shù)據(jù)算法處理,基于Hadoop 云平臺對區(qū)塊鏈數(shù)據(jù)庫結(jié)構(gòu)模型進(jìn)行構(gòu)建,區(qū)塊鏈數(shù)據(jù)初始樣本規(guī)模是1200,數(shù)據(jù)采樣集相似度是0.68,自適應(yīng)學(xué)習(xí)迭代步數(shù)為30,設(shè)定以上仿真參數(shù),展開區(qū)塊鏈數(shù)據(jù)峰值聚類分析,從而獲得如圖1 所示的區(qū)塊鏈數(shù)據(jù)分布[7]。
圖1 數(shù)據(jù)時域波形
將圖1 數(shù)據(jù)作為研究對象,通過語義相關(guān)性融合法提取區(qū)塊鏈數(shù)據(jù)特征與自適應(yīng)調(diào)度,再對區(qū)塊鏈數(shù)據(jù)特征量展開模糊聚類處理,進(jìn)而進(jìn)行分片峰值聚類分析,可獲得如圖2 所示的聚類結(jié)果。
圖2 數(shù)據(jù)分片峰值聚類
通過分析圖2 可以發(fā)現(xiàn),選擇該方法展開區(qū)塊鏈數(shù)據(jù)聚類分析,具有良好的峰值融合度,測試誤分率比較低,而且收斂性也比較強(qiáng),表1 為誤分率比較結(jié)果,從結(jié)果可以看出,深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)聚類具有較低誤分率。通過結(jié)果分析發(fā)現(xiàn),該方法展開區(qū)塊鏈數(shù)據(jù)聚類具有較低誤分率,使數(shù)據(jù)聚類收斂控制能力大幅度提升。
表1 誤分率比較
本文通過模糊信息識別技術(shù)開發(fā)區(qū)塊鏈數(shù)據(jù)存鏈結(jié)構(gòu),提出深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)特征重構(gòu),通過深度學(xué)習(xí)法實現(xiàn)數(shù)據(jù)聚類分片峰值聚類與融合。 物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)遞歸圖模型內(nèi),選擇相空間重構(gòu)方式,采集物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類模糊特征信息,通過深度學(xué)習(xí)法對數(shù)據(jù)聚類實施分片峰值融合與聚類分析,從而達(dá)到分片峰值聚類目的。 結(jié)果顯示,該方法展開區(qū)塊鏈數(shù)據(jù)峰值聚類具有良好收斂性,數(shù)據(jù)聚類精度高,而且誤分率也比較低。