孫存良 楊霏 宮文策
摘要:目前領(lǐng)域內(nèi)針對計算機操作行為的分析,主要通過人工桌面監(jiān)控、記錄按鍵內(nèi)容、文件操作記錄等方式對計算機行為進行的監(jiān)控分析。該文則提出一種基于色彩圖像聚類分析以及K-means算法對圖形進行統(tǒng)計來實現(xiàn)行為分析判斷的方法,根據(jù)色彩的種類、范圍以及深度對計算機操作圖像進行分類統(tǒng)計,以此判定出某時間點計算機正在進行的娛樂、工作以及其他操作。
關(guān)鍵詞:彩色圖像聚類算法;K-means算法;行為分析
中圖分類號:TP391 文獻標志碼:A 文章編號:1009-3044(2015)13-0180-02
隨著科學(xué)技術(shù)的不斷發(fā)展、計算機應(yīng)用領(lǐng)域的不斷開拓,圖像處理方法應(yīng)運而生,目的是利用計算機設(shè)備將圖像進行分類處理,用于智能分析圖像信息。當今圖像處理與識別的應(yīng)用范圍越來越廣,但就目前的水平而言,計算機對外部的感知能力還比較薄弱,還需要投入大量人力、物力從事數(shù)字圖像處理與識別的理論和應(yīng)用的研究。于是各行各業(yè)對于數(shù)字圖像處理技術(shù)的精確化與智能化有著更大的需求。這樣的需求尤其體現(xiàn)在航空航天、生物醫(yī)學(xué)工程、工業(yè)檢測、機器人視覺、公安司法、文化藝術(shù)等領(lǐng)域。
而本文針對數(shù)字圖像處理技術(shù)的特性,將其應(yīng)用在普遍計算機操作行為的分析之中,實現(xiàn)了一種根據(jù)計算機操作過程中顯現(xiàn)的圖像色彩來智能分析其操作行為的創(chuàng)新功能。
1 算法簡介
彩色圖像的聚類分析以及K-means算法是本課題的關(guān)鍵。本文通過彩色圖像聚類分析與K-means算法將圖像轉(zhuǎn)化為3類模塊,分別為正常圖像,渲染圖像與灰度圖像。對這3類模塊同時進行遍歷與聚類,計算出其影響行為分析判斷的影響色塊區(qū)間與影響深度區(qū)間,基于兩類區(qū)間相互結(jié)合,最終依照閥值界限對原圖像進行行為判斷,得出操作行為分析結(jié)論。
圖1為算法結(jié)果演示圖。
2 算法實現(xiàn)
2.1獲取計算機圖像
獲取當前窗體的大小,創(chuàng)建一個以當前窗體為模板的圖象,創(chuàng)建一個位圖Bitmap繪圖圖面,得到窗體的句柄和圖像的句柄,復(fù)制土塊的光柵操作碼,調(diào)用API函數(shù),實現(xiàn)窗體捕獲。釋放句柄,保存圖像。本例中圖像結(jié)果如圖2。
2.2彩色圖像聚類分析
根據(jù)行為分析圖像·自定義顏色的色系,程序?qū)@取的圖像,統(tǒng)一轉(zhuǎn)化為rgb格式,遍歷圖像的像素點,獲取圖像中色系種類與比例及色系的位置,統(tǒng)計主要顏色所在色系的權(quán)重。根據(jù)自定義的色彩模型,分析圖像內(nèi)容。
基于色彩圖像的RGB格式,建立三維坐標圖,其中R為X軸,G為Y軸,B為Z軸,坐標軸長度均為255,根據(jù)近似色的微小差別,將三通道色素劃分為14個色系,即14個色彩區(qū)塊,之后根據(jù)色彩區(qū)塊的冷暖調(diào)與鮮明程度,與已有的操作行為圖像結(jié)果進行匹配統(tǒng)計得出具體閥值。圖4為劃分的部分色系圖。
根據(jù)彩色圖像將所有像素點規(guī)劃到14個色彩區(qū)塊,之后遍歷所有像素點將其編入類組,將同一類組的像素點進行渲染形成同一顏色,圖3為渲染圖。
通過反復(fù)試驗經(jīng)驗積累,按照冷暖色調(diào)與色彩鮮明度提取出色彩區(qū)塊中該色彩比例對行為分析判斷結(jié)果造成影響的六類色區(qū)。構(gòu)建一個影響色塊區(qū)間,存放六類色區(qū)中最終對行為分析結(jié)果造成影響的像素點。統(tǒng)計這六類色區(qū),當某一色區(qū)所占總像素比例超過指定閥值時(本閥值是在反復(fù)試驗中經(jīng)過大量已歸類行為圖片分析計算后歸約出來的行為色彩區(qū)分界限),保存其色區(qū)像素比例致影響色塊區(qū)間。圖5為主色系所占比例。
2.2灰度圖像聚類分析
本研究中對于灰度圖像的聚類分析主要根據(jù)K-means算法進行聚類實現(xiàn)。
本研究所采用的K-Means聚類算法的優(yōu)點主要集中在:算法快速、簡單;對大數(shù)據(jù)集有較高的效率并且是可伸縮性的;時間復(fù)雜度近于線性,而且適合挖掘大規(guī)模數(shù)據(jù)集。
K-Means聚類算法的時間復(fù)雜度是O(nkt) ,其中n代表數(shù)據(jù)集中對象的數(shù)量,t代表著算法迭代的次數(shù),k代表著簇的數(shù)目。
K-means算法具體流程為:
1)隨機選取k個聚類質(zhì)心點(cluster centroids)為[μ1,μ2,...,μk∈Rn]。
2)重復(fù)下面過程直到收斂
對于每一個樣例i,計算其應(yīng)該屬于的類
[c(i)=argminj||x(i)-μj||2]
對于每一個類j,重新計算該類的質(zhì)心
[μj:=i=1m1{c(i)=j}x(i)i=1m1{c(i)=j}]
在 K-means 算法中 K 的選取均有人工指定,而 K 值的選定是非常難以估計的。本文在對大量原始數(shù)據(jù)實驗結(jié)果的基礎(chǔ)上進行總結(jié),得出當k值選定為5時,對于操作行為分析具有最佳精準度。
在 K-means 算法中,首先需要根據(jù)初始聚類中心來確定一個初始劃分,然后對初始劃分進行優(yōu)化。這個初始聚類中心的選擇對聚類結(jié)果有較大的影響,一旦初始值選擇不當,則可能無法得到有效的聚類結(jié)果。本研究中初始聚類中心,是根據(jù)彩色圖像的比例最大的主色系的位置的中心來設(shè)定的。
3 算法效果
本文針對目前市面中出現(xiàn)率頻繁的娛樂游戲、電影、辦公軟件、學(xué)習(xí)軟件進行檢測,本算法效果有著較強實用性。其中,深色系游戲與電影分析的效果顯著,如《英雄聯(lián)盟》、
《DOTA》、《哈利波特》。而淺色系游戲,在特定場景中分析效果會受到干擾,如《劍網(wǎng)三》當中對圖片進行光暈處理后,其影像色彩區(qū)間受到波動。對此現(xiàn)象,經(jīng)過大量的圖片測試,對游戲類的圖像進行了歸納,這對今后的算法修改提供了很好的數(shù)據(jù)矯正。
4 結(jié)束語
本文立足于圖像處理技術(shù)的創(chuàng)新與應(yīng)用,并將圖像處理技術(shù)與計算機操作行為分析相結(jié)合,運用自編彩色圖像聚類分析算法對圖像色彩進行分類統(tǒng)計,構(gòu)建影響色彩區(qū)間并對區(qū)間色彩進行操作行為匹配,劃定區(qū)間閥值。以及引入K-means算法對圖像進行灰度化處理,通過實驗數(shù)據(jù)結(jié)果以及經(jīng)驗選擇K值以適應(yīng)行為分析計算,同時構(gòu)建深度影響區(qū)間,對圖像色彩深度進行分類,最終結(jié)合影響色彩區(qū)間劃定行為分析界限。實現(xiàn)了智能分析計算機操作行為的創(chuàng)新,擺脫人工監(jiān)控與識別行為。這對將來自動對計算機圖像界面、行為模式分析的監(jiān)控與統(tǒng)計提供了可觀的價值。
參考文獻:
[1] Parker J R. 圖像處理與計算機視覺算法及應(yīng)用[M]. 2版. 北京: 清華大學(xué)出版社, 2012.
[2] 趙春江. C#數(shù)字圖像處理算法典型實例[M]. 北京: 人民郵電出版社, 2009.
[3] 謝鳳英. 數(shù)字圖像處理及應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2008.
[4] 費新碑. 網(wǎng)絡(luò)界面視覺識別系統(tǒng)設(shè)計(WVIS)理論研究報告[J]. 科普研究, 2009(5).
[5] 王千, 王成, 馮振元,等. K-means聚類算法研究綜述[J]. 電子設(shè)計工程, 2012(7).