• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于KII算法的公務(wù)卡用戶分類模式研究

      2016-10-31 23:55吳素云
      中國(guó)總會(huì)計(jì)師 2016年7期
      關(guān)鍵詞:公務(wù)卡

      吳素云

      摘要:本文根據(jù)行政企事業(yè)單位工作人員辦公的特點(diǎn),借鑒相關(guān)銀行系統(tǒng)理論與實(shí)踐,對(duì)聚類方法中的經(jīng)典K-means算法進(jìn)行了改進(jìn),并應(yīng)用到公務(wù)卡用戶分類模式中,實(shí)現(xiàn)對(duì)公務(wù)卡用戶的價(jià)值及行為特征的分類。對(duì)KII算法進(jìn)行了仿真,實(shí)驗(yàn)結(jié)果表明該算法的準(zhǔn)確率等方面較經(jīng)典K-means算法有所提升。本文闡述了公務(wù)卡用戶分類時(shí)如何選擇分類變量、如何進(jìn)行數(shù)據(jù)的預(yù)處理的全過(guò)程,也為銀行進(jìn)行公務(wù)卡用戶分類提供了方法上的指導(dǎo)。

      關(guān)鍵詞:KII算法 公務(wù)卡 用戶分類

      借鑒國(guó)內(nèi)外相關(guān)的理論研究,基于數(shù)據(jù)挖掘技術(shù)的公務(wù)卡用戶分類研究很多都是基于經(jīng)典K-means算法進(jìn)行的,這主要是因?yàn)橄鄬?duì)大部分聚類算法而言,K-means算法的時(shí)空復(fù)雜度相對(duì)較小,性能相對(duì)較好,同時(shí)很多挖掘工具都提供了內(nèi)置的K-means聚類模型,如SPSS Clementine,DB Miner等,可直接使用,非常方便。但由于經(jīng)典K-means算法本身存在的一些固有缺陷(如參數(shù)人為指定,初始聚類中心隨機(jī)生成等),會(huì)影響公務(wù)卡用戶分類結(jié)果的可靠性。因此本文將克服了K-means四大缺陷的算法——啟發(fā)式初始化的改進(jìn)K-means算法(KII算法)應(yīng)用到公務(wù)卡用戶分類研究中,建立基于KII算法的公務(wù)卡用戶分類模式。

      一、公務(wù)卡用戶分類的維度分析

      (一)維度分析的依據(jù)

      維度是人們觀察事物的角度,是有關(guān)于目標(biāo)問題的屬性的集合。在不同的應(yīng)用背景和應(yīng)用目的下,維度的選擇和構(gòu)成也不同。在公務(wù)卡用戶分類問題中,銀行分類的主要目的是識(shí)別用戶的行為特征,尤其是用戶中高價(jià)值用戶的特征,以便對(duì)具有相似行為特征的高價(jià)值用戶群開展集中的針對(duì)性營(yíng)銷和服務(wù),因此用戶的價(jià)值特征以及行為特征對(duì)銀行而言都是非常感興趣的模式,都可以作為公務(wù)卡用戶分類的維度。對(duì)于用戶的基本特征以及賬戶特征,由于它們能夠?qū)珓?wù)卡用戶的價(jià)值及行為特征產(chǎn)生影響,因而銀行對(duì)這類特征也很關(guān)心,所以它們也應(yīng)該列為公務(wù)卡用戶分類的維度。因此下文將從個(gè)人基本特征、用戶持卡行為、用戶價(jià)值、用戶賬戶特征四個(gè)維度進(jìn)行綜合分析,建立一個(gè)完整的用戶分類指標(biāo)體系,以提供用戶分類變量的選取范圍。當(dāng)分類指標(biāo)體系確定后,可根據(jù)挖掘目標(biāo)的需要,選取合適的分類變量。

      (二)公務(wù)卡用戶分類指標(biāo)體系構(gòu)建

      1.個(gè)人基本特征指標(biāo)

      公務(wù)卡用戶個(gè)人基本特征會(huì)對(duì)行為和價(jià)值產(chǎn)生影響,在對(duì)用戶進(jìn)行分類時(shí)應(yīng)該加入這類信息。本文從人口統(tǒng)計(jì)特征和社會(huì)特征兩個(gè)方面提取指標(biāo),其中包括用戶的性別、年齡、學(xué)歷、職業(yè)、職位、所在地都市化程度、婚姻狀況、住房狀況、自有車狀況、個(gè)人月收入、供養(yǎng)人口數(shù)、家庭月收入等指標(biāo)。如圖1所示。

      2.用戶用卡行為特征指標(biāo)

      用戶用卡行為主要由購(gòu)買、還款、取現(xiàn)等行為組成,可以從消費(fèi)特征、交易特征兩個(gè)角度分析提取指標(biāo)。消費(fèi)特征反映用戶對(duì)特定商品類型的偏愛,包含的指標(biāo)有受卡方類型、受卡方消費(fèi)金額、受卡方對(duì)應(yīng)消費(fèi)次數(shù),交易特征包括交易類型、交易金額、交易次數(shù)等指標(biāo)。如圖2所示。

      部分指標(biāo)說(shuō)明為,第一,受卡方類型:銀行分配給特別商戶的代碼一般進(jìn)行分類,本文為了方便在宏觀上發(fā)現(xiàn)用戶的消費(fèi)特征,將受卡方按消費(fèi)類別分為五類,分別為①商場(chǎng)、超市等零售業(yè),②餐飲酒店類,③住宿類,④交通類,⑤網(wǎng)上消費(fèi)。第二,交易類型:指消費(fèi)、取現(xiàn)、透支、還款等交易代碼。

      3.公務(wù)卡用戶價(jià)值特征指標(biāo)

      針對(duì)公務(wù)卡用戶的價(jià)值,有很多不同的定義和評(píng)價(jià)方法。其中比較有影響力的價(jià)值分類方法是將用戶的價(jià)值分為當(dāng)前價(jià)值和潛在價(jià)值。這雖然在理論上很完善,但實(shí)際操作卻很難實(shí)現(xiàn)。因?yàn)橛脩舻臐撛趦r(jià)值量化非常困難,去銀行搜集與之相關(guān)的數(shù)據(jù)也不容易得到,所以本文僅考慮用戶的當(dāng)前價(jià)值。當(dāng)前價(jià)值是公務(wù)卡用戶的行為所產(chǎn)生的,所以也可理解為行為價(jià)值??梢赃x取商戶回傭、透支利息、滯納金收益、年費(fèi)收入、存貸款利差、其他收入等指標(biāo)作為用戶價(jià)值的主要指標(biāo)。

      從圖3可以看到,商戶回傭?qū)?yīng)的是公務(wù)卡用戶的購(gòu)買行為,是用戶購(gòu)買活動(dòng)所帶來(lái)的價(jià)值,而滯納金分別對(duì)應(yīng)著逾期產(chǎn)生的罰金,透支利息是免息期外產(chǎn)生的費(fèi)用,受透支時(shí)間和金額影響,存貸款利差是公務(wù)卡賬面金額帶來(lái)的收益。

      4.公務(wù)卡用戶賬戶特征指標(biāo)

      公務(wù)卡賬戶特征包括卡賬戶的基本特征和信用特征,卡賬戶基本特征包括持卡類型、開卡時(shí)間、賬面余額、透支金額等指標(biāo),信用特征包括信用額度、信用等級(jí)、逾期等級(jí)、違約情況等指標(biāo)。如圖4所示。

      5.用戶分類指標(biāo)體系構(gòu)成

      公務(wù)卡個(gè)人信息:性別、年齡、學(xué)歷、婚姻狀況、住房狀況、職業(yè)、職位、個(gè)人月收入、供養(yǎng)人口數(shù)、家庭月收入。用卡特征:受卡方、受卡方對(duì)應(yīng)消費(fèi)金額、受卡方對(duì)應(yīng)消費(fèi)次數(shù)、月均刷卡次數(shù)、月均消費(fèi)金額、月均取現(xiàn)次數(shù)、月均還款次數(shù)、月均取現(xiàn)額、月均還款額。價(jià)值特征:商戶回傭、透支利息、滯納金收益、存貸款利差、其他收入。賬戶特征:持卡類型、開卡時(shí)間、賬面余額、信用額度、透支額度、信用等級(jí)、逾期等級(jí)、違約等級(jí)。

      二、公務(wù)卡用戶分類變量的選取

      分類變量的選取范圍是上節(jié)中介紹的用戶分類指標(biāo)體系,但具體選取時(shí),主要是根據(jù)公務(wù)卡用戶的分類目標(biāo)來(lái)進(jìn)行。以基于用戶消費(fèi)特征的用戶分類為例,可選擇分類變量表。詳見表1。

      由于人工或技術(shù)的問題,抽取出來(lái)的數(shù)據(jù)不可避免地存在著數(shù)據(jù)缺失、冗余、噪聲以及不一致等問題,這些數(shù)據(jù)直接用于數(shù)據(jù)挖掘,可能導(dǎo)致挖掘過(guò)程十分低效,甚至結(jié)果有誤。因此在進(jìn)行數(shù)據(jù)挖掘前需要先進(jìn)行數(shù)據(jù)預(yù)處理,以提高數(shù)據(jù)挖掘的精度和性能。數(shù)據(jù)預(yù)處理過(guò)程主要有以下幾個(gè)步驟。

      (一)缺失值處理

      對(duì)于缺失問題,一般的處理方法有:忽略記錄,人工填寫缺失值,用屬性的均值填補(bǔ)缺失值,用給定記錄所屬類的樣本增值填補(bǔ)缺失值,用默認(rèn)值填補(bǔ)缺失值,用最大可能性的值填補(bǔ)缺失值。具體可以采用以下方法進(jìn)行處理:首先將缺失值在60%以上的指標(biāo)刪除,對(duì)于離散性指標(biāo)用眾數(shù)對(duì)數(shù)據(jù)項(xiàng)進(jìn)行填充,連續(xù)型指標(biāo)用均值對(duì)缺失項(xiàng)進(jìn)行填充,然后采用標(biāo)準(zhǔn)差檢驗(yàn)法甄別異常數(shù)據(jù),并對(duì)異常數(shù)據(jù)進(jìn)行剔除。

      (二)噪聲消除

      數(shù)據(jù)錄入過(guò)程中,人為的錯(cuò)誤或是設(shè)備的故障等原因都會(huì)導(dǎo)致產(chǎn)生噪聲數(shù)據(jù)。平滑噪聲的方法很多,一般可采用分箱、聚類、回歸或者是計(jì)算機(jī)與人工檢查相結(jié)合等技術(shù)。

      (三)數(shù)據(jù)不一致處理

      來(lái)自數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的數(shù)據(jù)也可能會(huì)存在數(shù)據(jù)結(jié)構(gòu)的不一致、標(biāo)簽的不一致、數(shù)據(jù)值的不一致等問題,需要進(jìn)行糾正,使數(shù)據(jù)一致化,方便進(jìn)行挖掘。

      (四)屬性轉(zhuǎn)換

      當(dāng)指標(biāo)中存在分類數(shù)據(jù)需要進(jìn)行量化,將其轉(zhuǎn)換成數(shù)值形式,方便進(jìn)行統(tǒng)計(jì)和計(jì)算。

      三、基于KII算法的用戶分類

      綜上所述,用KII算法進(jìn)行公務(wù)卡用戶分類的處理過(guò)程見圖5。

      首先進(jìn)行數(shù)據(jù)的導(dǎo)入。數(shù)據(jù)導(dǎo)入主要指從數(shù)據(jù)倉(cāng)庫(kù)中或是原始數(shù)據(jù)庫(kù)中獲得的公務(wù)卡用戶的相關(guān)數(shù)據(jù),然后根據(jù)分類目標(biāo)的需要,選擇能夠反映公務(wù)卡用戶特征的分類變量,并抽取相應(yīng)的數(shù)據(jù),對(duì)它們進(jìn)行數(shù)據(jù)預(yù)處理。將處理后的數(shù)據(jù)進(jìn)行組合,得到一張寬表,該表中的記錄就是聚類算法處理的數(shù)據(jù)對(duì)象。將預(yù)處理后的數(shù)據(jù)集分成兩部分,一部分作為訓(xùn)練集,一部分作為測(cè)試集。將訓(xùn)練集作為參數(shù),運(yùn)用KII算法進(jìn)行聚類分析,并對(duì)聚類的結(jié)果用Huberts 進(jìn)行驗(yàn)證結(jié)果是否滿足預(yù)先設(shè)定的閾值,如果不是,則調(diào)整分類變量,直到Huberts 結(jié)果滿足要求為止。將獲得的聚類中心用于對(duì)測(cè)試集進(jìn)行劃分,并輸出聚類的結(jié)果。本文構(gòu)建了一個(gè)公務(wù)卡用戶的分類模式,詳細(xì)介紹了用戶分類指標(biāo)的提取,數(shù)據(jù)的預(yù)處理,以及如何運(yùn)用KII聚類方法進(jìn)行用戶分類的過(guò)程。

      四、總結(jié)與展望

      本文以國(guó)內(nèi)某家商業(yè)銀行公務(wù)卡業(yè)務(wù)的實(shí)際需求為研究背景,在研究數(shù)據(jù)挖掘發(fā)展相關(guān)理論和技術(shù)的基礎(chǔ)上,提出一種基于數(shù)據(jù)挖掘技術(shù)的公務(wù)卡用戶分類模式。本文在比較了數(shù)據(jù)挖掘中各種聚類算法后,最終決定采用K-means聚類方法作為模型的關(guān)鍵方法。由于K-means算法本身存在諸多缺陷,直接應(yīng)用到模型中,會(huì)降低模型的準(zhǔn)確性和有效性。因此,本文針對(duì)這些不足進(jìn)行了改進(jìn),提出了一種啟發(fā)式初始化的改進(jìn)K-means算法,并將它應(yīng)用到公務(wù)卡用戶分類模式中,實(shí)現(xiàn)對(duì)用戶的價(jià)值及行為特征的分類。本文對(duì)聚類方法中的經(jīng)典K-means算法進(jìn)行了改進(jìn)。針對(duì)K-means算法對(duì)初始聚類中心的依賴性,提出一種具有啟發(fā)式的選取初始化聚類中心的方法,在進(jìn)行K-means前找到合適的初始中心,避免由于初始中心選取不當(dāng)而導(dǎo)致K-means聚類錯(cuò)誤的問題。對(duì)KII算法進(jìn)行了仿真,實(shí)驗(yàn)結(jié)果表明該算法的準(zhǔn)確率、魯棒性等方面較經(jīng)典K-means算法有所提升。提出一種基于KII算法的有關(guān)公務(wù)卡用戶分類的應(yīng)用模式,該模式說(shuō)明了進(jìn)行公務(wù)卡用戶分類時(shí)如何選擇分類變量、如何進(jìn)行數(shù)據(jù)的預(yù)處理以及如何應(yīng)用KII聚類算法的全過(guò)程,為銀行進(jìn)行公務(wù)卡用戶分類提供了方法上的指導(dǎo)。

      參考文獻(xiàn):

      [1]婁洪.著力推進(jìn)公務(wù)卡改革的深化與發(fā)展[J].中國(guó)金融,2009(20).

      [2]陳建寧.預(yù)算單位推行公務(wù)卡結(jié)算制度的探析[J].會(huì)計(jì)之友(上旬刊),2009(9).

      [3]譚明,申鳳云.湖南省公務(wù)卡發(fā)展現(xiàn)狀調(diào)查與對(duì)策建議[J].金融會(huì)計(jì),2009(5).

      [4]周靜莉.關(guān)于預(yù)算單位推行公務(wù)卡結(jié)算的若干思考[J].當(dāng)代經(jīng)濟(jì),2009(8).

      [5]陳建華.南京市公務(wù)卡應(yīng)用情況調(diào)查與建議[J].金融電子化,2008(12).

      [6]李項(xiàng)南.公務(wù)卡在財(cái)政國(guó)庫(kù)管理制度改革中的應(yīng)用[J].中外企業(yè)家,2008(11).

      [7]朱久霞.積極推進(jìn)公務(wù)卡的使用提高預(yù)算資金的使用效率[J].會(huì)計(jì)之友(下旬刊),2008(5).

      [8]顧海英.推廣公務(wù)卡制度引入國(guó)庫(kù)集中支付的探討[J].財(cái)會(huì)研究,2008(5).

      [9]孫興全,苗慧凱,趙興羅.從公務(wù)卡制度看公務(wù)支出的監(jiān)督[J].財(cái)政監(jiān)督,2007(19).

      [10]舒泰峰,徐艷.公務(wù)卡能否卡住腐敗[J].浙江人大,2007(9).

      (作者單位:廣州市殘疾人安養(yǎng)院)

      猜你喜歡
      公務(wù)卡
      試論事業(yè)單位會(huì)計(jì)對(duì)旅差費(fèi)的管理
      公共衛(wèi)生事業(yè)單位公務(wù)卡運(yùn)行情況及對(duì)策分析
      從公務(wù)卡實(shí)施視角淺談如何強(qiáng)化高校財(cái)務(wù)管理
      我國(guó)公務(wù)卡運(yùn)行現(xiàn)狀及發(fā)展研究
      關(guān)于加快推進(jìn)公務(wù)卡改革的探索
      公共衛(wèi)生事業(yè)單位公務(wù)卡運(yùn)行情況及對(duì)策分析
      惠水县| 太保市| 长寿区| 普陀区| 富宁县| 吉首市| 茂名市| 武宁县| 黑河市| 巴青县| 朝阳市| 辽宁省| 泉州市| 贵州省| 浠水县| 且末县| 呈贡县| 抚顺市| 昂仁县| 灵寿县| 襄垣县| 铜川市| 宁晋县| 万荣县| 富锦市| 兴义市| 林周县| 苍山县| 新蔡县| 黎平县| 韩城市| 云浮市| 荆州市| 德兴市| 衡水市| 惠州市| 钦州市| 定日县| 黔南| 买车| 小金县|