近年來(lái),各式各樣的數(shù)據(jù)庫(kù)隨著信息時(shí)代的發(fā)展得以建立,海量的數(shù)據(jù)信息也爆炸式的充斥到了人們的生產(chǎn)生活之中。這些數(shù)據(jù)信息中隱藏著了大量有用的知識(shí),但傳統(tǒng)的人工閱讀或數(shù)據(jù)檢索方式不能有效將這些知識(shí)從不同層次的信息中提取出來(lái),造成了嚴(yán)重的數(shù)據(jù)信息資源浪費(fèi)。再?gòu)慕鹑谛袠I(yè)的角度來(lái)看,其使有關(guān)單位坐失良機(jī)的同時(shí)大大降低經(jīng)濟(jì)效益。為減少損失,我國(guó)金融領(lǐng)域研究人員將數(shù)據(jù)挖掘應(yīng)用到了信息處理之中并取得了很好的成效。利用數(shù)據(jù)挖掘中的數(shù)理統(tǒng)計(jì)、回歸分析以及分類聚類等方法可以快速對(duì)數(shù)據(jù)信息進(jìn)行分析,將海量的金融數(shù)據(jù)自動(dòng)、智能的轉(zhuǎn)化為有用的金融知識(shí),為金融行業(yè)未來(lái)發(fā)展決策的制定提供了大量的信息參考,使金融行業(yè)有關(guān)單位的未來(lái)發(fā)展戰(zhàn)略更具有效性、科學(xué)性。根據(jù)國(guó)內(nèi)外發(fā)展形勢(shì)來(lái)看,當(dāng)前數(shù)據(jù)挖掘在國(guó)外金融領(lǐng)域應(yīng)用較多但在國(guó)內(nèi)卻還處于起步階段。因此,現(xiàn)階段最重要的任務(wù)就是充分利用好數(shù)據(jù)挖掘進(jìn)行金融數(shù)據(jù)分析以促使我國(guó)經(jīng)濟(jì)穩(wěn)步發(fā)展。
數(shù)據(jù)挖掘DM(Data Mining)實(shí)質(zhì)上就是對(duì)數(shù)據(jù)庫(kù)內(nèi)的數(shù)據(jù)信息進(jìn)行處理的過(guò)程。這樣做的目的是從大量不完整的、模糊的、混亂的和隨機(jī)的數(shù)據(jù)中提取不為人知但可能有用的潛在信息和知識(shí)。具體來(lái)說(shuō),數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)KDD(Knowledge-Discovery in Databases)中的一個(gè)重要步驟,其以人工智能技術(shù)、機(jī)器學(xué)習(xí)技術(shù)以及統(tǒng)計(jì)學(xué)相關(guān)技術(shù)為手段對(duì)原有海量數(shù)據(jù)進(jìn)行高度自動(dòng)化的分析、歸納與推理,從中挖掘出潛在的信息并預(yù)測(cè)未知的行為,改變“人們?cè)跀?shù)據(jù)中淹沒(méi)卻又極度渴望知識(shí)”的數(shù)據(jù)信息資源浪費(fèi)不利局面。數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)是由機(jī)器學(xué)習(xí)技術(shù)與數(shù)據(jù)庫(kù)技術(shù)相互交融促進(jìn)而產(chǎn)生的學(xué)科,因?yàn)橹R(shí)發(fā)現(xiàn)過(guò)程使用的數(shù)據(jù)來(lái)自真實(shí)的數(shù)據(jù)庫(kù)且需要處理的數(shù)據(jù)量可能相當(dāng)大,所以數(shù)據(jù)挖掘的效率和可擴(kuò)展性對(duì)其處理過(guò)程尤其重要。
數(shù)據(jù)挖掘是當(dāng)前信息時(shí)代分析處理金融數(shù)據(jù)的有力手段。其既是一種對(duì)金融信息數(shù)據(jù)庫(kù)內(nèi)大量、復(fù)雜、模糊、隨機(jī)的信息和知識(shí)的處理過(guò)程,又是一種為發(fā)展決策提供數(shù)據(jù)依據(jù)的過(guò)程。當(dāng)前常用的金融信息數(shù)據(jù)挖掘辦法較多且主要包括分類法、聚類法、回歸分析法、關(guān)聯(lián)規(guī)則法以及神經(jīng)網(wǎng)絡(luò)法等,這幾種數(shù)據(jù)挖掘辦法從不同角度對(duì)金融信息進(jìn)行了深入、全面地分析。
分類法指的就是利用分類模型,對(duì)金融信息數(shù)據(jù)庫(kù)中一組具有相同特點(diǎn)的數(shù)據(jù)對(duì)象劃分成為不同類型,其目的就是為了將數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射道不同的數(shù)據(jù)類別之中。其可以在消費(fèi)者分類、消費(fèi)者滿意度分析以及消費(fèi)者消費(fèi)傾向預(yù)測(cè)中得以運(yùn)用。例如某汽車銷售廠商可以根據(jù)消費(fèi)者對(duì)汽車的喜歡程度進(jìn)行人員分類,這樣銷售人員就可以根據(jù)不同情況有針對(duì)性地向那些喜愛(ài)汽車的消費(fèi)者進(jìn)行營(yíng)銷宣傳,在滿足消費(fèi)者不同需求的同時(shí)提高廠商經(jīng)濟(jì)效益。
聚類法與分類法類似但也存在不同,聚類法指的是把一組金融數(shù)據(jù)按照相同特點(diǎn)和差異特點(diǎn)分成不同的幾個(gè)類別,其目的是使不同類別間的數(shù)據(jù)信息值盡可能的有差異、同一類別間的數(shù)據(jù)信息值盡可能的一致,
回歸分析能夠反映金融信息數(shù)據(jù)庫(kù)的數(shù)據(jù)屬性,通過(guò)數(shù)據(jù)映射關(guān)系的函數(shù)表達(dá)式檢測(cè)屬性值之間的依賴關(guān)系,其主要研究方向?yàn)閿?shù)據(jù)間關(guān)系和數(shù)據(jù)序列的預(yù)測(cè)。其在當(dāng)前的市場(chǎng)營(yíng)銷中具有極強(qiáng)的現(xiàn)實(shí)應(yīng)用意義。例如相關(guān)企業(yè)可以利用回歸分析方法對(duì)本季度的生產(chǎn)銷售情況進(jìn)行預(yù)算,并以此為依據(jù)對(duì)下一季度的經(jīng)濟(jì)形勢(shì)和營(yíng)銷手段做出預(yù)測(cè)和安排。通過(guò)對(duì)金融信息數(shù)據(jù)庫(kù)進(jìn)行回歸分析可以明確不同消費(fèi)者的行為模式和行為規(guī)律,按照這些不同將消費(fèi)者劃分為不同群體以實(shí)現(xiàn)差別化服務(wù)。
關(guān)聯(lián)規(guī)則法指的就是根據(jù)數(shù)據(jù)項(xiàng)之間的聯(lián)系由一個(gè)數(shù)據(jù)項(xiàng)推出另一個(gè)或者多個(gè)數(shù)據(jù)項(xiàng)的辦法。運(yùn)用關(guān)聯(lián)規(guī)則法開(kāi)展金融數(shù)據(jù)挖掘可分為兩個(gè)階段,第一階段是在海量的金融數(shù)據(jù)信息中心挖掘出全部高頻項(xiàng)目組,第二階段是根據(jù)高頻項(xiàng)目組自身具備的關(guān)聯(lián)性推出其他項(xiàng)目類別。關(guān)聯(lián)規(guī)則法當(dāng)前已經(jīng)被廣泛應(yīng)用于消費(fèi)者消費(fèi)需求的預(yù)測(cè)之中。例如,銀行根據(jù)消費(fèi)者消費(fèi)情況在自動(dòng)存取款機(jī)上捆綁其可能感興趣的信息來(lái)供其參考,這在大大提高消費(fèi)者滿意度的同時(shí)改善了銀行的營(yíng)銷管理水平。
神經(jīng)網(wǎng)絡(luò)方法是一種集自動(dòng)處理、分塊儲(chǔ)存、高容錯(cuò)度等優(yōu)勢(shì)為一身的先進(jìn)人工智能技術(shù)。因神經(jīng)網(wǎng)絡(luò)法能夠高效處理那些模糊度高、內(nèi)容不完整、層次不分明的數(shù)據(jù)信息,其當(dāng)前已經(jīng)被廣泛應(yīng)用于金融信息數(shù)據(jù)庫(kù)的處理工作之中。神經(jīng)網(wǎng)絡(luò)法主要分為三類,第一類是以函數(shù)型網(wǎng)絡(luò)為代表用于數(shù)據(jù)分類預(yù)測(cè)的前饋式神經(jīng)網(wǎng)絡(luò)模型,第二種是以離散型和連續(xù)型網(wǎng)絡(luò)為代表用于優(yōu)化算法的反饋式神經(jīng)網(wǎng)絡(luò)模型,第三種是以ART 模型為代表的聚類組織映射方法。雖然神經(jīng)網(wǎng)絡(luò)方法具有多種算法模型,但因沒(méi)有統(tǒng)一的使用規(guī)則使其在金融數(shù)據(jù)分析中的應(yīng)用不是很普遍。
在大量的數(shù)據(jù)中搜集、尋找、發(fā)現(xiàn)有效信息是金融行業(yè)開(kāi)展工作內(nèi)在需要。利用好數(shù)據(jù)挖掘可以使信息開(kāi)發(fā)工作更為便捷,幫助金融部門科學(xué)預(yù)測(cè)未來(lái)發(fā)展趨勢(shì)的同時(shí)使發(fā)展決策的制定更加有理有據(jù)。
銀行是需要利用數(shù)據(jù)挖掘深入分析數(shù)據(jù)信息的金融機(jī)構(gòu)。銀行的借貸業(yè)務(wù)范圍很廣,有必要提前對(duì)貸款償還進(jìn)行預(yù)測(cè)以確保貸款能夠按時(shí)收回。對(duì)根據(jù)客戶信息開(kāi)展貸款償還預(yù)測(cè)還可以更好地鑒別客戶信用數(shù)據(jù),減少銀行貸款損失的同時(shí)實(shí)現(xiàn)經(jīng)濟(jì)效益最大化。借貸業(yè)務(wù)和信用卡交易對(duì)銀行來(lái)說(shuō)都是必不可少的,但是貸款的償還和客戶信用等級(jí)評(píng)價(jià)會(huì)受到許多因素的影響,其中包括貸款利率、貸款期限、借貸人收入水平、借貸人受教育程度、借貸人償還水平等。而金融數(shù)據(jù)挖掘的應(yīng)用可以將其中的無(wú)關(guān)因素很好的剔除出去。利用數(shù)據(jù)挖掘?qū)ι鲜鲆蛩剡M(jìn)行分析可以發(fā)現(xiàn)借貸人受教育水平和貸款期限與償還速度之間的聯(lián)系不是很大,而償還收入水平和借貸人收入水平是較為重要的因素,這時(shí)銀行就可以根據(jù)借貸人的收入、償還水平來(lái)制定相關(guān)貸款策略并開(kāi)展借貸工作。
我國(guó)金融領(lǐng)域的犯罪率較高且案件通常難以偵破,當(dāng)前只能將多個(gè)數(shù)據(jù)庫(kù)中信息提取并匯總才能很好地偵破金融犯罪案件。利用數(shù)據(jù)挖掘技術(shù)檢測(cè)金融數(shù)據(jù)信息庫(kù)中的信息以明確短時(shí)間內(nèi)發(fā)生的大量資金交易行為,過(guò)濾掉其中無(wú)關(guān)因素后運(yùn)用可視化分析方法對(duì)交易行為以及相關(guān)聯(lián)系人進(jìn)行有效分析,進(jìn)而為偵查人員提供偵查思路、明確偵查方向。此外,利用數(shù)據(jù)挖掘還可以對(duì)金融犯罪行為進(jìn)行事先預(yù)判,有效制止金融犯罪的同時(shí)減少了國(guó)家財(cái)產(chǎn)的損失。例如,某企業(yè)在短時(shí)間內(nèi)向不明海外賬戶進(jìn)行多次匯款,這時(shí)我們就可以利用數(shù)據(jù)挖掘深入分析其這一行為是否正當(dāng)合理,通過(guò)進(jìn)一步的調(diào)查明確這一行為是否屬于金融犯罪,若屬于應(yīng)及時(shí)將有關(guān)數(shù)據(jù)調(diào)查結(jié)果送至監(jiān)察機(jī)關(guān)予以處理。
利用數(shù)據(jù)挖掘?qū)蛻粜畔⑦M(jìn)行分類可以幫助銀行更好地開(kāi)展業(yè)務(wù)工作、推動(dòng)客戶進(jìn)行定向消費(fèi)、提高銀行的經(jīng)濟(jì)效益。在實(shí)際工作過(guò)程中,銀行可以篩選出那些收入水平較高、資產(chǎn)狀況穩(wěn)定且有投資意向的客戶,并根據(jù)這些客戶的喜好與不同需求有針對(duì)性地開(kāi)展定向業(yè)務(wù)活動(dòng),這樣在提高銀行業(yè)務(wù)水平的同時(shí)滿足了客戶的現(xiàn)實(shí)需求,真正實(shí)現(xiàn)銀行與客戶之間的互利共贏。但上述工作有效開(kāi)展的基礎(chǔ)在于科學(xué)地利用金融數(shù)據(jù)挖掘技術(shù)。沒(méi)有數(shù)據(jù)挖掘就無(wú)法準(zhǔn)確地開(kāi)展定向服務(wù)活動(dòng)。例如對(duì)200 個(gè)客戶開(kāi)展相關(guān)項(xiàng)目投資的定向活動(dòng),這時(shí)如果不能將金融信息數(shù)據(jù)挖掘應(yīng)用其中,銀行就只能進(jìn)行電話溝通一一了解這200 個(gè)客戶的具體想法,浪費(fèi)大量時(shí)間和精力的同時(shí)極大程度的降低了銀行的整體工作效率。而利用金融信息數(shù)據(jù)挖掘辦法可以對(duì)這200 個(gè)客戶進(jìn)行準(zhǔn)確分類,明確其中有投資意向的客戶并針對(duì)其喜好開(kāi)展定向業(yè)務(wù)介紹,使得客戶對(duì)相關(guān)業(yè)務(wù)活動(dòng)有具體了解的同時(shí)大幅度地提高了銀行的工作效率。
綜上所述,數(shù)據(jù)挖掘已廣泛應(yīng)用于我國(guó)金融行業(yè)信息數(shù)據(jù)處理的工作之中,其在幫助金融部門在白熱化的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)先機(jī)同時(shí)顯現(xiàn)出了巨大的應(yīng)用價(jià)值。當(dāng)前世界正經(jīng)歷著百年未有之大變局,全球經(jīng)濟(jì)一體化給我國(guó)金融業(yè)帶來(lái)巨大挑戰(zhàn)的同時(shí)也帶來(lái)了更多的發(fā)展機(jī)遇。因此我們要科學(xué)分析金融形勢(shì)、把握經(jīng)濟(jì)發(fā)展大勢(shì),持續(xù)深化數(shù)據(jù)挖掘和金融數(shù)據(jù)分析的融合,更好地發(fā)揮出金融數(shù)據(jù)分析方法的重要作用。同時(shí)還要加快金融行業(yè)體系結(jié)構(gòu)轉(zhuǎn)型升級(jí),構(gòu)建良好的金融發(fā)展新格局,以更高的治理能力和管理水平推動(dòng)我國(guó)金融領(lǐng)域邁上新的臺(tái)階。