郟伯榮 李嘉怡
關(guān)鍵詞:財務(wù)數(shù)據(jù);Python;挖掘技術(shù);分析方法;應(yīng)用策略
1引言
在現(xiàn)代企業(yè)財務(wù)管理工作中,賬務(wù)處理通常不再采用人工方式,而是應(yīng)用計算機軟件結(jié)合信息技術(shù)分析財務(wù)數(shù)據(jù),以保證其精準度。大數(shù)據(jù)技術(shù)的日益普及,以及Python編程軟件得以有效應(yīng)用,使財務(wù)工作效率明顯提升。本文基于Python概念以及當前發(fā)展狀況,分析了Python財務(wù)數(shù)據(jù)所具備的特點,針對財務(wù)數(shù)據(jù)應(yīng)用所存在的問題提出應(yīng)對策略,并基于案例分析Python在大數(shù)據(jù)挖掘技術(shù)中的應(yīng)用。
2Python概念及其發(fā)展狀況
2.1Python概念
Python本身是一種計算機編輯程序語言,與C語言以及JAVA語言相比較,其更加簡單,易普及。Python程序設(shè)計并不需要掌握基礎(chǔ)知識,如果設(shè)計的過程中僅僅對計算機編程感興趣,但缺乏專業(yè)操作能力,可以選用Python。通過分析數(shù)據(jù),建立程序控制結(jié)構(gòu),使用函數(shù)和模塊進行計算,之后用圖形直觀形象地進行表達,有助于提高解決問題能力[1]。
2.2Python發(fā)展狀況
應(yīng)用Python技術(shù)進行大數(shù)據(jù)挖掘以及分析的優(yōu)勢非常明顯,原因在于數(shù)據(jù)分析庫的全面性,內(nèi)部放置的數(shù)據(jù)類型多種多樣,能夠全面而高效地分析數(shù)據(jù)。比如,如果需要處理幾千萬行CVS數(shù)據(jù),合理應(yīng)用Python技術(shù),僅僅10秒鐘就可以完成,同時成本較低。所以,企業(yè)應(yīng)用Python技術(shù)進行財務(wù)數(shù)據(jù)挖掘以及分析,能夠提高企業(yè)運營效率,促進其自身發(fā)展。
3Python在財務(wù)數(shù)據(jù)分析中的特點
Python技術(shù)應(yīng)用簡單、功能強大,將其應(yīng)用于財務(wù)數(shù)據(jù)分析中,其主要有如下特點。
3.1操作簡潔且具有強大的功能
在Python中安裝很多協(xié)議庫,使其具備多功能的網(wǎng)絡(luò)編程工具,在處理金融數(shù)據(jù)時優(yōu)勢明顯,在銀行以及企業(yè)財務(wù)管理中,應(yīng)用Python技術(shù)進行數(shù)據(jù)分析。
3.2兼容性強
Python技術(shù)有很強的兼容性。企業(yè)在財務(wù)管理中應(yīng)用Python技術(shù),以分析財務(wù)數(shù)。應(yīng)用源代碼,使其成為計算機能夠有效識別的字節(jié)符,數(shù)據(jù)信息直觀可視而且極具可讀性。所以,在財務(wù)管理中應(yīng)用Python技術(shù),并結(jié)合使用大數(shù)據(jù)技術(shù),可以優(yōu)勢互補,提高工作效率。
3.3有豐富的面向?qū)ο?/p>
Python語言面向數(shù)字、函數(shù)、字符串以及模塊等對象,其具有派生功能以及繼承功能,并且其源代碼具有很強的重復(fù)使用性。
4存在的問題和應(yīng)對策略
4.1存在的問題
財務(wù)數(shù)據(jù)在具體應(yīng)用過程中還存在一些問題,主要體現(xiàn)為兩個方面,即財務(wù)數(shù)據(jù)應(yīng)用范圍狹窄,財務(wù)數(shù)據(jù)應(yīng)用缺乏創(chuàng)新性。具體如下。
(1)財務(wù)數(shù)據(jù)應(yīng)用范圍狹窄。
財務(wù)管理過程中所產(chǎn)生的數(shù)據(jù)信息對企業(yè)戰(zhàn)略管理具有重要的指導(dǎo)作用。若企業(yè)沒有對影響企業(yè)管理的各方面因素進行充分考慮,則財務(wù)信息不能完全反映市場信息。在分析內(nèi)部數(shù)據(jù)的過程中,若沒有對市場數(shù)據(jù)進行合理利用,則會嚴重影響自身的競爭力,進而使財務(wù)數(shù)據(jù)應(yīng)用范圍無法拓展,不能獲得理想效果。
(2)財務(wù)數(shù)據(jù)應(yīng)用缺乏創(chuàng)新性。
財務(wù)數(shù)據(jù)具有很強的系統(tǒng)性,企業(yè)對于財務(wù)數(shù)據(jù)要進行合理利用,才能發(fā)揮其指導(dǎo)作用,進而制定前瞻性的策略[2]。多數(shù)企業(yè)缺乏財務(wù)創(chuàng)新能力,即使對這方面工作有充分認識,明確其重要性,但是落實到具體工作中,通常只是借鑒成功企業(yè)的經(jīng)驗,卻沒有從本單位實際出發(fā)進行調(diào)整,缺乏適應(yīng)效果。
企業(yè)在實施財務(wù)管理中能夠動態(tài)化地監(jiān)督工作,獲得更多有價值的數(shù)據(jù)信息,但是在應(yīng)用的過程中,依然采用傳統(tǒng)方式,基于此制定的營銷計劃缺乏針對性,因此造成企業(yè)管理存在各種風險。
4.2應(yīng)對策略
在解決財務(wù)數(shù)據(jù)應(yīng)用問題的過程中,對財務(wù)數(shù)據(jù)挖掘技術(shù)要進行靈活應(yīng)用以及不斷創(chuàng)新,以擴大財務(wù)數(shù)據(jù)信息采集范圍,具體如下。
(1)靈活應(yīng)用財務(wù)數(shù)據(jù)挖掘技術(shù)。
為了擴大財務(wù)數(shù)據(jù)應(yīng)用范圍,將Python程序語言進行合理應(yīng)用,凸顯挖掘技術(shù)的優(yōu)勢。在財務(wù)信息采集過程中,通過發(fā)揮開源語言自身的特點,使應(yīng)用程序編程工具更加豐富,接口能夠滿足多種需求。此時,Python作為擴展工具,在多種計算機語言中進行應(yīng)用,諸如C語言以及C++語言等。因此,可以充分發(fā)揮Python的語言優(yōu)勢,使其成為大數(shù)據(jù)挖掘中的重要工具。
(2)不斷創(chuàng)新財務(wù)數(shù)據(jù)挖掘技術(shù)。
在財務(wù)數(shù)據(jù)挖掘工作中合理應(yīng)用Python編程語言,操作人員要具備創(chuàng)新意識,從實際情況出發(fā)合理選擇相應(yīng)的命令,以實現(xiàn)應(yīng)有的功能。比如,在分析HTML頁面以及提取重要信息時,操作人員需要引進HTML解析器,即Beautiful Soup庫,對Python標準庫起到重要的支持作用。在提交HTM頁面方面,操作人員通過運行requests庫,以自動提交網(wǎng)絡(luò)請求的方式實現(xiàn)其應(yīng)用功能。
(3)擴大財務(wù)數(shù)據(jù)采集范圍。
財務(wù)數(shù)據(jù)信息的采集不能局限于小范圍,應(yīng)不斷擴大范圍,應(yīng)用scraper架構(gòu),發(fā)揮其應(yīng)有的功能。在此過程中,需要充分考慮企業(yè)的財務(wù)實際情況,應(yīng)用大數(shù)據(jù)挖掘技術(shù)深度挖掘產(chǎn)品銷售額信息、產(chǎn)品價格信息以及支出額信息等,以更好地分析后續(xù)數(shù)據(jù)[3]。應(yīng)有效收集各項財務(wù)數(shù)據(jù)信息,嚴格按照規(guī)定流程進行,先進入企業(yè)官方網(wǎng)站查看根目錄,分析robots. txt文件信息,然后制定數(shù)據(jù)搜索方法,以有效獲得HTML頁面信息,將這些信息中有價值的部分進行保存,保證數(shù)據(jù)分析質(zhì)量。
5Python在大數(shù)據(jù)挖掘和分析中的應(yīng)用
在某企業(yè)財務(wù)管理中,應(yīng)用Python計算預(yù)算營業(yè)收入。該企業(yè)財務(wù)管理人員按照8位元的編碼規(guī)則進行Python編程,采用輸出中文utf-8形式。先對帶參數(shù)頁面爬取函數(shù)進行定義,再運行requests庫的get()爬取所需要的頁面內(nèi)容函數(shù),然后用打印機將結(jié)果打印機出來。
5.1數(shù)據(jù)挖掘能力
在該項操作過程中,當用戶查詢財務(wù)數(shù)據(jù)信息時,可以應(yīng)用網(wǎng)絡(luò)爬蟲技術(shù)提取所需信息,然后深層次挖掘有價值的數(shù)據(jù)信息。Python程序編輯比較簡單,對用戶計算機操作水平要求不高[4]。
在應(yīng)用Python技術(shù)的過程中,還可以清洗數(shù)據(jù),深入探索數(shù)據(jù)信息,建立寬表,篩選變量,建立模型,對模型參數(shù)進行優(yōu)化,并輸出模型,整個操作都得到算法包的支持。Python經(jīng)過不斷迭代,在保證算法實用性的同時,使用戶可以免費獲得服務(wù)。
與MYSQL數(shù)據(jù)庫相比較,在企業(yè)財務(wù)管理中應(yīng)用Python,能夠更加快速地處理數(shù)據(jù)信息。挖掘財務(wù)數(shù)據(jù)信息日寸,應(yīng)用傳統(tǒng)計算機軟件,需要幾千特征值,甚至上萬特征值,而應(yīng)用Python則速度大大加快,無論是代碼量還是計算速度,都使寬表制作效率大大提高,SQL數(shù)據(jù)庫幾乎不能完成的工作,使用Python能夠快速完成[5]。
5.2數(shù)據(jù)庫分析
該企業(yè)在財務(wù)管理中應(yīng)用Python,因其可以提供第三方庫,能夠滿足工作需求。其優(yōu)點在于,開箱即用,操作方便,而且不存在交費問題[6]。管理人員學習Python日寸不需要消耗大量時間,邊操作、邊學習,就可應(yīng)用該程序分析數(shù)據(jù),挖掘所需要的數(shù)據(jù)信息。通常而言,普遍采用的數(shù)據(jù)分析庫為如下兩個。
(1) NumPy。在Python中,NumPy為用于計算的基礎(chǔ)包。其在計算的過程中,可以應(yīng)用數(shù)學方法進行計算,也可以對函數(shù)進行元素級計算,讀寫硬盤上的數(shù)據(jù)集,還可以實施線性代數(shù)運算或者生成隨機數(shù)。
(2) Pandas。Pandas的重要價值在于分析數(shù)據(jù)信息,Pandas庫能夠?qū)⒑芏嗪瘮?shù)快速提取出來,如果是構(gòu)化數(shù)據(jù),且規(guī)模比較大,也能夠有效提取o Python在使用Pandas之后,數(shù)據(jù)分析能力明顯增強。該企業(yè)在應(yīng)用Python實施財務(wù)管理的過程中,發(fā)揮pandas的作用,能夠自由且靈活地處理數(shù)據(jù)[7]。
5.3程序包與平臺
企業(yè)財務(wù)部門在管理工作中應(yīng)用Python,使用了四個程序包,具體如下。
(1)應(yīng)用NumPy,就是運行Python程序進行計算,其作為基礎(chǔ)包,其中的N維數(shù)組對象非常強大,為Array,運行的函數(shù)庫較成熟,數(shù)據(jù)存儲中會有大型矩陣產(chǎn)生。
(2)應(yīng)用pandas,就是將庫函數(shù)導(dǎo)人之后,能夠讀取從CSMAR中摘錄的CSV數(shù)據(jù),從而更好地開展數(shù)據(jù)分析工作[8]。在此過程中,pandas數(shù)據(jù)包發(fā)揮了重要的作用,能夠從csv文件中讀取data。
需要明確的是,在Python中,Pandas作為數(shù)據(jù)分析包,能夠配合使用NumPy。其數(shù)據(jù)模型比較多,使用Python分析數(shù)據(jù)非常方便。
(3)應(yīng)用Matplotlib,數(shù)據(jù)信息處理后結(jié)合條形圖或者直方圖,在測試數(shù)據(jù)觀察過程中分析圖像,使數(shù)據(jù)更加直觀。簡單而言,就是應(yīng)用Matplotlib促使數(shù)據(jù)直觀立體地呈現(xiàn),以及分析結(jié)果更加清晰[9]。
(4)應(yīng)用Scikit-learn,就是應(yīng)用Python進行編寫,可以結(jié)合NumPy,并使用高性能的線性代數(shù)、運算數(shù)組。
在財務(wù)管理中應(yīng)用Python,需建立管理平臺。在平臺上構(gòu)建多元回歸模型,測試數(shù)據(jù)并回歸分析,保證計算結(jié)果的準確性,由此明確變量影響營業(yè)收入,后續(xù)階段可進行針對性的優(yōu)化[10]。
得出預(yù)測結(jié)果后,財務(wù)人員對Matplotlib進行合理利用,使數(shù)據(jù)具有可視性,應(yīng)用數(shù)據(jù)包可以預(yù)測數(shù)據(jù)差異,財務(wù)人員可以對其進行對比性分析并深入研究,將模型誤差值準確計算出來。
6結(jié)束語
在企業(yè)財務(wù)管理中應(yīng)用信息技術(shù),能夠?qū)⒂袃r值的數(shù)據(jù)信息挖掘出來,以提高財務(wù)分析質(zhì)量,為企業(yè)管理決策提供有價值的參考。在應(yīng)用財務(wù)大數(shù)據(jù)技術(shù)的同時結(jié)合使用Python,以高質(zhì)量、高效率完成財務(wù)管理任務(wù),通過制定科學有效且切合實際的方案,使企業(yè)獲得顯著的管理效益,進而提高經(jīng)濟效益,實現(xiàn)健康穩(wěn)定發(fā)展。