李 帥
隨著經(jīng)濟發(fā)展對會計信息化的新的需求,如何通過科學、有效的手段,對行業(yè)會計報表數(shù)據(jù)進行高效的收集與利用,以此來掌握企業(yè)的經(jīng)營和管理現(xiàn)狀,發(fā)現(xiàn)企業(yè)經(jīng)營管理中存在的問題,預(yù)測企業(yè)未來的發(fā)展前景,已受到了社會各界的普遍關(guān)注。有關(guān)行業(yè)會計報表的信息化問題,采用何種技術(shù),利用何種方法,能夠?qū)@些報表數(shù)據(jù)進行收集并對歷史數(shù)據(jù)進行集成,以便進一步進會計報表數(shù)據(jù)進行分析利用。
將會計報表數(shù)據(jù)構(gòu)建入數(shù)據(jù)倉庫,不僅可以將行業(yè)會計報表數(shù)據(jù)統(tǒng)一管理起來,還可以在此基礎(chǔ)上進一步對報表數(shù)據(jù)進行OLAP(聯(lián)機分析處理,On-line AnalyticalProcessing)和DM(數(shù)據(jù)挖掘,Data Mining),從多角度、多側(cè)面觀察和分析數(shù)據(jù)。本文就構(gòu)建行業(yè)會計報表數(shù)據(jù)倉庫模型進行探討。
鑒于行業(yè)組織構(gòu)架和數(shù)據(jù)倉庫應(yīng)用的復雜性,本研究采用雪花型模型來設(shè)計數(shù)據(jù)倉庫模型,相對于星型模型,可以更準確地反映出各實體之間的邏輯關(guān)系,并依據(jù)實體的重要程度,將這種關(guān)系詳細地表示出來。由于目前數(shù)據(jù)倉庫一般都建立在關(guān)系數(shù)據(jù)庫基礎(chǔ)上,因此,本模型設(shè)計過程中所采用的邏輯模型主要是關(guān)系模型。利用關(guān)系模型不但可以創(chuàng)建指標實體的關(guān)系模型,還可以創(chuàng)建概念模型中的維度實體關(guān)系模型。
雪花型模型是一種多維的數(shù)據(jù)關(guān)系,它由一個事實表(Fact Table)和一組維表(Dimension Table)組成。每個維表都有一個維作為主鍵,所有這些維則組合成事實表的主鍵,換言之,事實表主鍵的每個元素都是維表的外鍵。事實表的非主鍵屬性稱為事實(Fact),它們一般都是數(shù)值或其他可以進行計算的數(shù)據(jù);而維大都是文字、時間等類型的數(shù)據(jù)。雪花型邏輯模型設(shè)計如圖1所示。
事實表是雪花型模型結(jié)構(gòu)的核心。事實表中一般要包含兩個部分:一部分是有主鍵和外鍵組成的鍵部分,另一部分是用戶希望在數(shù)據(jù)倉庫中所了解的數(shù)值指標。事實表是數(shù)據(jù)倉庫中的最大表,因為它包含了大量的基本業(yè)務(wù)詳細信息。在設(shè)計時要注意使事實表盡可能地小,因為過于龐大的事實表在表的處理、備份和恢復、用戶的查詢等方面需要較長的時間。在實際設(shè)計時,可以利用減少列的數(shù)量、降低每一列的大小、把歷史數(shù)據(jù)歸檔到單獨的事實表中等多種方法來降低事實表的大小。
圖1 行業(yè)會計報表雪花型邏輯模型
本文所設(shè)計的集團企業(yè)會計報表數(shù)據(jù)倉庫邏輯模型,如圖1所示,涉及多級主題,而每級主題成員又具有多個,所以在雪花型模型設(shè)計中,采用多事實表設(shè)計,如資產(chǎn)負債表事實表、損益表事實表、現(xiàn)金流量表事實表、股東權(quán)益表事實表和財務(wù)分析指標事實表等,而每個事實表采用統(tǒng)一的內(nèi)部行業(yè)編碼相關(guān)聯(lián),組成一個整體,這樣的設(shè)計,更清晰,更便于對行業(yè)會計報表數(shù)據(jù)倉庫的后續(xù)研究與應(yīng)用。而每個事實表中,主鍵為時間維時間關(guān)鍵字、企業(yè)維企業(yè)關(guān)鍵字、指標維指標關(guān)鍵字。
行業(yè)會計報表數(shù)據(jù)倉庫的邏輯模型設(shè)計中,確定了事實表模型后,還需要確定其維表模型。維度表是會影響到?jīng)Q策的因子。如不同企業(yè)、時間、指標類別都是影響決策的大因子,通過這些因子決策者可以按照不同企業(yè)不同時間不同指標類別進行決策評價。
(1)時間維
時間維模型是許多數(shù)據(jù)倉庫應(yīng)用中的常用維度,其設(shè)計方式與其他多數(shù)維表模型有差別,企業(yè)集團會計報表的時間因素相對于其他應(yīng)用的數(shù)據(jù)倉庫較為特殊,非上市公司的會計報表一般編制月報、季報和年報,上市公司必須提供半年報和年報。具體設(shè)計時,日期維可以存放以日期表示的5-10年的數(shù)據(jù)行,也可以將3-4年的數(shù)據(jù)行作為時間維的內(nèi)容,時間維設(shè)計字屬性列為:日期年度、半年度、季度、月等。
(2)企業(yè)維
企業(yè)是行業(yè)或集團企業(yè)的基本元素,也是企業(yè)集團會計報表應(yīng)用的基本匯總單位和比較單位。企業(yè)維中應(yīng)包括企業(yè)名稱、所屬行業(yè)、所在地、電話、法定代表人、企業(yè)性質(zhì)等。
行業(yè)維是對行業(yè)企業(yè)性質(zhì)的進一步說明,應(yīng)包括行業(yè)編號和行業(yè)名稱等。
(3)指標維
指標維是對指標事實表中指標數(shù)據(jù)的詳細說明,在事實表設(shè)計時,共設(shè)計了五個事實表:資產(chǎn)負債表事實表、損益表事實表、現(xiàn)金流量表事實表、股東權(quán)益變動表事實表和財務(wù)分析指標事實表等,對這些事實表的指標維度表設(shè)計,做統(tǒng)一設(shè)計,包括指標名稱、指標類型、指標描述、指標類別等。
粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別。細化程度越高,綜合程度越低,粒度級就越??;相反,細化程度越低,綜合程度越高。粒度劃分的適當與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和信息查詢以及更進一步進行OLAP和數(shù)據(jù)挖掘的效果。通過粒度的劃分,決定了數(shù)據(jù)倉庫是采用單一粒度還是多重粒度,以及粒度的劃分層次。如果主題的數(shù)據(jù)量、信息量較多,對主題數(shù)據(jù)分析細化程度要求較高,就要采用多重粒度進行數(shù)據(jù)劃分,否則采用單一粒度進行劃分。
在會計報表數(shù)據(jù)倉庫設(shè)計中,由于企業(yè)集團會計報表系統(tǒng)主題的復雜性,根據(jù)用戶對數(shù)據(jù)倉庫應(yīng)用的需求,我們采用多重粒度劃分的策略,用低粒度(細化到月)數(shù)據(jù)保存近期的會計報表及財務(wù)分析指標數(shù)據(jù),對時間較遠的會計報表及財務(wù)分析指標數(shù)據(jù)只保存粒度較大(細化到年)數(shù)據(jù)。這樣既可以對財務(wù)近況進行細節(jié)分析,又可以利用粒度較大的數(shù)據(jù)對財務(wù)趨勢進行分析。
1.本模型適用于集團企業(yè)或行業(yè)主管部門,適合集團財務(wù)智能化決策的綜合應(yīng)用。
2.本模型采用雪花型模型,傳統(tǒng)的星型設(shè)計更能適合集團企業(yè)組織架構(gòu)和會計報表元素應(yīng)用的復雜性。
3.本模型采用多事實表設(shè)計,事實表之間采用統(tǒng)一的內(nèi)部企業(yè)編碼相關(guān)聯(lián),組成一個整體,這樣的設(shè)計,更清晰,將會計報表和財務(wù)分析指標同時納入數(shù)據(jù)倉庫,不但可以在數(shù)據(jù)倉庫中對傳統(tǒng)的財務(wù)分析方法進行研究,還可以直接通過數(shù)據(jù)挖掘直接研究會計報表各元素,從而為對傳統(tǒng)的財務(wù)分析方法進行突破打下基礎(chǔ),更便于對行業(yè)會計報表數(shù)據(jù)倉庫的后續(xù)研究與應(yīng)用。