魏樂
(赤峰學院 經濟與管理學院,內蒙古 赤峰 024000)
基于數據挖掘的首批創(chuàng)業(yè)板上市公司財務分析
魏樂
(赤峰學院 經濟與管理學院,內蒙古 赤峰 024000)
本文利用數據挖掘技術中的聚類分析方法,對創(chuàng)業(yè)板首批上市的28家公司進行財務分析,將其分類,為投資者提供有價值的決策依據.
數據挖掘;聚類分析;創(chuàng)業(yè)板上市公司;財務分析
2009年10月23日創(chuàng)業(yè)板開板儀式后,首批28家創(chuàng)業(yè)板公司已于10月30日集中在深交所掛牌上市.這意味著備受市場關注的創(chuàng)業(yè)板市場正式開市交易.所以,此時研究創(chuàng)業(yè)板公司的財務狀況具有十分重要的現實意義.
創(chuàng)業(yè)板又稱二板市場,是指主板之外的專為暫時無法上市的中小企業(yè)和新興公司提供融資途徑和成長空間的證券交易市場,是對主板市場的有效補充,在資本市場中占據著重要的位置.創(chuàng)業(yè)板市場的的主要目的是扶持中小企業(yè),尤其是高成長性企業(yè),為風險投資和創(chuàng)投企業(yè)建立正常的退出機制,為自主創(chuàng)新國家戰(zhàn)略提供融資平臺,為多層次的資本市場體系建設添磚加瓦.因此,在創(chuàng)業(yè)板市場上市的公司大多從事高科技業(yè)務,具有較高的成長性,經營機制更為靈活,經營模式和盈利模式多元化特征更為突出.同時,此類公司往往成立時間較短,股本規(guī)模小,經營不確定性大,抵御外部風險能力較弱,公司治理基礎相對薄弱.故對投資者來說,投資創(chuàng)業(yè)板市場的風險要比主板市場高得多,得到更大收益的可能性也較高.
創(chuàng)業(yè)板上市公司的發(fā)展受到內外部諸多因素的影響,致使得其財務分析工作面臨很多新的課題和挑戰(zhàn).所以,對創(chuàng)業(yè)板企業(yè)的財務分析要特別注意與傳統(tǒng)企業(yè)財務分析在以下幾個方面的區(qū)別:[1](1)財務分析指標體系需要準確、全面把握創(chuàng)新型企業(yè)高投入、高風險、高收益的特點;(2)創(chuàng)業(yè)板企業(yè)的技術、市場環(huán)境可以說是千差萬別和瞬息萬變,而傳統(tǒng)的綜合評價的方法如模糊綜合評判法、人工神經網絡、灰色系統(tǒng)評價法以及數據包絡分析法(D E A)等.由于存在較大的缺陷,如指標變量之間的相關性復雜、指標層次較多等,故造成評價成本過高以及適用性差.[2](3)高科技企業(yè)的發(fā)展歷史相對較短,往往缺乏歷史數據,并且技術千差萬別,很難找到行業(yè)、技術、規(guī)模等相近的可比企業(yè),使得對業(yè)績的預測和推斷相對困難,對于本文研究對象——創(chuàng)業(yè)板首批上市的28家公司更是如此,上市時間較短,公開數據較少.(4)高科技企業(yè)的非線性發(fā)展規(guī)律,意味著很難根據企業(yè)現在的盈利來計算盈利增長率,如果僅僅使用傳統(tǒng)的市盈率估值方法顯然是遠遠不夠的.基于上述原因,本文決定采用數據挖掘技術對創(chuàng)業(yè)板首批上市的28家公司進行財務分析.數據挖掘是從“海量”數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的過程.誠然,大多數公司的財務分析所需要的一些數據相對有限,尚不能稱得上“海量”,但是如果能從另一個角度去換位思考,或許能得到意想不到的效果,為更深層次的財務分析做準備.[3]
3.1 確定挖掘對象
財務分析為企業(yè)的投資者、債權人、經營者及其他利益相關者了解企業(yè)過去、評價企業(yè)現狀、預測企業(yè)未來,做出正確決策提供準確的信息或依據.財務狀況是指一定時期的企業(yè)經營活動體現在財務上的資金籌集與資金運用狀況,它是企業(yè)一定期間內經濟活動過程及其結果的綜合反映.本文選取了創(chuàng)業(yè)板首批上市的28家公司進行分析:特銳德(300001)、神州泰岳(300002)、樂普醫(yī)療(300003)等,分別用X1,X2,X3,…X28,表示.可以預測大部分公司將歸為一類,少部分公司歸為一類,即業(yè)績表現優(yōu)良或是較差.再利用輔助指標進行判斷.
3.2 數據準備
3.2.1 數據選取
以2009年9月30日為時點,選取創(chuàng)業(yè)板首批上市的28家公司以下7個關鍵財務指標數據:流動資產合計、總資產合計、流動負債合計、長期負債合計、資本公積、盈余公積、未分配利潤,分別用L1,L2,L3,…L7,表示(見表1).
3.2.2 數據處理
數據預處理是數據分析過程中不可缺少的一個關鍵環(huán)節(jié),它服務于數據分析和建模.數據預處理需要解決的問題有很多,例如,缺省值和異常數據的處理,數據的轉換處理、數據抽樣和選取變量.[3]本文利用最小—最大規(guī)范化方法對數據進行標準化處理,設minL和m a xL分別為屬性L的最小值和最大值,則利用公式L'=(L-minL)/(m a xL-minL),對原樣本進行標準化處理,將7個關鍵財務指標數按比例縮放,使之落入到一個小的特定區(qū)間(0~1),從而實現數據的預處理.
3.3 利用數據挖掘軟件SPSS進行聚類分析
將表1數據輸入到SPSS軟件編輯窗口,點擊“Analyze→Classify→HierarchicalCluster”選擇層次聚類.本文采用最小距離方法,具體操作時選擇,“Nearestneighbor”即最短距離法,得到相異度矩陣,見表2(截取部分數據).
表3反映了聚類分析的凝聚過程.
表1 28家創(chuàng)業(yè)板上市公司財務數據
表2 相異度矩陣(部分)
表4 聚類結果的類成員表
第一列表示聚類分析的步驟,在本次分析中共進行了27次.第二列和第三列表示哪兩個樣本聚成了一類.第四列表示兩個樣本的相似系數.第五列表示兩個參與聚類的是樣本還是類,0表示樣本,非0數字N表示第N步產生的聚類參與本步聚類.第七列表示本步驟聚類結果將在以后的第幾步中用到.
第一列表示表示7和10兩個樣本最先進行了聚類,樣本間相似系數為0.997,本次聚類結果將在以后的第二步中用到;以此類推,將28個樣本全部聚類.
表4是最終聚類結果的類成員表,在利用SPSS分析過程中,本文設置分為2~4類,從而輸出了劃分2~4類時每個樣本屬于每一類的結果.
表3 凝聚順序表
聚類分析事前并沒有制定分類的標準。本文劃分為兩類的時候,只有華誼兄弟和其他不同類,通過傳統(tǒng)的財務分析發(fā)現,其總資產增長率、總資產報酬率、流動比率和速動比率均呈逐年平穩(wěn)遞增的趨勢,而凈資產報酬率和每股收益呈下降趨勢。當劃分為三類時,安科生物和北陸藥業(yè)成為一類;華誼兄弟自成一類。安科生物和北陸藥業(yè)同屬制藥行業(yè),二者的流動比率和速動比率增長較快,總資產周轉率呈下降趨勢。當劃分為四類時,安科生物和北陸藥業(yè)成為一類;華誼兄弟自成一類;新寧物流自成一類,其總資產增長率呈下降趨勢。聚類分析提供了一個可以橫向比較同類上市公司的工具,投資者掌握這一技術,可以為投資決策提供更有價值的財務信息。
〔1〕證監(jiān)會有關部門負責人就創(chuàng)業(yè)板上市公司監(jiān)管答問.中國 網 ,http://www.china.com.cn/finance/txt/2009-10/ 27/content_18777271.htm.
〔2〕胡玉柱,等.基于主成分分析的高新技術企業(yè)業(yè)績評價研究[J],財會通訊·學術,2008(7):62-65.
〔3〕趙磊.數據挖掘技術在財務分析中的應用[J].中國管理信息化,2009(1):34-38.
〔4〕薛薇.基于SPSS的數據分析[M].中國人民大學出版社,2006.
〔5〕趙選民,薛建樓.利用數據挖掘技術分析上市公司財務狀況[J].中國管理信息化,2009(2):30-32.
F275
A
1673-260X(2010)08-0064-03