◎胡曉陽
模糊聚類分析在股票分類中的應用
◎胡曉陽
對事物進行評價首先需要確定參考系,目前對股票進行評價的參考為歷史數(shù)據(jù)以及專家建議。本文評價股票的角度選擇為所選樣本股票,通過選定股票的走勢來預測與其相似度較高的股票的走勢,獲得相似度的方法是模糊聚類分析技術,數(shù)據(jù)處理工作利用MATLAB軟件來完成。同時創(chuàng)新對指標的選取,本文從股票的表現(xiàn)情況與公司的財務情況兩個角度各選取五個側重點不同的指標,能夠較全面地反映股票整體表現(xiàn)情況。
我國可供交易的股票數(shù)量與日俱增。另一方面,評價股票的指標側重點各不相同。模糊聚類分析能夠對各個指標進行綜合考量,比起只用一類指標進行判斷所得到的結果更加的科學。同時,模糊聚類分析可以得出股票之間的相似程度,相似程度越大的股票,出現(xiàn)相同走勢的概率越大,又因為個股對影響股市的事件敏感程度是不同的,那么就可以借助已經做出反應的股票對其相似度較高的股票進行預測。
本文首先選擇模糊數(shù)學理論中最適合對股票進行聚類分析的方法,通過上市公司的基本數(shù)據(jù),并選擇兩類側重點不同的指標,分別對所選股票進行聚類分析,得到動態(tài)聚類結果進行分析。
數(shù)據(jù)標準化方法。選擇出所要分類的股票之后,將指標寫出構造成矩陣的形式即:
本文運用平移·極差變換即令:
模糊相似矩陣的建立。本文選擇倒數(shù)距離法用于建立模糊相似矩陣。
從整體來看,該方法邏輯較為簡單,不需要太多的人為工作,尤其是其具有遞歸調用的特性,那么在對數(shù)據(jù)進行處理時,所用算法在程序編寫上相對容易些,因此本文采用該方法進行聚類。
股票行情會受到諸多因素的影響,同時對股票價值進行評判的指標之間各有利弊。為了能更全面客觀地反映股票的情況,本文從兩個角度出發(fā),選取出了十個指標用于對股票的聚類分析。
股票表現(xiàn)指標。本文從股票的盈利水平,發(fā)展?jié)摿?,風險情況三個方面選取了五個較為常見且具有長期參考價值的指標進行分析研究。分別為市盈率、市凈率、凈資產收益率、每股未分配利潤和每股經營現(xiàn)金流。
財務數(shù)據(jù)指標。本文從考察公司的盈利能力、成長能力、運營能力和財務風險四個方面分別選取指標,以對上市公司的整體情況進行比較判別。分別為:凈利率、毛利率、營業(yè)收入增長率、總資本周轉率和資產負債率。
表1 表現(xiàn)指標動態(tài)聚類
圖1 動態(tài)聚類圖
本文選取的20只股票以中小盤股為主,按所劃分的兩個層次分別進行聚類分析。
表現(xiàn)指標動態(tài)聚類。
原始數(shù)據(jù)見表1。
經MATLAB處理后得到動態(tài)聚類圖。
財務數(shù)據(jù)動態(tài)聚類。
原始數(shù)據(jù)見表2。
得到動態(tài)聚類圖。大其準確度越高。在兩個層面上的聚類結果越相近其準確度越高。其中納爾股份與北化股份在股票層面上當λ=0.6138時可認為是一類。在財務層面上當λ=0.7562時可認為是一類。兩個層面的λ值都比較大,取平均值后即有68.5%的概率認為納爾股份和北化股份有相同的走勢。
在圖上也可以看到,若想得到有效的分類數(shù),需要選取的值較小,而且大部分股票集中于一類之中。在兩個層次下的分類都存在有不同類別的股票之間差異比較懸殊,各類所包含的股票在數(shù)量上的差異比較明顯的現(xiàn)象。本文猜想可能是由于選取的這20只股票所處類別的情況恰好比較
表2 財務數(shù)據(jù)動態(tài)聚類
圖2 動態(tài)聚類圖
從兩張圖中λ值的分布情況來看,可以看到在兩個層次下小范圍內存在有相似度較高的兩只股票或多只股票。另外,由于股票對各類影響行情的因素的敏感性是不相同的,那么就存在借助其中一只股票的走勢預測與它相似度較高的另一只或幾只股票的理論基礎。在同一層次下λ值越符合正態(tài)分布的,即大部分股票的表現(xiàn)處于平均水平,表現(xiàn)優(yōu)異的和表現(xiàn)特別差的數(shù)量均比較少所造成的。從本次研究中也可證明股票的表現(xiàn)情況之間差異還是非常大的,各個指標完全相似的情況不太可能。
(作者單位:河北省黃驊市北斗星電腦有限公司)