楊博翔
北京交通大學(xué)中國(guó)產(chǎn)業(yè)安全研究中心博士后科研工作站,北京100032
基于優(yōu)勢(shì)粗糙集的證券投資決策研究及其應(yīng)用
楊博翔
北京交通大學(xué)中國(guó)產(chǎn)業(yè)安全研究中心博士后科研工作站,北京100032
粗糙集方法在金融及投資領(lǐng)域發(fā)揮著越來(lái)越大的作用,然而經(jīng)典粗糙集理論不能發(fā)現(xiàn)偏好多屬性決策表中與偏好屬性相關(guān)的不相容性。本文基于優(yōu)勢(shì)粗糙集理論的知識(shí)約簡(jiǎn)算法,提出了基于優(yōu)勢(shì)關(guān)系的屬性重要度約簡(jiǎn)算法,并構(gòu)建了基于優(yōu)勢(shì)粗糙集的證券投資分析模型,針對(duì)中國(guó)上市公司財(cái)務(wù)數(shù)據(jù)為連續(xù)值、分布未知、含有偏好信息等特征,對(duì)證券樣本進(jìn)行綜合排序,得到最終的綜合排序和評(píng)價(jià),并對(duì)算法進(jìn)行有效性分析。
粗糙集;優(yōu)勢(shì)關(guān)系;證券投資決策
基于證券市場(chǎng)的全球化大背景,以及證券投資分析的重要作用,關(guān)于證券投資決策分析的理論和方法的研究已經(jīng)成為一個(gè)重要的前沿領(lǐng)域[1]。以往的證券投資分析方法由于預(yù)測(cè)的精度比較低,或由于過(guò)于苛刻的基本假設(shè)而在真實(shí)市場(chǎng)中無(wú)法完全實(shí)現(xiàn)等問(wèn)題,影響投資者進(jìn)行科學(xué)、正確的投資決策。因此需要研究更適合于管理決策的數(shù)據(jù)挖掘方法——粗糙集方法。在一個(gè)投資決策方案中,偏好屬性的順序特性是很重要的決策信息,這就決定了優(yōu)勢(shì)粗糙集比傳統(tǒng)的粗糙集理論對(duì)投資決策問(wèn)題應(yīng)具有更強(qiáng)的適應(yīng)力和解釋力[2]。
將借鑒經(jīng)典粗糙集啟發(fā)式知識(shí)約簡(jiǎn)算法提出基于優(yōu)勢(shì)關(guān)系的偏好決策表的有效算法。屬性約簡(jiǎn)是以獲取最佳屬性約簡(jiǎn)為目標(biāo)的,前提條件是不損失原有信息系統(tǒng)的信息。在經(jīng)典的約簡(jiǎn)算法中,最直觀的就是使用刪除法,但該復(fù)雜度非常高,不適合于數(shù)據(jù)和屬性龐大的信息系統(tǒng)。為了降低復(fù)雜度,基于屬性重要度的約簡(jiǎn)算法應(yīng)運(yùn)而生,經(jīng)典的基于屬性重要度的約簡(jiǎn)算法是建立在經(jīng)典粗糙集理論的基礎(chǔ)上的,因沒(méi)有考慮到?jīng)Q策者的偏好決策需要,而使得約簡(jiǎn)結(jié)果容易產(chǎn)生不相容問(wèn)題,大大制約了這種算法的使用。而在眾多基于DRSA的知識(shí)約簡(jiǎn)算法中,以屬性重要度為約簡(jiǎn)原則的算法還比較少。文章擬借鑒經(jīng)典的基于屬性重要度的約簡(jiǎn)算法,充分考慮偏好關(guān)系,以屬性的重要性作為啟發(fā)規(guī)則,尋求基于優(yōu)勢(shì)關(guān)系的啟發(fā)式最小約簡(jiǎn)算法?;趦?yōu)勢(shì)關(guān)系的啟發(fā)式最小約簡(jiǎn)算法的主要思想是,判斷從條件屬性集中刪除某個(gè)屬性后,剩下的條件屬性集是否能將對(duì)象正確地劃分到?jīng)Q策屬性類中,最終找到與C的Cl分類質(zhì)量一致的C的最小子集。
2.1證券投資指標(biāo)體系的選擇與建立
2.1.1選擇指標(biāo)的原則一般來(lái)講,選購(gòu)股票就是選擇上市公司。本文僅從證券投資者的角度出發(fā),按照以下原則選擇財(cái)務(wù)指標(biāo):
(1)由于不同行業(yè)在不同時(shí)期的情況不盡相同,如果選擇多種行業(yè)的股票會(huì)導(dǎo)致對(duì)排序和評(píng)價(jià)的結(jié)果產(chǎn)生不良影響,使結(jié)果可信度不高,因此,選擇一個(gè)行業(yè)板塊進(jìn)行股票指標(biāo)的分析;
(2)考慮到指標(biāo)的客觀性、可比性原則,不選擇反應(yīng)公司經(jīng)營(yíng)規(guī)模和財(cái)務(wù)規(guī)模的指標(biāo),如資產(chǎn)總額、利潤(rùn)總額等,而是選擇能夠融合更多特征的指標(biāo),如每股凈資產(chǎn)、股東權(quán)益等財(cái)務(wù)比率指標(biāo);
(3)選擇指標(biāo)要盡可能體現(xiàn)公司的財(cái)務(wù)結(jié)構(gòu)、經(jīng)營(yíng)效率、成長(zhǎng)能力、盈利能力、以及抵抗風(fēng)險(xiǎn)的能力,這些指標(biāo)能夠綜合反映出公司的經(jīng)營(yíng)狀況和財(cái)務(wù)狀況,是進(jìn)行投資選擇的重要指標(biāo)。
2.1.2證券投資指標(biāo)體系的選擇根據(jù)以上原則,在證券領(lǐng)域普遍認(rèn)為的證券指標(biāo)作為參照,確定以下9個(gè)證券投資財(cái)務(wù)指標(biāo):
(1)每股收益(元)=凈利潤(rùn)/總股本;(2)每股凈資產(chǎn)(元)=股東權(quán)益/總股本;(3)每股資本公積金=資本公積金/總股本;(4)每股未分配利潤(rùn)=未分配利潤(rùn)/總股本;(5)每股經(jīng)營(yíng)現(xiàn)金流量=經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~/總股本;(6)主營(yíng)業(yè)務(wù)收入增長(zhǎng)率(%)=(本期主營(yíng)業(yè)務(wù)收入-上期主營(yíng)業(yè)務(wù)收入)/上期主營(yíng)業(yè)務(wù)收入;(7)凈資產(chǎn)收益率=凈利潤(rùn)/股東權(quán)益;(8)股東權(quán)益比=股東權(quán)益/資產(chǎn)總額;(9)資產(chǎn)負(fù)債率=負(fù)債總額/資產(chǎn)總額。
其中,指標(biāo)1、2、3、4、5、7可以體現(xiàn)公司股票價(jià)值和盈利能力,指標(biāo)6可以體系公司經(jīng)營(yíng)與發(fā)展能力,指標(biāo)8可以反應(yīng)公司財(cái)務(wù)結(jié)構(gòu),指標(biāo)9可以反應(yīng)公司抵抗風(fēng)險(xiǎn)的能力。
2.2針對(duì)偏好決策表的兩種排序方法
2.2.1基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法[3]的步驟:
(1)確定評(píng)價(jià)因素集C={C1,C2,...,Cn};
(2)確定評(píng)價(jià)目標(biāo)集U={S1,S2,...,Sm};
(4)建立基于DRSA[4]的權(quán)重矩陣;
(6)多級(jí)綜合排序:如果評(píng)價(jià)目標(biāo)的有關(guān)因素很多,很難合理的定出權(quán)數(shù)分配,就難以真實(shí)的反映各因素在整體中的地位,有時(shí)通過(guò)一次綜合排序很難分出評(píng)價(jià)等級(jí),即評(píng)價(jià)次序,這時(shí)需要采取二級(jí)或多級(jí)評(píng)價(jià)。如綜合二級(jí)評(píng)價(jià)。其中。這里算子“∧”,“∨”表示取大,取小的含義;
(7)綜合評(píng)價(jià)。對(duì)綜合排序結(jié)果向量進(jìn)行分析。
以上基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法的七個(gè)基本步驟,第四步和第七步為比較核心的兩個(gè)步驟,第六步根據(jù)實(shí)際需要選取,也可不進(jìn)行。由此,以優(yōu)勢(shì)粗糙集相關(guān)理論為基礎(chǔ),應(yīng)用關(guān)系合成的原理,建立起基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法。
2.2.2基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法基于擴(kuò)展Vague值的偏好決策表[5]綜合排序方法的一般步驟:
(1)據(jù)(1)式將偏好決策表中的評(píng)價(jià)目標(biāo)賦予擴(kuò)展Vague值;
其中,tx表示基于優(yōu)勢(shì)關(guān)系擴(kuò)展Vague集的肯定隸屬度,fx表示基于優(yōu)勢(shì)關(guān)系擴(kuò)展Vague集的否定隸屬度為[6];Yl是含有m個(gè)分量的一維列向量,l=1,2。
(2)根據(jù)擴(kuò)展Vague值建立構(gòu)造矩陣Y;(3)計(jì)算矩陣Y的最大特征值對(duì)應(yīng)的特征向量作為排序向量;(4)根據(jù)排序向量對(duì)Vague值排序,分量越大,Vague值越大;(5)根據(jù)排序結(jié)果進(jìn)行綜合評(píng)價(jià)。
2.3基于優(yōu)勢(shì)粗糙集的證券投資分析模型
基于優(yōu)勢(shì)粗糙集的證券投資決策模型建立步驟:
(1)建立證券投資指標(biāo)體系;(2)從證券網(wǎng)站上選數(shù)支股票為樣本,輸入各指標(biāo)值并進(jìn)行數(shù)據(jù)歸一處理,生成初始偏好決策表;(3)將指標(biāo)進(jìn)行離散化,按照偏好順序作分級(jí)處理,生成分級(jí)評(píng)價(jià)偏好決策表;(4)對(duì)決策表按照基于優(yōu)勢(shì)關(guān)系的屬性重要度約簡(jiǎn)算法進(jìn)行知識(shí)約簡(jiǎn),得到約簡(jiǎn)后的偏好決策表;(5)按照兩種綜合排序方法對(duì)所選股票進(jìn)行綜合排序,得出評(píng)價(jià)結(jié)果,分析模型的有效性。
至此,證券投資決策模型構(gòu)建完成。
3.1樣本選擇及分析
本文從有色金屬板塊中隨機(jī)抽取了35支股票2009年第四季度的數(shù)據(jù)作為研究樣本,以9個(gè)財(cái)務(wù)指標(biāo)作為條件屬性,綜合評(píng)價(jià)作為決策屬性,由于這些屬性均是含有偏好信息的,如投資者希望每股收益總是越高越好,資產(chǎn)負(fù)債率越低越好,決策屬性也具有偏好信息,如評(píng)價(jià)等級(jí)越高,代表股票的質(zhì)量越好,越值得投資,因此19家上市公司的財(cái)務(wù)數(shù)據(jù)便形成了一張初始的偏好決策表。從該偏好決策表中任意抽取3個(gè)屬性,對(duì)其屬性值的分布情況進(jìn)行分析,發(fā)現(xiàn)屬性的值域分布見圖1。
圖1所顯示的是每股收益、主營(yíng)收入增長(zhǎng)率、股東權(quán)益比率三個(gè)屬性指標(biāo)的分布情況,可以看出,該三個(gè)屬性指標(biāo)均為無(wú)序分布,即不服從現(xiàn)有已知的正態(tài)分布、均勻分布等。
圖1 證券指標(biāo)屬性值的分布Fig.1 Distribution of securities index properties
從以上屬性的分布及其他屬性的分布圖中可知,各屬性指標(biāo)值的分布均不相同,對(duì)于該樣本,首先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后利用基于優(yōu)勢(shì)關(guān)系的屬性重要度約簡(jiǎn)算法進(jìn)行知識(shí)約簡(jiǎn),得到約簡(jiǎn)后的偏好決策表,再利用綜合排序方法對(duì)所選股票進(jìn)行綜合排序,得出最終的評(píng)價(jià)結(jié)果[7]。
3.2綜合排序
3.2.1基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法
由偏好決策表可知評(píng)價(jià)矩陣為R
綜合評(píng)價(jià)模型
得到所選樣本的綜合排序?yàn)椋?/p>
其中,“?”代表優(yōu)于,“{}”內(nèi)元素表示評(píng)價(jià)值相同。
3.2.2基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法基于優(yōu)勢(shì)關(guān)系擴(kuò)展Vague集的肯定隸屬度為
基于優(yōu)勢(shì)關(guān)系擴(kuò)展Vague集的否定隸屬度為
采用Eig函數(shù)[8],用Matlab計(jì)算得:最大的特征值為:δ=24.7517。
得到所選樣本的綜合排序?yàn)椋?/p>
可見兩種方法得到的產(chǎn)品排序有一定的差異,從ω的值可以看出第二種方法得出樣本間的評(píng)價(jià)值非常接近,導(dǎo)致基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法對(duì)樣本數(shù)據(jù)分辨率不高,如果將精確度變低,將小數(shù)點(diǎn)后三位精確到小數(shù)點(diǎn)后兩位,再看兩種方法的綜合排序結(jié)果。
基于優(yōu)勢(shì)粗集權(quán)重的綜合排序方法:
基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法:
兩種方法的排序結(jié)果的擬合度較高,排序結(jié)果基本相同。
3.3有效性分析
當(dāng)結(jié)果取高精確度進(jìn)行排序時(shí),兩種排序方法的結(jié)果有一定的差異性,主要是由于基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法得出的評(píng)價(jià)值非常接近,對(duì)樣本數(shù)據(jù)分辨率不高,但這時(shí)排名前兩位和排名后兩位的股票是相同的,可以告訴投資者者22、28兩支股票評(píng)價(jià)值最高最值得推薦,18,31兩支股票評(píng)價(jià)值最低要謹(jǐn)慎投資,同理,兩種方法同樣排名靠前的股票2綜合評(píng)價(jià)值很高,股票26評(píng)價(jià)值都很低,模型不予推薦。
因此,當(dāng)只關(guān)心綜合評(píng)價(jià)最好的股票和綜合評(píng)價(jià)最不好的股票時(shí),模型是適用的,這種情況對(duì)投資者也是有意義的,因?yàn)橥顿Y者在投資時(shí)可能不需要全部的排序,只需挑出1到2支評(píng)價(jià)最高的股票進(jìn)行投資,或者知道評(píng)價(jià)最低的股票,從而在投資時(shí)不予購(gòu)買;當(dāng)結(jié)果降低精確度進(jìn)行排序時(shí),兩種排序方法的結(jié)果基本相同,上述案例中35個(gè)樣本數(shù)據(jù),排序相同的有27支股票,只有1、8、12、19、24、25、32、33等8支股票不同,兩種方法的排序一致性達(dá)到77.14%,是一個(gè)滿意的結(jié)果,對(duì)于8支“另類”樣本,本文的模型可能不適應(yīng)這類數(shù)據(jù),對(duì)此將進(jìn)行下一步研究。
首先,構(gòu)建了基于優(yōu)勢(shì)粗糙集的證券投資分析模型,提出了兩種綜合排序方法,給出了基于優(yōu)勢(shì)關(guān)系的偏好決策表的權(quán)重系數(shù),并在此基礎(chǔ)上給出了排序方法;利用上下聯(lián)合的粗糙隸屬函數(shù)基于優(yōu)勢(shì)關(guān)系擴(kuò)展Vague集的肯定隸屬度、否定隸屬度,然后采用特征向量的方法,將不同的Vague區(qū)間值轉(zhuǎn)化特征向量,建立了基于擴(kuò)展Vague值理論的偏好決策表綜合排序方法。根據(jù)上述研究,建立了基于優(yōu)勢(shì)粗糙集的證券投資分析模型的完整模型。最后,對(duì)所建立的基于優(yōu)勢(shì)關(guān)系的證券投資分析模型進(jìn)行應(yīng)用研究,并取得了良好的效果。
[1]曾劍鋒,吳根秀.基于相異關(guān)系的粗糙集理論[J].江西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2004,28(5):426-430
[2]李鋼,張雪婷.基于相似關(guān)系粗糙集的分解[J].計(jì)算機(jī)工程與應(yīng)用,2004(2):85-87
[3]崔玉泉,張麗,史開泉.粗糙集的動(dòng)態(tài)特性研究[J].山東大學(xué)學(xué)報(bào):理學(xué)版,2010,45(6):8-14
[4]Ju S,Wu W,Zhang W.Approaches to Knowledge Reduction Based on Variable Precision Rough Set Model[J]. Information Sciences,2004(159):255-272
[5]楊青山,王國(guó)胤,張清華,等.基于優(yōu)勢(shì)關(guān)系的區(qū)間值粗糙集擴(kuò)充模型[J].山東大學(xué)學(xué)報(bào):理學(xué)版,2010,45(9):7-13
[6]菅利榮,達(dá)慶利,陳偉達(dá).基于粗糙集的不一致信息系統(tǒng)規(guī)則獲取方法[J].中國(guó)管理科學(xué),2003,11(4):90-95
[7]安利平,陳增強(qiáng),袁著扯.多準(zhǔn)則分級(jí)決策的擴(kuò)展粗糙集方法[J].系統(tǒng)工程學(xué)報(bào),2004,12,19(6):559-576
[8]侯福均,廖愛紅,吳祈宗.判斷信息為偏好序的社會(huì)選擇:特征向量法[J].南京理工大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(12):80-83
Research andApplication of Securities Investment Decision Based on Rough Set Theory
YANG Bo-xiang
Postdoctoral Scientific Research Workstation of China Center for Industrial Security Research/Beijing Jiaotong University,Beijing 100032,China
Rough set method plays a more and more important role in finance and investment field.However,the classical rough set theory cannot find the incompatibility between preference attribute and preference attribute in the decision table. Under this background,this paper constructed the dominance rough set based on securities investment analysis model and for the Chinese Listed Companies'financial data for continuous value,distribution is unknown,preference information and other characteristics,the comprehensive sort of sample securities was made and the final comprehensive ranking and evaluation were gotten to analyze the validity of the algorithm.
Rough set theory;dominance relation;security investment decisions
TN202
A
1000-2324(2016)05-0785-04
2016-05-15
2016-06-18
楊博翔(1989-),男,湖南常德人,博士后,主要研究方向?yàn)榻鹑诋a(chǎn)業(yè)安全.E-mail:yangboxiang7@126.com