潘春玲
摘 要: 針對(duì)傳統(tǒng)限價(jià)指令驅(qū)動(dòng)市場(chǎng)信息聚類分析不準(zhǔn)確,且存在耗時(shí)長(zhǎng)的問題,提出基于信息相似度計(jì)算的限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型。首先給出信息聚類模型的模塊結(jié)構(gòu)圖,并導(dǎo)入限價(jià)指令驅(qū)動(dòng)條例,以條例為制約,根據(jù)信息熵獲取指標(biāo)權(quán)重,計(jì)算信息相似度,將每一個(gè)帶有趨向性的信息進(jìn)行簇源追蹤,對(duì)于遠(yuǎn)離簇中心的信息進(jìn)行剝離,將剩下的信息重新賦予數(shù)據(jù)族編,實(shí)現(xiàn)信息聚類分析模型建立。實(shí)驗(yàn)數(shù)據(jù)表明,構(gòu)建的信息聚類分析模型能夠依據(jù)信息相似度進(jìn)行同源信息的聚類,聚類分析準(zhǔn)確度較高,且耗時(shí)較短。
關(guān)鍵詞: 限價(jià)指令; 市場(chǎng)信息; 聚類分析; 相似度; 信息分類; 數(shù)據(jù)族編
中圖分類號(hào): TN911?34; TN393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)06?0169?03
Abstract: Since the information clustering analysis of the traditional limit order driven market is inaccurate, and has long time consumption, an information clustering analysis model of limit order driven market is put forward, which is based on information similarity calculation. The module structure diagram of the information clustering model is given, and the limit order driven regulation is imported. Taking the regulation as the restriction, the index weight is acquired according to information entropy, and the information similarity is calculated. The cluster source tracking is performed for each information with tendency. The information away from the cluster center is eliminated, and the rest of information is endowed with data family compilation renewedly to realize the establishment of information clustering analysis model. The experimental data shows that the constructed information clustering analysis model can cluster the homologous information according to information similarity, and has high clustering analysis accuracy and short time consumption.
Keywords: limit order; market information; clustering analysis; similarity; information classification; data family compilation
0 引 言
在限價(jià)指令驅(qū)動(dòng)的市場(chǎng)中,市場(chǎng)中信息數(shù)據(jù)之間是一個(gè)復(fù)雜的交互作用過程。限價(jià)指令驅(qū)動(dòng)下,市場(chǎng)信息具有一定的流動(dòng)供給功能。信息流動(dòng)性促進(jìn)市場(chǎng)交易策略信息互相參雜,致使市場(chǎng)中信息雜亂無序[1?2]。每一類型的市場(chǎng)信息具有特有的屬性,不同屬性下的信息代表的意義也是不同的,但在限價(jià)指令驅(qū)動(dòng)下的市場(chǎng)中找到同一類的信息變得十分困難。傳統(tǒng)的市場(chǎng)信息聚類方法能夠?qū)κ袌?chǎng)中的信息進(jìn)行簡(jiǎn)單分類,但是無法區(qū)分同源信息數(shù)據(jù)的歸類源,數(shù)據(jù)間的相似度無法比較,造成同一簇的信息可能是非同族數(shù)據(jù)。針對(duì)上述問題,本文設(shè)計(jì)了限價(jià)指令驅(qū)動(dòng)市場(chǎng)中的信息聚類分析模型,并進(jìn)行試驗(yàn)分析。
1 限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型設(shè)計(jì)
本文設(shè)計(jì)的信息聚類分析模型,以限價(jià)指令為信息數(shù)據(jù)的主導(dǎo),將每一項(xiàng)指標(biāo)都視為同等二級(jí)指標(biāo),使用權(quán)重指標(biāo)為特級(jí)指標(biāo),解決市場(chǎng)信息的相似度的問題[3],利用冗余性對(duì)數(shù)據(jù)信息進(jìn)行同族處理,實(shí)現(xiàn)信息簇族化,實(shí)現(xiàn)信息聚類分析模型的建立以及信息聚類分析。本文設(shè)計(jì)信息聚類模型模塊結(jié)構(gòu)如圖1所示。
1.1 限價(jià)指令驅(qū)動(dòng)條例
限價(jià)指令在市場(chǎng)中,能夠?qū)π畔?shù)據(jù)進(jìn)行一定的制約,由于限價(jià)指令能夠?qū)⑿畔?shù)據(jù)進(jìn)行累積,累積的數(shù)據(jù)信息會(huì)按照限價(jià)指令的先后進(jìn)行時(shí)間上的排序,這種按照時(shí)間的排序就稱為信息的優(yōu)先權(quán)重[3?4]。限價(jià)指令能夠直接影響市場(chǎng)上的交易量,從而控制信息的走向。不同的限價(jià)指令推行下,累積的信息數(shù)據(jù)會(huì)產(chǎn)生交互作用,將非同族的信息進(jìn)行交互混雜,致使最終的信息走向偏向于雜亂無序的狀態(tài)。本文使用限價(jià)指令驅(qū)動(dòng)能夠激活數(shù)據(jù)信息,使其具有一定的信息流動(dòng)性,在流動(dòng)性的驅(qū)使下能夠產(chǎn)生一定的信息簇族效應(yīng),方便數(shù)據(jù)的聚類處理。
假設(shè)限價(jià)指令驅(qū)動(dòng)能力為[T],利用市場(chǎng)的信息發(fā)展趨勢(shì)進(jìn)行條件限制函數(shù)的建立,用公式表示為:
[S=PrT>tX∈P?S?I]
式中:[S]為限價(jià)指令驅(qū)動(dòng)限制能力,利用限價(jià)指令驅(qū)動(dòng)的條件限定[T>t],致使信息具有單一的趨向性。即使限價(jià)指令驅(qū)動(dòng)在[t]之下,仍然有信息補(bǔ)縮的趨勢(shì),因此信息仍然具有趨向性[5]。使用[X],[P],[S],[I]四項(xiàng)條件限制使用過程的信息外延展。[X]為信息的動(dòng)向力,能夠提升市場(chǎng)信息的格局化;[P]表示信息的過程交互概率,是衡量信息的雜亂度的條件;[I]為數(shù)據(jù)信息的向心趨勢(shì)。經(jīng)過上述的限價(jià)指令驅(qū)動(dòng)條例的引入完成對(duì)數(shù)據(jù)信息的限定。endprint
1.2 指標(biāo)權(quán)重的確定
由于限價(jià)指令的使用,本文需要對(duì)指標(biāo)權(quán)重進(jìn)行重新確定,在信息聚類分析中各個(gè)指標(biāo)的權(quán)重程度是不同的,通常需要對(duì)同源信息進(jìn)行簇族權(quán)重重新確認(rèn)[6?7]。根據(jù)信息熵的概念,市場(chǎng)信息在熵度量的獲取中,能夠提供適度的專項(xiàng)同源族簇。將市場(chǎng)數(shù)據(jù)的整體想象成為一個(gè)具有理想尺度的綜合體,歸一化的數(shù)據(jù)信息權(quán)重便可以進(jìn)行確認(rèn),信息聚類分析過程的指標(biāo)權(quán)重可以定義為,由信息熵以及過程權(quán)重所組成,過程權(quán)重只能說明整體權(quán)重的量,無法實(shí)現(xiàn)單一分類。因此,重新定義信息的過程交互概率是一個(gè)定值,將每一個(gè)信息源中的使用概率、信息驅(qū)動(dòng)程度以及權(quán)重決定因子進(jìn)行指標(biāo)化處理,便可以得到總體信息權(quán)重分量,使用轉(zhuǎn)化信息矩陣將定義的指標(biāo)化分量與其結(jié)合,信息權(quán)重矩陣會(huì)變得有序化,對(duì)每一個(gè)同源信息進(jìn)行多次提取,把整體信息權(quán)重分配給每一個(gè)信息源中,便可以得到具有指標(biāo)化的權(quán)重。
通過上述過程的分配,能夠確認(rèn)每項(xiàng)同源信息的權(quán)重,其中分配到的權(quán)重可能與信息的發(fā)展趨勢(shì)有偏差,但是信息的趨勢(shì)是矢量,權(quán)重也是矢量,在不同的分布狀態(tài)下也可進(jìn)行疊加或類減。至此,完成指標(biāo)權(quán)重的重新確定過程。
1.3 信息聚類分析模型建立
本文設(shè)計(jì)的市場(chǎng)信息聚類分析模型,能夠進(jìn)行信息的劃分或分組處理。設(shè)計(jì)的信息聚類分析模型,能夠?qū)⑹袌?chǎng)信息中的限價(jià)指令驅(qū)動(dòng)以矢量的形式進(jìn)行子集化,每一個(gè)子集代表限價(jià)指令驅(qū)動(dòng)樣本或者是限價(jià)指令驅(qū)動(dòng)趨勢(shì)[8]。通過上述確認(rèn)的指標(biāo)權(quán)重,能夠?qū)ψ蛹械脑剡M(jìn)行同源化處理,方便進(jìn)行信息聚類分析。本文利用[K]進(jìn)行信息相似度計(jì)算,將每一個(gè)帶有趨向性的信息進(jìn)行簇源追蹤,對(duì)于遠(yuǎn)離簇中心的信息進(jìn)行剝離,將剩下的信息重新賦予數(shù)據(jù)族編,便完成信息聚類分析模型建立[9]。假設(shè)每個(gè)信息簇的數(shù)據(jù)源值是相同的,聚類過程是不斷重復(fù)的,信息聚類過程函數(shù)分別使用市場(chǎng)信息原始信息分類源以及限價(jià)指令驅(qū)動(dòng)下的信息聚類能力進(jìn)行信息聚類處理。經(jīng)過信息的甄別,完成聚類分析過程,至此信息聚類分析模型構(gòu)建完成,見圖2。
2 實(shí)驗(yàn)分析
2.1 實(shí)驗(yàn)參數(shù)設(shè)定
本文為了檢驗(yàn)限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型的有效性,對(duì)原始市場(chǎng)信息和限價(jià)指令驅(qū)動(dòng)后的市場(chǎng)信息,分別設(shè)計(jì)了兩組實(shí)驗(yàn)。在第一組實(shí)驗(yàn)中,使用限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型與傳統(tǒng)信息聚類分析方法,在原始市場(chǎng)信息狀態(tài)下進(jìn)行實(shí)驗(yàn)。在第二組實(shí)驗(yàn)中,使用限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型與傳統(tǒng)信息聚類分析方法,但市場(chǎng)信息受到限價(jià)指令驅(qū)動(dòng)。模擬實(shí)驗(yàn)每組執(zhí)行10天,每天對(duì)10期市場(chǎng)信息運(yùn)行結(jié)果數(shù)據(jù)的聚類分析。分析過程觀察每組實(shí)驗(yàn)中不同市場(chǎng)信息的實(shí)驗(yàn)結(jié)果,以此判斷該方法的適用度。為了試驗(yàn)的嚴(yán)謹(jǐn)性,對(duì)試驗(yàn)參數(shù)進(jìn)行設(shè)置,設(shè)置結(jié)果如表1所示。
2.2 試驗(yàn)結(jié)果分析
表2是在不同市場(chǎng)狀態(tài)下的同源性測(cè)試結(jié)果。溫和市場(chǎng)對(duì)應(yīng)的信息趨向性;急躁市場(chǎng)對(duì)應(yīng)的信息同源率;耐心市場(chǎng)對(duì)應(yīng)的信息歸屬速率。三種市場(chǎng)中最具有代表性的數(shù)據(jù)能夠反映出信息的同源規(guī)律。溫和市場(chǎng)選用信息趨向性能夠反映信息同源的規(guī)律變化,溫和市場(chǎng)的信息波動(dòng)不劇烈沒有信息斷代,使用信息趨向性足以說明。急躁市場(chǎng)狀態(tài)下帶有強(qiáng)烈的信息波動(dòng)性,選用其他數(shù)據(jù)不能進(jìn)行代表性說明,因此選用信息同源率。耐心市場(chǎng)存在信息斷代,其他數(shù)據(jù)不具有說明性。
%
通過表2的數(shù)據(jù)對(duì)比結(jié)果可以看出本設(shè)計(jì)的聚類模型比傳統(tǒng)方法更佳具有信息趨向性,信息同源性結(jié)果說明,本文設(shè)計(jì)的聚類模型比傳統(tǒng)方法更具有說明性。
3 結(jié) 語(yǔ)
本文設(shè)計(jì)的限價(jià)指令驅(qū)動(dòng)市場(chǎng)中信息聚類分析模型,導(dǎo)入了限價(jià)指令驅(qū)動(dòng)條例,以條例信息為制約,優(yōu)化指標(biāo)權(quán)重確認(rèn)過程。希望通過本文研究能夠促進(jìn)市場(chǎng)信息聚類能力。
參考文獻(xiàn)
[1] 王碩,李鵬程,楊寶臣.基于指令驅(qū)動(dòng)市場(chǎng)EKOP模型的異質(zhì)期望研究[J].管理科學(xué),2016,29(3):123?135.
WANG Shuo, LI Pengcheng, YANG Baochen. Heterogeneous expectations study based on EKOP model under order driven market [J]. Journal of management science, 2016, 29(3): 123?135.
[2] 邴濤,劉善存,張強(qiáng),等.指令驅(qū)動(dòng)市場(chǎng)中非知情交易者的最優(yōu)交易策略[J].管理科學(xué)學(xué)報(bào),2017,20(3):24?45.
BING Tao, LIU Shancun, ZHANG Qiang, et al. The optimal trading strategy of uninformed traders in an order driven market [J]. Journal of management sciences in China, 2017, 20(3): 24?45.
[3] 劉翠霞,史代敏.基于關(guān)系聚類的動(dòng)態(tài)面板數(shù)據(jù)模型及其應(yīng)用研究[J].統(tǒng)計(jì)與信息論壇,2015,30(3):10?16.
LIU Cuixia, SHI Daimin. Dynamic panel data model and its application based on structural relationships of clustering analysis [J]. Statistics & information forum, 2015, 30(3): 10?16.endprint
[4] 謝洪安,李棟,蘇旸,等.基于聚類分析的可信網(wǎng)絡(luò)管理模型[J].計(jì)算機(jī)應(yīng)用,2016,36(9):2447?2451.
XIE Hongan, LI Dong, SU Yang, et al. Trusted network management model based on clustering analysis [J]. Journal of computer applications, 2016, 36(9): 2447?2451.
[5] 李鎮(zhèn)鎮(zhèn),李曉東,李飛,等.基于動(dòng)態(tài)聚類分析和盲數(shù)理論的綜合營(yíng)養(yǎng)狀態(tài)指數(shù)評(píng)價(jià)模型[J].環(huán)境工程學(xué)報(bào),2015,9(4):2021?2026.
LI Zhenzhen, LI Xiaodong, LI Fei, et al. Improved assessment model for comprehensive trophic state index based on dynamic cluster analysis and blind theory [J]. Chinese journal of environmental engineering, 2015, 9(4): 2021?2026.
[6] 李娜,王磊,張文月,等.基于高維數(shù)據(jù)優(yōu)化聚類的長(zhǎng)周期峰谷時(shí)段劃分模型研究[J].現(xiàn)代電力,2016,33(4):67?71.
LI Na, WANG Lei, ZHANG Wenyue, et al. Research on the partition model of long period peak and valley time based on high dimensional data clustering [J]. Modern electric power, 2016, 33(4): 67?71.
[7] 孫善武,王楠,歐陽(yáng)丹彤.基于聚類分析的業(yè)務(wù)流程模型抽象[J].計(jì)算機(jī)科學(xué),2016,43(5):193?197.
SUN Shanwu, WANG Nan, OUYANG Dantong. Business process model abstraction based on cluster analysis [J]. Computer science, 2016, 43(5): 193?197.
[8] 遲志浩,于艷雪,周萍,等.基于有害生物集群的聚類分析在入侵生物定殖研究中的應(yīng)用[J].中國(guó)植保導(dǎo)刊,2017,37(1):17?22.
CHI Zhihao, YU Yanxue, ZHOU Ping, et al. Application of clustering analysis based on invasive pest assemblage in invasive pest establishment [J]. China plant protection, 2017, 37(1): 17?22.
[9] 楊超宇,楊頂田.基于聚類分析算法的浮游植物吸收系數(shù)非線性模型[J].中國(guó)激光,2015,42(z1):244?249.
YANG Chaoyu, YANG Dingtian. A non?linear model of phytoplankton absorption based on cluster analysis [J]. Chinese journal of lasers, 2015, 42(S1): 244?249.
[10] 陳玉川.物聯(lián)網(wǎng)走進(jìn)中國(guó)家庭的技術(shù)條件分析[J].物聯(lián)網(wǎng)技術(shù),2015,5(11):66?69.
CHEN Yuchuan. Technical condition analysis for Internet of Things going into Chinese families [J]. Internet of Things technologies, 2015, 5(11): 66?69.endprint