• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Lasso 時變圖模型方法的我國股市網絡結構分析

      2022-05-30 14:03:46陳彬宸蔡風景
      溫州大學學報(自然科學版) 2022年2期
      關鍵詞:時變個股股票

      陳彬宸,蔡風景

      (溫州大學數(shù)理學院,浙江溫州 325035)

      在金融市場,不管是傳統(tǒng)投資組合,還是另類投資,投資者均需對股票頭寸進行管理,分析股票間的相關性,從而達到資產優(yōu)化配置的目的.早期,學者們基于相關系數(shù)[1]、Copula 函數(shù)[2]和小波分析[3]等方法分析股市相關結構.上述方法在分析股市相關結構時,大多是基于兩兩成對分析,不能為股市復雜相關結構提供非??煽康淖C據(jù).近年來,越來越多的學者利用網絡分析方法研究股市相關性,以直觀呈現(xiàn)股票網絡結構,其中網絡節(jié)點代表股票,節(jié)點間有邊連接說明股票間存在關聯(lián)結構.股市關聯(lián)網絡結構識別常用的方法包括相關系數(shù)閾值法[4-11]、小波分析[12]和互信息等方法[13-14].基于相關系數(shù)和互信息方法構建圖網絡結構能識別變量間的相關關系,但不能說明條件相關性,會導致出現(xiàn)虛假的同期相關關系.因此有學者利用偏相關系數(shù)和通過條件獨立性識別網絡中的邊,避免虛假相關關系.Billio 等[15-16]構建基于偏相關系數(shù)的股票加權網絡結構,圖中邊的寬度表示偏相關系數(shù)大小.Anufriev 等[17]基于偏相關系數(shù)的圖模型方法構建股票的網絡結構,忽略偏相關系數(shù)較小的邊.

      上述研究基于圖模型的思想識別股市的相關性,為股市相關研究提供了很好的借鑒,但對高維數(shù)據(jù)的建模需要引入結構稀疏化學習.基于Lasso 方法的圖模型稀疏化學習通過精度矩陣包含了概率圖模型中的參數(shù)信息以及結構內容[18-20],本文將無向圖模型方法應用于我國股市的高維數(shù)據(jù)建模,利用Lasso 方法給出精度矩陣的估計,從而識別上證380 個股的圖模型結構.同時,針對金融資產的動態(tài)變化特征①Talih M.Markov Random Fields on Time-varying Graphs with an Application to Portfolio Selection [D].New Haven:Yale University,2003.,提出時變的Lasso 圖模型理論,假定時點間的圖模型結構隨時間可變,構建動態(tài)時變的Lasso 圖模型理論,通過局部組套索懲戒施加于結構化平穩(wěn)的模型,進行結構化平穩(wěn)處理.該方法能合并不同時點的信息,并對圖模型施加結構平穩(wěn)性,且適應數(shù)據(jù)中因變量的局部平滑.基于交替乘法算子方法ADMM(Alternating Directions Method of Multipliers),利用塊快速計算和偽似然逼近來提高計算效率.

      1 時變Lasso 圖模型理論

      令無向概率圖模型對應的數(shù)據(jù)矩陣為X(t),假設每個樣本X都服從獨立同分布的p維高斯分布,其中t∈[0,1],μ∈Rp為均值,Σ ∈Rp×p為協(xié)方差矩陣,假設X(t)的元素獨立,μ(t)為均值,Σ (t)為協(xié)方差矩陣且在t時刻平滑,x(t)為t時刻觀測值.為簡單起見,假設觀測值.圖模型識別的關鍵是估計協(xié)方差矩陣 Σ (t)的逆矩陣Σ?1(t)即精度矩陣,記為 Ω (t).精度矩陣 Ω (t)中某個元素為零表示無向概率圖模型中的兩個節(jié)點條件獨立,即表現(xiàn)為兩點之間不存在一條邊,從而構造基于精度矩陣的圖模型G(t)和邊E(t).由于圖模型結構是時變的,則邊連接也是時刻變化的.

      為估計第k個觀測點的精度矩陣 Ω(tk),將一個有局部組Lasso 的加權非對數(shù)似然函數(shù)最小化,即

      假設在t時刻協(xié)方差矩陣 Σ (t)是平滑的,那么核估計是合理的,可運用鄰域時間點內的信息數(shù)據(jù).因此,我們運用核光滑鄰接矩陣代替核光滑協(xié)方差矩陣,相當于數(shù)據(jù)標準化.懲罰項為組Lasso 類型的稀疏正則化[21],這使得圖模型結構隨著時間推移而平滑地變化.平滑程度由調諧參數(shù)d(> 0)控制,鄰域寬度越大,圖的拓撲結構變化越緩慢.圖結構稀疏性由調諧參數(shù)λ(> 0)控制,λ越大,圖模型結構越稀疏.因此,在Lasso 時變圖模型結構中需確定3 個調諧參數(shù),分別為內核帶寬h、鄰域寬度d和稀疏性參數(shù)λ.我們通過交叉驗證來選擇這些參數(shù).

      為提供計算效率,更好應對高維數(shù)據(jù)問題,通過偽似然逼近算法.通過局部組Lasso 的L2范數(shù)懲罰方法估計模型參數(shù)[22-23].

      2 基于Lasso 圖模型方法的我國上證380 股指相關性分析

      2.1 數(shù)據(jù)來源

      本文將基于Lasso 圖模型方法應用于上證380 指數(shù)的股票價格數(shù)據(jù),分析個股數(shù)據(jù)間的關聯(lián)結構,樣本數(shù)據(jù)選取2014 年1 月2 日-2020 年3 月18 日.圖1 給出上證380 時間序列走勢.

      圖1 上證380 收盤價時間序列圖

      上證380 經歷快速上漲、極速下跌和震蕩階段.本文將部分上證380 交易不全的個股剔除,保留2014 年1 月2 日已上市的231 支股票,每只股票有1 513 個交易日的數(shù)據(jù).數(shù)據(jù)來源于同花順iFinD 數(shù)據(jù)庫①參見:同花順iFinD-金融數(shù)據(jù)終端http://www.51ifind.com/..

      對上證380 個股取對數(shù)收益率,設pi(t)表示第i只股票在時間t時的收盤價格,取對數(shù)價格收益率:ri(t)= lnpi(t) ? lnpi(t? 1).

      2.2 Lasso 圖模型結構分析

      為分析個股在關聯(lián)網絡中的地位和作用,本文用中心度來衡量和識別股票市場中與其他股票聯(lián)系最緊密的股票.度中心性(Degree Centrality)是最廣泛使用的中心性指標之一,它是指一個給定節(jié)點與其直接關聯(lián)的節(jié)點的關聯(lián)程度.

      利用Lasso 方法,給出樣本期間上證380 個股的圖模型結構,見圖2,計算通過R 語言程序實現(xiàn).

      圖2 上證380 個股的Lasso 圖模型

      根據(jù)上證股票行業(yè)分類標準將股票劃分為5 個行業(yè)類型:工業(yè)指數(shù)、公用指數(shù)、商業(yè)指數(shù)、綜合指數(shù)和地產指數(shù),用不同顏色標識不同行業(yè).表1 給出個股中心度排名靠前的股票,蘭花科創(chuàng)、紫江企業(yè)中心度相對較高,連接邊數(shù)相對較多.

      表1 點中心度排名靠前股票及邊數(shù)

      研究發(fā)現(xiàn)[1-14],不同市場階段,股票間的相關性可能存在差異.我們根據(jù)上證380 股票走勢,將樣本劃分為T1、T2 和T3 三個不同階段.T1 為2014 年1 月2 日-2015 年6 月16 日,上證380指數(shù)從3 000 左右上漲到10 000 多,處于快速上漲階段;T2 為2015 年6 月17 日-2016 年1 月28 日,上證380 指數(shù)從10 000 多下降到5 000 多,處于快速下跌階段;T3 從2016 年1 月29 日-2020 年3 月18 日,上證380 指數(shù)先緩慢下降,再上升然后下降,總體處于震蕩階段.對于不同階段股票樣本,取相同懲罰參數(shù)估計Lasso 圖模型結構,表2 給出3 個不同階段個股中心度排名靠前的股票和平均邊數(shù)量.

      表2 3 個不同時段個股點中心度排名靠前股票和平均邊數(shù)量

      由表2 結果可知,不同行情上證380 股票邊的數(shù)量大部分不同,這可能與當前公司盈利模式和宏觀形勢等因素密切相關.在T1 和T2 時段,上證綜指處于急漲和急跌階段,多數(shù)個股處于上漲態(tài)勢,邊連接情況相對平均.T3 階段處于行情震蕩階段,表現(xiàn)為個股邊數(shù)量之間波動較大.從邊數(shù)量來看,T1、T2 和T3 階段平均邊數(shù)量分別為10、23 和13 條,說明市場處于急跌階段,個股間的相關度較高.從個股相關度看,蘭花科創(chuàng)、伊力特、浙江醫(yī)藥和四川路橋在3 個行情階段有2 個階段排名靠前,表現(xiàn)比較穩(wěn)定.

      2.3 Lasso 時變圖模型結構分析

      根據(jù)不同行情階段分析可知,不同行情階段對個股相關度有一定影響.因此,基于時變圖模型理論,給出不同時點的我國上證380 個股收益率的無向圖模型結構,計算通過R 語言程序實現(xiàn).圖3 給出6 個不同時間點(等長度間隔取時間點)的圖模型結構.2014 年8 月13 日邊數(shù)量為300 條,2015 年6 月26 日邊數(shù)量為571 條,2016 年5 月10 日邊數(shù)量為250 條,2017 年7 月6 日邊數(shù)量為94 條,2018 年5 月18 日邊數(shù)量為255 條,2019 年4 月1 日邊數(shù)量為327 條.2014年8 月上證股市為牛市初期,呈現(xiàn)持續(xù)平穩(wěn)上漲階段,邊數(shù)量為300 左右,2015 年6 月上證380牛市達到最高峰值,并處于快速下跌拐點,邊數(shù)量較多達到500 多.2015 年6 月-2016 年5 月,股市中間雖有反彈,但總體處于下跌階段,邊數(shù)量為250 條左右.2016 年5 月-2017 年7 月,股市處于震蕩行情,邊數(shù)量最少,不足100 條.2017 年8 月-2018 年5 月,股市有出現(xiàn)一波上漲行情,股市相關性有所增強,邊數(shù)量超過200 條.2018 年5 月-2018 年12 月股市呈現(xiàn)單邊下行階段,2019 年1 月-2019 年4 月,股市迎來一段小牛市,股市相關性進一步增強,邊數(shù)量超過300 條,即個股變量選擇集中與之相關的個股數(shù)明顯增加.

      圖3 6 個不同時點上證380 個股Lasso 無向圖

      根據(jù)上證380 行業(yè)指數(shù)行業(yè)分類,分析不同行業(yè)內部和行業(yè)間時變的帶有權重的圖模型結構見圖4.在帶有權重的圖模型中,每個點代表一個行業(yè),每條邊寬度與各個行業(yè)間邊連接數(shù)量成比例,具體定義為行業(yè)間可觀測到的邊數(shù)量除以行業(yè)間可能存在的邊數(shù)量(跨行業(yè)間小于0.001%的邊不顯示).

      圖4 6 個不同時點上證380 行業(yè)指數(shù)帶有權重的圖結構

      上證380 股指中,地產行業(yè)指數(shù)中心度相對較高,跟其他行業(yè)指數(shù)聯(lián)系比較密切.除2017年7 月6 日股市震蕩期外,地產和商業(yè)行業(yè)指數(shù)均有邊連接,且在2014 年8 月13 日、2016 年5月10 日、2018 年5 月18 日、2019 年4 月1 日邊連接寬度最高,關聯(lián)最為密切.2015 年6 月26日,地產指數(shù)和公用事業(yè)邊寬度最高,聯(lián)系最為密切.地產行業(yè)指數(shù)為上游行業(yè),對商業(yè)貿易和公用行業(yè)指數(shù)的能源等相關產業(yè)均有顯著影響.綜合和公用行業(yè)指數(shù)在6 個時點均有邊連接,且在2014 年8 月13 日和2015 年6 月26 日聯(lián)系相對比較密切且穩(wěn)定.綜合行業(yè)和公用行業(yè)大多屬于服務業(yè),兩者之間關聯(lián)程度高.工業(yè)和商業(yè)在不同時點均有邊連接,說明工業(yè)和商業(yè)行業(yè)指數(shù)關系穩(wěn)定.

      從不同時點行業(yè)圖模型結構動態(tài)變化來看,在牛市階段(2014 年8 月13 日和2015 年6 月26 日),綜合和公用指數(shù)聯(lián)系關聯(lián)程度高.在熊市階段(2016 年5 月10 日和2018 年5 月18 日)和牛市初期(2014 年8 月13 日),地產和商業(yè)指數(shù)關聯(lián)程度較高.牛市頂峰階段(2015 年6 月26 日),地產和公用指數(shù)關聯(lián)程度最高.股市震蕩期(2017 年7 月6 日),行業(yè)指數(shù)連接較少,工業(yè)指數(shù)和其他行業(yè)指數(shù)均有邊連接,說明工業(yè)指數(shù)在經濟運行中的核心地位.

      以上圖模型結構選取了6 個等長度間隔時間點,圖5 給出這6 個時間點內的行業(yè)內邊連接比例(行業(yè)內邊數(shù)量除以所有可能的行業(yè)內邊數(shù)量)時變圖,可以看出,地產行業(yè)指數(shù)內部連接比較密切,呈現(xiàn)先下降后上升態(tài)勢,說明地產行業(yè)指數(shù)個股出現(xiàn)分化情況.公用、工業(yè)、商業(yè)和綜合行業(yè)指數(shù)內部邊比例大體呈現(xiàn)先上升后下降再上升發(fā)展態(tài)勢,跟個股邊數(shù)量比較吻合,其中商業(yè)行業(yè)內部個股聯(lián)動性相對較強.公用事業(yè)行業(yè)2016 年前牛市階段邊內部連接較多,2016 年后行業(yè)內部聯(lián)動性明顯變弱.

      圖5 各行業(yè)內邊比例對比圖

      3 結論

      本文提出高維數(shù)據(jù)變量選擇的Lasso 圖模型,并將該方法應用于上證380 股票指數(shù)分析股票間的關聯(lián)結構.首先,采用靜態(tài)Lasso 圖模型方法分析個股網絡結構及中心度,發(fā)現(xiàn)蘭花科創(chuàng)、紫江企業(yè)等個股中心度較高,邊數(shù)量較多,跟其他股票關聯(lián)度較強.為分析行業(yè)對股票關聯(lián)度的影響,分不同階段進行Lasso 圖模型估計,結果表明上證380 個股在極速上升期與極速下跌期關聯(lián)性較強.

      考慮到股市間相互關聯(lián)和影響的結構變化特征,本文利用時變Lasso 圖模型分析上證380 股票的關聯(lián)結構,該方法能同時分析個股和行業(yè)間的關聯(lián)結構,結果表明不同時點的上證380 個股和行業(yè)的圖模型結構均存在較大差異,股票關聯(lián)結構呈現(xiàn)動態(tài)變化特征.快速上升期(牛市)和快速下跌期(熊市),圖模型邊連接較多,關聯(lián)結構較強;震蕩期,個股和行業(yè)圖模型邊數(shù)量較少,關聯(lián)性相對較弱.地產行業(yè)指數(shù)中心度較高,與商業(yè)行業(yè)關聯(lián)結構密切且比較穩(wěn)定,行業(yè)內部個股關聯(lián)度高.公用行業(yè)指數(shù)和綜合行業(yè)指數(shù)邊連接比較穩(wěn)定,工業(yè)行業(yè)指數(shù)跟其他行業(yè)指數(shù)邊連接也較穩(wěn)定.

      本文通過Lasso 圖模型方法識別高維數(shù)據(jù)變量時變的動態(tài)關聯(lián)程度.以往研究[1-11]建立高維時間序列模型時往往受限于維數(shù)禍根問題,不能對參數(shù)進行有效估計,且大多是基于靜態(tài)圖模型結構.本文引入結構稀疏化學習后的Lasso 圖模型建模方法可有效處理高維數(shù)據(jù)問題,能同時給出變量選擇和參數(shù)估計結果,時變圖模型能更好地刻畫金融資產相關結構的動態(tài)性,股市相關結構識別效果較好,能有效推動變量復雜網絡結構的方法論研究.基于非線性時間序列圖模型的網絡結構關系分析是未來研究拓展的重要方向之一.

      猜你喜歡
      時變個股股票
      連續(xù)上漲2天以上的31只個股
      基于時變Copula的股票市場相關性分析
      智富時代(2017年4期)2017-04-27 17:08:47
      本周創(chuàng)出今年以來新高的股票
      本周創(chuàng)出今年以來新高的股票
      本周連續(xù)上漲3天以上的股票
      近期連續(xù)漲、跌3天以上的股票
      房地產開發(fā)Ⅱ個股表現(xiàn)
      航空運輸Ⅱ個股表現(xiàn)
      煙氣輪機復合故障時變退化特征提取
      近期連漲三天以上的個股
      灵武市| 乐都县| 潼关县| 邯郸市| 萨嘎县| 万年县| 林甸县| 平陆县| 古丈县| 舒兰市| 新蔡县| 广灵县| 天柱县| 铜鼓县| 湾仔区| 内乡县| 鄯善县| 济阳县| 彰化市| 日照市| 贵德县| 赣榆县| 遵义县| 山丹县| 綦江县| 德阳市| 宜川县| 易门县| 巴塘县| 昭平县| 古浪县| 冀州市| 安新县| 渭源县| 大化| 金川县| 政和县| 星子县| 阜阳市| 遂昌县| 阿拉善左旗|