• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于主題動態(tài)模型的法律因果關系研究

      2017-02-20 02:20:00張瑞祥王東波
      政法論叢 2017年1期
      關鍵詞:流行性因果關系動態(tài)

      張瑞祥 王東波

      (1.江蘇省司法廳研究室,江蘇 南京 210024;2.南京農(nóng)業(yè)大學信息科學技術學院,江蘇 南京 210095)

      基于主題動態(tài)模型的法律因果關系研究

      張瑞祥1王東波2

      (1.江蘇省司法廳研究室,江蘇 南京 210024;2.南京農(nóng)業(yè)大學信息科學技術學院,江蘇 南京 210095)

      主題動態(tài)模型為探究學科研究趨勢和主題演化形式提供了新的思路,使用該模型對法律因果關系進行分析可有效驗證模型的有效性并為推廣模型提供經(jīng)驗,并且針對學科研究內(nèi)容的分析也為學科整體發(fā)展提供了有益的支持。通過對2009-2013年的5494篇因果關系相關文獻的主題動態(tài)分析,所取得的結果驗證了主題動態(tài)模型在應用于因果關系學科上的有效性,同時基于主題動態(tài)模型的分析結論,對學科研究歷史的變遷進行了總結和評述。由于主題動態(tài)模型是一種新提出的研究方法,并且缺乏在人文社會科學上的應用,從而導致本研究缺乏對其他學科進行橫向性能的比較。

      主題動態(tài)模型 因果關系 流行性 連續(xù)性

      一、導論

      學科研究主題的變遷、研究群體規(guī)模的變動、研究興趣的轉(zhuǎn)移以及知識擴散和流動的方向一直是情報科學關注的主題。以共詞網(wǎng)絡[1]P599-605、主題網(wǎng)絡[2]P79-82、作者合作網(wǎng)絡[3]P121-126、共引網(wǎng)絡[4]P93-98和共被引網(wǎng)絡[5] P80-8為主的科學知識網(wǎng)絡是認知科學領域結構的主要手段(Yan等,2012)[6]P140-153。這些基于網(wǎng)絡的思想被應用到論文、作者、期刊、主題、機構等不同的學術實體層次,輔之以知識挖掘技術和復雜網(wǎng)絡技術,取得了豐碩的研究成果[7]P98-110。最初的基于網(wǎng)絡的方法集中于討論給定時間區(qū)間的科學知識網(wǎng)絡,難以反映學科主題的動態(tài)變化和知識的流動。隨著靜態(tài)方法的逐漸成熟,基于時間窗口的動態(tài)方法的研究逐漸成為研究的熱點。Radicchi(2009)以相同數(shù)量的引文為間隔,對科技論文的作者順序和成果分配進行了分析[8]P56-64。Sugimoto(2011)使用LDA方法對北美圖情論文進行了主題分析,按照相同數(shù)量的發(fā)文為間隔,研究了學科發(fā)展的主題變遷[9]P185-204。Barabási(2002)以作者共發(fā)文情況構建的復雜網(wǎng)絡為基礎,使用累積間隔法對作者合作情況進行了描述[10]P590-614。對研究主題的探究不僅有助于研究者從宏觀的角度上把握某一個學科或者某一研究領域的整體演化情況而且有益于揭示該學科或該領域的研究熱點和研究趨勢。

      基于主題內(nèi)容的動態(tài)演進的描述方法、時間間隔的選取和相關理論已經(jīng)得到應用,但對于主題本身的動態(tài)性質(zhì)的研究還較為缺乏。Erjia(2014)[11]P70-86提出了一種測量研究主題連續(xù)性和流行性的范式,并以10年的圖情領域文獻為測試數(shù)據(jù),驗證了該范式的合理性和統(tǒng)計特征。但該文同時也指出,圖情領域的文獻上驗證的規(guī)律并不能必然推斷整個科學領域的規(guī)律。本文以Erjia的研究范式為基礎,以法律中重要的“因果關系”為數(shù)據(jù)對象,對該研究領域中主要主題的流行性、研究趨勢進行了分析和判斷。

      因果關系是一個歸屬概念,意在使已然存在的特定結果被認可為作為問題的特定行為的具體實現(xiàn)。因果關系因其對行為主客觀面性質(zhì)的影響而成為法學理論幾百年來不可回避的話題[12]P44-56。近年來,醫(yī)療、食品安全和交通等領域的現(xiàn)實問題對因果關系的研究提出了新的機遇和挑戰(zhàn)[13]P1423-1434,研究分支擴散和融合的趨勢漸現(xiàn)。同時,傳統(tǒng)的自然科學式的研究方式雖然在應對日益復雜的社會需求獨木難支,但仍然占據(jù)著主要地位。因此,本文選擇法律因果關系作為學科動態(tài)的研究對象,其復雜并處于快速演進階段的學科特質(zhì)有助于驗證主題動態(tài)模型的性能和效果,同時,主題動態(tài)模型對于主題連續(xù)性和流行性的描繪也有利于厘清因果關系在不同的社會領域的研究熱點、學科發(fā)展趨勢和脈絡。

      二、數(shù)據(jù)來源

      本文以中國知網(wǎng)數(shù)據(jù)庫近5年收錄的涉及法律因果關系的全部文獻為數(shù)據(jù)來源。檢索時設定期刊所屬學科為“社會科學Ⅰ輯”中的“法理、法史”、“憲法”、“行政法及地方法制”、“民商法”、“刑法”、“經(jīng)濟法”、“訴訟法與司法制度”和“國際法”。檢索式為“SU='因果關系'”,時間窗口為2009至2013年(含),所獲取論文信息經(jīng)人工校對后,共保留5494篇。統(tǒng)計數(shù)據(jù)如表1所示。

      從表1可以看出,近五年來法律因果關系的論文從整體上呈現(xiàn)出上升的趨勢,從2011年起年均總量達到了千篇以上,其中2012年的增幅最大,比2009年增加了524篇。法律因果關系目前論文的總量為通過主題動態(tài)模型分析因果關系確保了數(shù)據(jù)的充分性和有效性。

      表1 法律因果關系論文數(shù)量表(2009-2013)

      論文數(shù)據(jù)包括論文標題、發(fā)表年份、文章摘要和關鍵詞信息,部分數(shù)據(jù)示例如表2。5494篇法律因果關系的論文全部進行了數(shù)據(jù)清洗,在清洗的過程中,對于標題和摘要當中出現(xiàn)的亂碼、不規(guī)則的字符、缺失的文字均逐一進行了刪除、更改和補充。從主題動態(tài)模型對信息多維度處理能力的角度考慮,在分析因果關系的過程中不僅使用了標題和關鍵詞單一維度的特征知識而且使用了摘要當中多維度的特征知識。

      表2 論文數(shù)據(jù)示例表

      三、研究方法

      (一)主題提取

      從自然語言處理的角度來看,主題可以被表示成詞項概率分布的空間向量模型[14]P65-72。在主體模型中,核心問題在于求得兩個分布:各主題下的詞項分布和各文檔的主題概率分布。例如,在本文的論文語料基礎上得出的流行性最高的主題為“因果關系的行為客觀面”,該主題由345個詞項組成,其中273個詞項的概率小于0.01%。該主題的空間向量模型可以表示為{因果關系:0.32;犯罪構成:0.25;交通事故:0.13;死亡:0.08道路交通事故:0.05;刑法:0.02 ……}。文檔中的詞項根據(jù)這兩個概率分布可以變換為主題概率分布,從而大大縮減文檔向量表示的維度。

      LDA(latent dirichlet allocation)及其擴展模型被廣泛應用于主題提取領域。本文使用LDA模型進行主題提取。Blei等人于2003年提出了LDA模型,該模型在識別大規(guī)模文檔集中潛藏的主題信息效果良好,可較好的識別出語義上存在隱含分布傾向的非高頻詞匯,數(shù)據(jù)結構為一個生成性的3層貝葉斯網(wǎng)絡[15]p993-1022。LDA利用Dirichlet分布的共軛性質(zhì),后驗函數(shù)可以輕易轉(zhuǎn)換為先驗函數(shù),加強了算法的實時性和運算速度。LDA的算法如下:

      設文獻集合共有m個文檔,共包含v項詞匯,k個可能生成的隱含主題,則每個主題在詞匯集合上服從多項式分布θz,每個主題在文檔集合上服從多項式分布φd。主題模型通過定義α和β模型的超參數(shù),使得k個主題中詞項分布概率θz服從基于超參數(shù)α的Dirichlet分布,文檔d的概率分布φd服從基于超參數(shù)β的Dirichlet分布。在實際計算中,常用Gibbs Sampling采樣方法基于公式(1)(2),利用超參數(shù)反向求解主題在詞匯m上的先驗分布φm和主題在文檔d上的先驗分布θd,并用主題-詞匯分布矩陣V和主題-文檔分布矩陣D表示對應計算結果。迭代計算中參數(shù)含義詳見表3。

      (公式1)

      (公式2)

      在公式(1)和(2)的基礎上,對于公式當中所涉及的不同的參數(shù),結合法律因果關系,本文進行了逐一的對應和解釋,具體見表3。

      表3 LDA模型的Gibbs Sampling方法變量及其含義

      (二)主要算法

      1.主題差異度計算

      法學的因果關系是一個正處于快速演進中的話題,因此使用主題差異度計算是跟蹤因果關系的主題在不同時間區(qū)間內(nèi)演進的必要手段,本文使用Jensen-Shannon divergence(JSD)方法作為測定主題差異度的算法指標。JSD可以評價不同概率分布下的信息熵差異,被廣泛應用于文本挖掘領域。作為信息增益算法(Kullback-Leibler divergence)的改進版本,JSD彌補了KL距離的非對稱性問題,并且參數(shù)更為平滑。Lee(2001)指出,JSD方法比基于幾何距離的度量方法更有效[14]。主題P和Q的JSD值如下:

      JSD(P‖Q)=1/2D(P‖M)+1/2D(Q‖M)

      (公式3)

      其中M=1/2D(P+Q),D(P‖M)是P和M的KL距離,當P和M是離散變量時,D(P‖M)=∑iP(i)lnp(i)/M(i),當P和M是連續(xù)變量時,D(P‖M)=∫P(x)lnp(x)/M(x)dx。JSD值越大,表示兩個主題之間的相似度越小。

      2.主題流行系數(shù)

      主題流行系數(shù)指在一定的時間區(qū)間內(nèi),所有的文檔中對指定主題的總支持量,可以用來測度主題在時間區(qū)間內(nèi)的熱度。對于具有一定歷時時間跨度的法律因果文獻來說,基于這一指標對法律因果關系進行主題流行系數(shù)的探究具有特定的意義和價值。θm,k表示m文檔生成k主題的概率,主題k的流行系數(shù)為:popularity(k)=∑mθm,k。

      3.動態(tài)主題識別算法

      主題識別算法是面向每一個時間區(qū)間內(nèi)的所有文獻分別進行的,因此不同時間區(qū)間提取出的主題必然有所區(qū)別,動態(tài)主題識別算法將相鄰的兩個時間段的主題進行按其JSD值進行連接。設i是前時間段中一個主題,N是后時間段的主題集合,ε是預設的JSD差異度閾值,大于該值表示不接受主題相似假設,求N中與i對應的主題算法如下所示。本文設定的閾值ε為0.3。具體計算由如下三步組成:1.對于N中的每一個主題j,求得主題j和i的差異度JSD(i,j);2.搜索與主題i差異度最小的主題k,k=αrgmaxjJSD(i,j)3.如果JSD(i,k)小于預設閾值ε,則k為i的對應主題,否則N中不存在i的對應主題。

      (三)主題流行性和連續(xù)性

      1.主題流行性

      Erjia指出,當某個主題連續(xù)5個時間段中均能被連續(xù)識別,則可以根據(jù)其流行系數(shù)擬合的一元線性方程的斜率變化確定其流行性狀態(tài)。而本文選取的文獻發(fā)表時間范圍為5年,因此設定連續(xù)的3個時間段為篩選標準。主題流行性狀態(tài)分為三種:穩(wěn)定態(tài),上升態(tài)和下降態(tài)。波動態(tài):-0.5<=slope<=0.5,表示主題的流行系數(shù)在一定范圍內(nèi)波動,從具體研究主題上看,波動態(tài)主要體現(xiàn)出該領域在研究內(nèi)容、研究方法和理論探究上主題的多樣性和變化性。上升態(tài):slope>0.5,表示主題的流行系數(shù)隨時間段上升,根據(jù)學科具體的研究,上升態(tài)的研究主要表明相應的主題在一定的時間區(qū)間內(nèi)受到了持續(xù)和高強度的關注。下降態(tài):slope <-0.5,表示主題的流行系數(shù)逐時間段下降,表明某一時間區(qū)間內(nèi)的研究主題隨著社會的變化、時代的變遷,受關注的程度逐步在下降。其中,slope表示流行性系數(shù)的斜率,是衡量主題穩(wěn)定態(tài)、上升態(tài)和下降態(tài)的核心指標。

      2.主題連續(xù)性

      依據(jù)主題在連續(xù)時間段中JSD變化的趨勢,主題的連續(xù)性狀態(tài)分為以下幾種。突現(xiàn)主題:在之前的時間段內(nèi)未出現(xiàn)過,但在某一個時間段突然出現(xiàn)并持續(xù)兩個或兩個以上時間段,在學術主題上則表現(xiàn)出相應的研究受到了廣泛而高度的關注。轉(zhuǎn)換主題:兩個或兩個以上主題在下一個時間段合并轉(zhuǎn)換至一個主題之內(nèi),在具體的研究上表現(xiàn)出已有的研究在研究方法、研究策略或理論探究模式上融入了其他的研究主題當中。穩(wěn)定主題:主題在至少三個連續(xù)的時間區(qū)間內(nèi)均表現(xiàn)出較小的差異度,從研究上表現(xiàn)出這一類的研究受到了持久性的關注,并且是某一研究當中的基本和核心的探究問題。消亡主題:在某一個時間段內(nèi)出現(xiàn),但在之后的時間段內(nèi)不再出現(xiàn),主要表現(xiàn)出所研究和關注的問題,無論在研究方法還是在研究問題上基本上淡出了研究的序列。

      四、實驗結果和分析

      (一)提取主題概覽

      本研究對2009-2013年法律因果關系相關的5494篇論文首先進行了總體的主題提取,共獲取主題127個,表4給出了流行系數(shù)排名前10的主題。由于篇幅關系,本文所有的主題詞示例均只列出貢獻最大的前幾個主題詞,在選取的時候,根據(jù)具體的代表性,選取了每一個主題下的六個主題詞。

      從所選取的從流行系數(shù)看,排名前十的總流行系數(shù)總和為0.395,表示覆蓋的總體文章內(nèi)容接近總數(shù)的40%,表明因果關系的主要研究范疇相對集中,從一定程度上說明便于從這些研究范疇當中對法律因果關系進行探究。流行系數(shù)降序排列時,降幅逐漸變緩,這表示研究越分散的主題規(guī)模相差越小,體現(xiàn)了研究主題的關聯(lián)性。

      表4 流行系數(shù)排名前10的主題表

      從主題內(nèi)容來看,流行性較高的主題確實反映了因果關系研究的熱點和主要話題。在流行性最高的,流行系數(shù)大于0.05的主題中,最高的流行系數(shù)為0.113,通過所獲取到的“犯罪構成,交通事故,死亡”等主題詞,表述了因果關系在行為的客觀面認定中的核心意義,這正是部門法學研究的基礎問題。次高的流行系數(shù)為0.073,具體通過“受害人、當事人、舉證責任”等主題詞體現(xiàn)了因果關系內(nèi)涵由單純的事實判斷向事實與規(guī)范雙重判斷的發(fā)展趨勢,是最近幾年各部門法學的發(fā)展方向。在流行性系數(shù)為0.02至0.05的一般流行主題中,主要描述了社會熱點話題,比如醫(yī)療糾紛和侵權責任等。在流行性較低的主題中,因果關系的基礎理論和范式研究占據(jù)了主要地位。從總體上看,熱門主題體現(xiàn)了單純的事實判斷已經(jīng)不能滿足復雜的社會現(xiàn)實需要,可以認為,傳統(tǒng)的因果關系理論藉由現(xiàn)實完成了自我價值的升華,而歸責思想下的因果關系理論方興未艾、大有可為,因此,本文對主題的提取不僅回應了規(guī)范治理范式的需要,而且與理論研究的現(xiàn)狀完美融合。根據(jù)所獲取到的主題的分布,從流行系數(shù)的角度說明了基于主題動態(tài)模型對法律因果分析的可行性及針對性。

      (二)主題流行性分析

      對于每一年的研究論文分別進行主題提取,并根據(jù)動態(tài)主題識別算法匹配相鄰時間段的主題,得到的統(tǒng)計結果如表5所示。和表1對比可以發(fā)現(xiàn),主題的數(shù)量和該年的發(fā)文總數(shù)量成正比,在設定差異度閾值ε為0.3時,與下一年可以匹配到的主題占比比較穩(wěn)定,大約在60%至75%之間,而在Eirc的研究中,取得同樣的匹配主題率時差異度閾值ε為0.2。

      表5 主題匹配統(tǒng)計表

      從表5可以看出,主題數(shù)目最多的是2012年,相應的這一年的論文數(shù)量也是最多,達到了1390篇,平均16篇文獻一個主題。而從下一年主題匹配的數(shù)量的角度看,也呈現(xiàn)出了隨著論文數(shù)量的增長匹配數(shù)量逐步增加的態(tài)勢,最多的58個仍然與論文總數(shù)量最多的2012年的年份密切關聯(lián)在一起。對于連續(xù)三年和三年以上得到匹配的主題的流行系數(shù)為因變量,以時間為自變量進行一元線性回歸,本研究共獲取到波動態(tài)主題23個,上升態(tài)主題17個,下降態(tài)主題12個。表6列出了三種狀態(tài)中系數(shù)特征相對明顯的前三位主題,主題詞是對該主題所有時間段匹配主題的合并和篩選。

      表6 主題前三位流行性表

      法學是極具實踐性的學科之一,與整個社會所關注的內(nèi)容是密切關聯(lián)在一起的。法學的實踐性體現(xiàn)為理論演繹結果的普遍可接受性。因此,法學理論在特定領域的研究往往呈現(xiàn)出體系性,這一體系又是與社會的熱點問題緊密關聯(lián)在一起的。上升態(tài)的主要主題集中于不同的因果關系的具體判斷,醫(yī)患關系、網(wǎng)絡輿情和環(huán)境治理都是社會關注的熱點問題,也是法學因果關系探討的前沿,充分體現(xiàn)了法學的實踐性。從具體上升態(tài)的主題上看,醫(yī)患關系是當前社會最為關注的話題之一,其在社會上的影響之大、波及之廣是非常具有代表性的,從上升態(tài)所選取的三個主題上看,其所得到的斜率最大,達到了0.82也充分說明了這一主題所被關注的程度。同時,這一主題所獲取到的主題詞充分說明了其斜率之所以大的原因,比如:患者、醫(yī)院、非法行醫(yī)、醫(yī)患關系等。在上升態(tài)這一大的主題中,斜率為0.75的是與互聯(lián)網(wǎng)相關的子主題,在21世紀對社會各個層面影響最大的莫過于互聯(lián)網(wǎng),而在法律因果關系中這一主題也得到了充分的體現(xiàn),在這一子主題當中所涉及到的主題詞“網(wǎng)絡實名、網(wǎng)絡犯罪、隱私權保護、網(wǎng)絡世界”也充分說明了這一點。波動態(tài)集中于普通民事行為、故意傷害和過失犯罪,這些盡管是一些老生常談的問題,但是在風險遍布各個角落的當下,這些話題被賦予了新的生命力,這一點從波動態(tài)這一主題當中所涉及到的主題詞就可以有所觀察,比如“運輸合同、信賴原則和監(jiān)督過失”。從所選取的波動態(tài)這一大的主題可以看出,構成這一主題的小的主題之間在斜率的值上上下浮動就非常的大,絕對值相差0.41,這一具體的值也說明了這一類主題的特點。下降態(tài)集中于危害結果、經(jīng)驗法則、刑罰基礎理論,這些主題對于法學基礎研究不可謂不重要,但在國內(nèi)外法學研究界已基本取得共識,構成了研究基礎,處于下降狀態(tài)也就在意料之中了,從斜率值上也可以看出下降類這一大的主題之間的小主題之間斜率值差距較小。

      (三)主題連續(xù)性分析

      主題連續(xù)性可以分為突現(xiàn)主題、穩(wěn)定主題、轉(zhuǎn)換主題和消亡主題四種。對主題連續(xù)性的整體狀況進行分析可以看出法律因果關系在研究主題上的整體變化狀況,有助于該領域的研究者把握新興的研究主題、跟蹤轉(zhuǎn)換的研究主題、熟知穩(wěn)定的主題和了解消亡的主題。在概念界定的基礎上,根據(jù)相應主題詞的分布,本研究對這四種主題進行了提取。獲取到突現(xiàn)主題134個,穩(wěn)定主題32個,轉(zhuǎn)換主題52個,消亡主題120個。根據(jù)定義,突現(xiàn)主題、轉(zhuǎn)換主題和消亡主題在第一年不存在,消亡主題在最后一年也不存在?;?494篇學術文獻所獲取到的主題連續(xù)性分布情況可以看出,在法律因果關系的探究上,突現(xiàn)出題和消亡主題的數(shù)量最多,一個為134,另一個為120,這從一定角度上說明了所獲取到的連續(xù)研究主題充分體現(xiàn)了這五年內(nèi)法律因果關系的研究演化情況,從一定程度說明了該領域的研究是非?;钴S的。從主題數(shù)量上可以發(fā)現(xiàn),突現(xiàn)主題和消亡主題的數(shù)量遠高于其他兩種,這說明因果關系是一個非常活躍的研究領域,新主題的誕生和舊主題的消亡頻繁發(fā)生。轉(zhuǎn)換主題的數(shù)量為52個,這彰顯出法學理論對因果關系研究的趨同性與整合性。穩(wěn)定主題的數(shù)量最少,經(jīng)過對數(shù)據(jù)的觀察,發(fā)現(xiàn)穩(wěn)定主題主要是流行系數(shù)排行前20的主題,這說明在因果關系研究領域,近五年來的主體話題變化不大。表7給出了四個主題中特征最為明顯的數(shù)據(jù)樣例。

      表7 主題前三位連續(xù)性表

      四個主題的代表性樣例大致符合法學研究的基本規(guī)律。法學理論對特定領域的研究與現(xiàn)實社會中出現(xiàn)的案例有關,因此,穩(wěn)定主題中的醫(yī)療、環(huán)境、交通領域的因果關系就恒常的成為研究的重中之重,因為這些領域在近五年內(nèi)受到了持續(xù)和廣泛的關注,在可預見的將來幾個領域的主題研究仍然是穩(wěn)定的。對于某一特定領域的研究必須以既定的理論體系為主導,在掃清研究對象關聯(lián)領域之后,再完成對核心問題點的研究,因此,消亡主題中作為法律責任構成要件的行為人、危害結果等等因素逐漸被冷落也是可以被理解的。法學理論對特定范疇的研究一開始無法擺脫哲學思想的控制,在研究深入后,則發(fā)展出體現(xiàn)自身學科特色的內(nèi)容,因此,必然因果關系、偶然因果關系等理論的合并與整合成為因果關系研究過程中不可避免的趨勢,轉(zhuǎn)化主題的趨勢也正驗證了這一點。此外,瀆職犯罪因果關系的研究成為突現(xiàn)主題既合理又有些疑問。如所周知,瀆職犯罪中的職關聯(lián)到所有的社會管理領域,故而,出現(xiàn)某一特定領域研究結論與瀆職犯罪因果關系的勾連并不令人詫異,然而,現(xiàn)實情況則是多學科領域內(nèi)的因果關系研究已然與瀆職犯罪因果關系密不可分,而且這種研究呈現(xiàn)出建基本學科并超脫本學科進而在宏觀上解讀瀆職因果關系的趨勢。這一趨勢是否能夠成為新的研究范式值得觀察。

      五、總結和展望

      隨著靜態(tài)方法的逐漸成熟,研究學科內(nèi)知識主題的動態(tài)分布和演變范式逐漸吸引了研究者的關注,然而,主題動態(tài)模型的理論還沒有在多個學科、廣泛的學術文獻庫和復雜多變的知識結構中得到廣泛的驗證。本文基于Erjia的主題動態(tài)模型,搜集了CNKI收錄的近五年法學“因果關系”研究相關的5494篇文獻并進行了主題提取,對得到的127個主題進行了流行性和連續(xù)性動態(tài)分析。

      從研究方法來看,主題動態(tài)模型基本可以適應“因果關系”這類處于快速演進階段的人文社科研究的動態(tài)分析需要,但部分參數(shù)和結果仍然值得推敲和深入研究。LDA方法對于主題的提取具有較強的可理解性,主題動態(tài)模型對于主題流行性和主題連續(xù)性的研究結果也基本符合法學研究者對于學科的一般認知。但也有一部分數(shù)據(jù)的結果值得推敲,例如,突現(xiàn)主題中的“瀆職犯罪”并不能解讀瀆職因果關系的研究趨勢。同時,模型的部分參數(shù)也和Erjia的研究略有不同,這是由于不同學科主題性質(zhì)的影響。

      從因果關系的研究內(nèi)容來看,法學是一門極具實踐性的學科,醫(yī)患關系、網(wǎng)絡輿情和環(huán)境治理都是社會關注的熱點問題,其主題流行性正逐年上升。既定的理論體系的研究逐漸完善,法律責任構成要件的行為人、危害結果等等因素逐漸被冷落,必然因果關系、偶然因果關系等理論的合并與整合成為因果關系研究過程中不可避免的趨勢。

      在下一步研究過程中,研究者將探索主題動態(tài)模型在不同類型的學科中的應用,統(tǒng)計其參數(shù)設置和分析效果的經(jīng)驗性因素。同時,通過對不同學科主題動態(tài)的變化分析這些學科的研究現(xiàn)狀和發(fā)展方向,為學科發(fā)展提供有益的支持。

      [1] 王曉光.科學知識網(wǎng)絡的形成與演化(Ⅰ):共詞網(wǎng)絡方法的提出[J].情報學報,2009,4.

      [2] 葉春蕾,冷伏海.基于共詞分析的學科主題演化方法改進研究[J].情報理論與實踐,2012,3.

      [3] 皇甫青紅,劉艷華,丁軍艷.國際社會網(wǎng)絡分析領域作者共被引網(wǎng)絡結構研究[J].情報雜志,2013,5.

      [4] 王超,呂俊生,吳新年.學術網(wǎng)絡研究進展[J].情報雜志,2013,10.

      [5] 苑彬成,方曙,劉合艷. 作者共被引分析方法進展研究[J].圖書情報工作,2009,22.

      [6] Yan, E., Ding, Y., Milojevic, S., & Sugimoto, C. R. Topics in dynamic research communities: An exploratory study for the field of information retrieval. Journal of Informetrics, 2012,6(1):140-153.

      [7] ErjiaYan. Research dynamics: Measuring the continuity and popularity of research topics[J].Journal ofInformetrics, 2014(8):98-110.

      [8] Radicchi, F., Fortunato, S., Markines, B., &Vespignani, A. Diffusion of scientificcredits and the ranking of scientists[J]. Physical Review E, 2009,80(5),56-64.

      [9] Sugimoto, C. R., Li, D., Russell, T. G., Finlay, C., & Ding, Y.The shifting sands of disciplinary development: Analyzing North American Library and Information Science (LIS) dissertations using Latent Dirichlet Allocation (LDA)[J]. Journal of the American Society for Information Science & Technology,2011,62(1):185-204.

      [10] Barabási, A. L., Jeong, H.,Neda, Z., Ravasz, E., Schubert, A., &Vicsek, T. Evolution of the social network of scientific collaborations[J]. Physica A: Statistical Mechanics and its Applications, 2002,311(3-4),590-614.

      [11] 陳興良. 從歸因到歸責:客觀歸責理論研究[J].法學研究,2006,2.

      [12] 肖本山.食品監(jiān)管瀆職罪的若干疑難問題解析[J].法律科學(西北政法大學學報),2012,3.

      [13] 徐戈,王厚峰.自然語言處理中主體模型的發(fā)展[J].計算機學報,2011,8.

      [14] Lee, L. On the effectiveness of the skew divergence for statistical language analysis. Artificial Intelligence and Statistics, 2001,53(2):65-72.

      [15] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3:993-1022.

      (責任編輯:黃春燕)

      Dynamic Analysis of Law Causality Based on Dynamic Topic Model

      ZhangRui-xiang1WangDong-bo2

      (1.Policy Research Office of Jiangsu Judicial Department, Nanjing Jiangsu 210024;2.College of Information Science and Technology, Nanjing Agricultural University, Nanjing Jiangsu 210095)

      Dynamic topic model (DTC) provides new solutions for tracing topic transformation history and predicting research trends. Analyzing the research content of law causality with DTC will verify the availability and generalization performance of the model. Also, the analysis of research content will offer a quantitate view for further subject development. This research implements DTC on 5494 papers published within 2009-2013 related to law causality, and the papers are selected from CNKI. By analyzing the dynamic topic model of 5494 papers published within 2009-2013 related to law causality, the result of the research verifies the availability of DCT on law causality. Meanwhile, and the analysis provides a landscape of subject history. DTC is a new paradigm with less empirical study on different research area and the application in humanistic and social science is lacking. As a result, this paper fails to make comparison with other subjects.DTC is to the point for dynamic analysis on the Chinese social subject under quick development.

      dynamic topic model; causality; popularity; continuity

      1002—6274(2017)01—155—07

      張瑞祥( 1980-),男,山東臨沂人,江蘇省司法廳研究室研究員,研究方向為法律信息學、司法矯正;王東波(1981-),男,山東菏澤人,信息資源管理博士,南京農(nóng)業(yè)大學信息科學技術學院副教授,研究方向為法律信息學。

      DF0-05

      A

      猜你喜歡
      流行性因果關系動態(tài)
      國內(nèi)動態(tài)
      國內(nèi)動態(tài)
      國內(nèi)動態(tài)
      小青龍湯在流行性感冒中的應用
      豬流行性腹瀉研究進展
      玩忽職守型瀆職罪中嚴重不負責任與重大損害后果的因果關系
      南大法學(2021年6期)2021-04-19 12:28:02
      流行性感冒
      動態(tài)
      做完形填空題,需考慮的邏輯關系
      豬流行性腹瀉2011-2017年
      麻栗坡县| 界首市| 巴林右旗| 射阳县| 增城市| 夏邑县| 于田县| 鄂托克前旗| 威远县| 安康市| 宜兰市| 龙游县| 许昌县| 曲阜市| 醴陵市| 孝昌县| 靖西县| 广元市| 五华县| 民县| 客服| 兴海县| 邯郸市| 祁连县| 吐鲁番市| 延庆县| 丰原市| 清河县| 盐津县| 泗水县| 威信县| 安阳市| 临沂市| 陇川县| 鹤岗市| 廊坊市| 九龙城区| 建水县| 延庆县| 北碚区| 沙田区|