裴雷,李向舉,謝添軒,成吉
(南京大學(xué)信息管理學(xué)院,南京 210093)
中國(guó)信息政策研究主題的歷時(shí)演進(jìn)特征(1986—2015年)*
裴雷,李向舉,謝添軒,成吉
(南京大學(xué)信息管理學(xué)院,南京 210093)
本文采用大樣本數(shù)據(jù)分析方法,對(duì)我國(guó)1986—2015年信息政策相關(guān)文獻(xiàn)、熱點(diǎn)主題的分布特征和規(guī)律進(jìn)行探索性研究。研究發(fā)現(xiàn),政策主題歷時(shí)演進(jìn)存在典型的主題差異和漲落特征,并且不同的主題區(qū)分尺度的研究結(jié)論具有較好的一致性和穩(wěn)定性,而從主題突變的時(shí)間分布中觀測(cè)到中國(guó)信息政策研究的典型四個(gè)分期,表明主題跟蹤方法在政策比較分析、政策預(yù)測(cè)中具有一定的可行性。
信息政策;熱點(diǎn)主題;主題跟蹤;階段劃分
信息政策的發(fā)展源于20世紀(jì)50年代初,信息技術(shù)的引入和信息工作特定時(shí)期誕生了以推動(dòng)信息利用和服務(wù)為目的的國(guó)家政策。而熱點(diǎn)體現(xiàn)為政策實(shí)踐和理論研究?jī)蓚€(gè)層面:我國(guó)信息政策實(shí)踐最早可追溯到建國(guó)初期的文獻(xiàn)保障服務(wù)政策;而理論研究則是以1981年能源保密政策為代表的科技保密政策研究作為起始[1]。1993年是中國(guó)信息政策研究的拐點(diǎn),隨著20世紀(jì)90年代初的科技信息機(jī)構(gòu)改革與轉(zhuǎn)型、1994年以后的信息化推進(jìn),信息政策理論和實(shí)踐逐步成為研究熱點(diǎn),關(guān)于信息化、信息產(chǎn)業(yè)、電子政務(wù)、政府信息公開、電子商務(wù)、信息安全等政策熱點(diǎn)次第出現(xiàn),構(gòu)成我國(guó)信息政策研究的主體[2]。
為刻畫信息政策研究的發(fā)展規(guī)律和主題演進(jìn)特征,研究者往往會(huì)提出信息政策發(fā)展的分期問(wèn)題。在以往研究中,發(fā)展階段分期和世代分期是典型方法。在發(fā)展階段分期中,萌芽期、發(fā)展期、成熟期、衰退期是典型的分期方法,但發(fā)展階段分期主要是基于標(biāo)志性歷史事件進(jìn)行判斷,而不同研究者對(duì)標(biāo)志性歷史事件的主觀研判具有一定偏差,進(jìn)而發(fā)展階段分期在不同學(xué)者研究中并不完全一致[3-5];世代分期則多以十年作為時(shí)間軸進(jìn)行假想階段區(qū)分,但可能對(duì)某些政策研究主題的持續(xù)發(fā)展進(jìn)行割裂[6-8]。而事實(shí)上,我國(guó)信息政策實(shí)踐周期多與“五年規(guī)劃”一致,五年分期更符合政策實(shí)際。
本文主要根據(jù)我國(guó)信息政策研究的主題“涌現(xiàn)”,采用五年分期方式描述個(gè)體差異,聚焦刻畫政策研究的主題演進(jìn)。相對(duì)以往針對(duì)政策文獻(xiàn)數(shù)量的計(jì)量和統(tǒng)計(jì)分析[9-11],本文更注重政策主題在時(shí)序上的演進(jìn)和漲落特征。
2.1 中國(guó)信息政策文獻(xiàn)的采集
一直以來(lái),信息政策是一個(gè)易于理解、卻難以界定的術(shù)語(yǔ),寬泛、多元和缺乏統(tǒng)一的范疇[12],信息范疇和政策范疇并未形成固定概念,在具體研究環(huán)境中,或依據(jù)研究對(duì)象的指向進(jìn)行界定,或根據(jù)政策制定機(jī)構(gòu)的管轄范圍進(jìn)行界定[13-14]。對(duì)政策的理解也存在狹義和廣義的區(qū)分,廣義的信息政策將信息法律也納入研究范疇。
本文在文獻(xiàn)采集中采納廣義概念,在主題范疇上則主要參照我國(guó)信息政策實(shí)踐。根據(jù)對(duì)中國(guó)59 751項(xiàng)信息政策的主題標(biāo)引(自建數(shù)據(jù)庫(kù)),共涉及47個(gè)一級(jí)主題,其中信息公開、電子商務(wù)、電子政務(wù)、信息產(chǎn)業(yè)、保密政策、知識(shí)產(chǎn)權(quán)、信息安全、科技創(chuàng)新、文化產(chǎn)業(yè)、信息化10個(gè)一級(jí)主題相關(guān)的信息政策占總量的62%,為中國(guó)主要信息政策主題。因此,本文以“信息政策、信息法律、信息立法”為標(biāo)題檢索入口詞進(jìn)行第一輪檢索,去重后得到2 797 篇研究文獻(xiàn);并以“政策主題+(‘政策’or‘法律’)”作為標(biāo)題檢索入口詞,將時(shí)間限定在1986—2015年進(jìn)行聯(lián)合檢索。合并兩輪檢索結(jié)果,剔除沒(méi)有實(shí)際意義和不相關(guān)文獻(xiàn),共得到6 373 篇研究文獻(xiàn)(見圖1)。文獻(xiàn)分布表明,信息政策研究文獻(xiàn)將保持持續(xù)增長(zhǎng)趨勢(shì),證實(shí)中國(guó)信息政策領(lǐng)域的研究活力與成長(zhǎng)潛力。
圖1 信息政策研究文獻(xiàn)的時(shí)間分布
2.2 信息政策研究主題跟蹤研究方法
(1)信息政策研究主題的定義。信息政策文獻(xiàn)研究主題包括初始定義主題以及檢索文獻(xiàn)的描述主題,后者可通過(guò)關(guān)鍵詞、標(biāo)題和摘要等不同語(yǔ)料進(jìn)行提取和清洗。具體而言,本文的研究主題定義包括三個(gè)層面。
第一,政策主題領(lǐng)域分類,即初始定義的10個(gè)主題領(lǐng)域,主題頻數(shù)描述是文獻(xiàn)數(shù)量,以該主題檢索入口所得的有效文獻(xiàn)數(shù)量表示。特別地,跨主題文獻(xiàn)可重復(fù)計(jì)入不同主題統(tǒng)計(jì)口徑,因而得到總頻次6 776 次。
第二,關(guān)鍵詞主題,由研究文獻(xiàn)的關(guān)鍵詞描述。在研究中因關(guān)鍵詞質(zhì)量差異較大,需進(jìn)行規(guī)范、合并和清洗,最終得到表意能力比較突出并具有一定排他性的10 948個(gè)關(guān)鍵詞主題,共計(jì)詞頻34 779 次。其中,排名前40位的關(guān)鍵詞主題占總詞頻的27.0%,詞頻大于10的前247個(gè)關(guān)鍵詞主題占總詞頻的41.2%,具有一定典型性。
第三,自然語(yǔ)言分詞主題。即對(duì)關(guān)鍵詞進(jìn)行分詞處理,以提取更小尺度的語(yǔ)義概念,構(gòu)成信息政策的元主題。因一些論文關(guān)鍵詞質(zhì)量較差,影響政策主題的語(yǔ)義表達(dá),自然語(yǔ)言處理雖破壞了政策概念的完整性,但對(duì)更小尺度的概念分析具有一定顯示度,其研究也具有啟發(fā)性。按照分詞方法,從文本集中提取到5 781 個(gè)自然語(yǔ)言分詞主題,共計(jì)詞頻6 639 次。其中,前10%的高頻主題占總詞頻的79.1%,排名前40位的詞頻占總詞頻的40.4%,而詞頻大于20的前706 個(gè)自然語(yǔ)言分詞主題占總詞頻的78.1%,具有實(shí)際政策意義的自然語(yǔ)言分詞主題共390個(gè)。
(2)信息政策主題突變與跟蹤方法。識(shí)別并跟蹤學(xué)科發(fā)展主題(Topic Detection and Tracking)是學(xué)科前沿理解和政策決策分析的重要手段,也是當(dāng)前信息檢索研究的熱點(diǎn)命題。從方法上看,存在大量統(tǒng)計(jì)學(xué)性質(zhì)的方法識(shí)別[15-18]、基于引文和耦合聚類的可視化方式[19-21],還有大量主題識(shí)別和機(jī)器學(xué)習(xí)方法[22-23]。本文并非探索主題跟蹤方法的優(yōu)劣,而主要是對(duì)兩種方法的分析結(jié)果進(jìn)行比較研究。
第一,采用累積增長(zhǎng)曲線和頻次熱圖兩種可視化圖形方法,跟蹤和描述三類政策主題隨時(shí)間的頻度變化,并根據(jù)累積增長(zhǎng)曲線判斷政策主題計(jì)量的極值和拐點(diǎn),利用熱圖描述政策主題群的個(gè)體演進(jìn)規(guī)律并進(jìn)行輔助判斷。
第二,運(yùn)用時(shí)間序列聚類法測(cè)算政策主題的突變點(diǎn)或局部突變點(diǎn)[18]。假定某一主題n年研究樣本序列中第i年的頻次為并且第τ年為突變點(diǎn),則有
3.1 中國(guó)信息政策主題歷時(shí)演進(jìn)的可視化描述
分別對(duì)政策主題領(lǐng)域分類、典型關(guān)鍵詞主題和自然語(yǔ)言分詞主題進(jìn)行歷時(shí)跟蹤,并繪制對(duì)應(yīng)的累積增長(zhǎng)曲線和頻次熱圖(見圖2),發(fā)現(xiàn)不同層次主題的統(tǒng)計(jì)中,信息政策主題均存在差異增長(zhǎng)和漲落現(xiàn)象,并且呈現(xiàn)出相似的主題漲落趨勢(shì)。
第一,不同主題分類方式的整體演進(jìn)趨勢(shì)一致。主題領(lǐng)域分類的累積增長(zhǎng)曲線在1993—1994年、1998—2001年、2006—2007年以及2009—2010年存在顯著的四個(gè)快速增長(zhǎng)階段;關(guān)鍵詞主題累計(jì)增長(zhǎng)曲線波動(dòng)更加劇烈,但具有相似的高速增長(zhǎng)時(shí)段,即1993—1994年、1998—2000年、2006—2007年以及2012—2013年,并新增1995—1997年的快速增長(zhǎng)階段;自然語(yǔ)言分詞主題則形成1993—1994年、1998—2001年、2006—2007年和2012—2013年的四個(gè)典型增長(zhǎng)高峰期,同時(shí)2002—2005年的增長(zhǎng)也比較明顯。從熱圖色溫變化形狀看,三者的分布熱圖和漸變熱圖基本一致,體現(xiàn)出相似的整體演進(jìn)趨勢(shì)。
第二,不同主題分類方式的分區(qū)政策熱點(diǎn)基本一致。因政策主題的個(gè)體在表述和內(nèi)涵上存在差異,因而分區(qū)熱點(diǎn)的描述存在一定異同:從主題領(lǐng)域分類看,知識(shí)產(chǎn)權(quán)、電子商務(wù)、科技創(chuàng)新、文化產(chǎn)業(yè)和信息化的政策主題熱度更高;在關(guān)鍵詞主題中,知識(shí)產(chǎn)權(quán)、電子商務(wù)、個(gè)人信息、稅收政策和文化創(chuàng)意產(chǎn)業(yè)的政策主題熱度更高,并且引入了更多細(xì)分主題,政策主題的觀測(cè)范圍更大;在自然語(yǔ)言分詞主題中,信息、政策、法律、電子、產(chǎn)業(yè)、知識(shí)、保護(hù)、產(chǎn)權(quán)等主題片段提及率最高,雖在表述上破壞了關(guān)鍵詞術(shù)語(yǔ)的完整性,但在語(yǔ)義層面的主題片段與關(guān)鍵詞主題保持一致。
第三,不同主題分類方式的政策概念詞頻漲落基本一致。政策概念詞頻漲落,能夠揭示政策主題的變動(dòng)規(guī)律。如圖2所示,無(wú)論是左半?yún)^(qū)峰值與谷值的分布,還是右半?yún)^(qū)黑區(qū)與白區(qū)的分布,都顯示2000—2010年是波動(dòng)比較劇烈的區(qū)間。雖然政策主題波動(dòng)的個(gè)體差異性仍存在,但均顯示出相似的整體漲落趨勢(shì)。從政策主題的個(gè)體調(diào)查看,1994年以后個(gè)人信息、會(huì)計(jì)信息、隱私權(quán)、科技創(chuàng)新、網(wǎng)絡(luò)安全、產(chǎn)業(yè)發(fā)展政策和信息安全政策等主題增長(zhǎng)幅度比較明顯,而信息化、稅收政策、反壟斷、信息市場(chǎng)、信息公開、信息通信等政策主題在部分年份出現(xiàn)了大的衰退。
3.2 中國(guó)信息政策的主題突變期測(cè)算與分布
分別對(duì)政策主題領(lǐng)域分類、典型關(guān)鍵詞主題和自然語(yǔ)言分詞主題進(jìn)行主題突變期的測(cè)算,并統(tǒng)計(jì)政策主題突變期的時(shí)間分布,得到突變期的時(shí)間分布曲線(見圖3)。從而發(fā)現(xiàn),典型關(guān)鍵詞主題和自然語(yǔ)言分詞主題具有相似的峰值分布和增長(zhǎng)軌跡。
如表1所示,自1992年開始,處于突變期的政策研究主題分布顯著增多,說(shuō)明信息政策研究開始加快發(fā)展;1993—2000年是信息政策研究高速發(fā)展時(shí)期,1999年達(dá)到峰值,說(shuō)明此階段新興的研究概念大量涌現(xiàn),抑或過(guò)去研究術(shù)語(yǔ)快速衰退;2001—2007年是穩(wěn)定發(fā)展階段,新興研究術(shù)語(yǔ)的增長(zhǎng)幅度顯著降低,但總的概念頻度增長(zhǎng)明顯;2007年以后進(jìn)入發(fā)展穩(wěn)定期,尚未出現(xiàn)衰退跡象。
圖3 信息政策主題突變期的時(shí)間分布
表1 信息政策研究主題突變期的時(shí)間分布
3.3 中國(guó)信息政策頻度漲落與主題突變期分布比較
從政策主題的頻度漲落和突變主題的分布密度比較,具有三個(gè)特點(diǎn)。
第一,主題頻度漲落比較明顯的1993—1994年、1998—2000年,也是突變主題分布比較密集的時(shí)間階段,因而可以判定上述兩個(gè)時(shí)間階段是中國(guó)信息政策研究的關(guān)鍵轉(zhuǎn)變時(shí)期;2006—2007年體現(xiàn)為主題頻次的突增,而未體現(xiàn)出突變主題的明顯增加;2012—2013年的突變主題密度不明顯,可能因?qū)Φ湫驼咧黝}進(jìn)行了截頻處理,從而使最新涌現(xiàn)的低頻政策概念無(wú)法計(jì)量。
第二,不同主題的頻度漲落與突變期分布關(guān)系并不顯著。以領(lǐng)域主題分類為例(見表2),相對(duì)比較一致的是電子商務(wù)和電子政務(wù)主題,其突漲時(shí)間與突變點(diǎn)基本一致,其他主題的頻度漲落與突變期關(guān)系并不顯著。典型關(guān)鍵詞主題和自然語(yǔ)言分詞主題也具有類似的特征。
表2 信息政策研究領(lǐng)域主題分類突變期與頻次漲落比較
第三,漲落與突變均具有一定的合理性。事件歷史分析法(Event History Analysis)最早由Berry夫婦在彩票與稅收政策擴(kuò)散研究中引入[24],即以一段時(shí)間的典型政策事件為標(biāo)志,對(duì)政策時(shí)間序列進(jìn)行分析的方法[25]。通常在研究中會(huì)引入重要政策事件進(jìn)行對(duì)應(yīng)分析,是國(guó)內(nèi)政策闡釋研究中的典型方法。以主題熱度突變?yōu)槔?,熱度突變反映在特定政策環(huán)境下,即某主題熱度顯著高于或低于上年度或上區(qū)間的熱度現(xiàn)象,一般是政策事件延續(xù)效應(yīng)、政策即將出臺(tái)、政策危機(jī)或變革的標(biāo)志。通過(guò)信息政策主題的跟蹤分析,本文提取了10個(gè)典型的熱度突變政策主題(見表3),梳理并提取了相應(yīng)時(shí)間段的典型政策事件。
表3 信息政策研究主題突變與關(guān)聯(lián)政策事件
分析發(fā)現(xiàn),不同主題分類方式的研究結(jié)論基本一致,而且研究主題突變與政策環(huán)境存在一定的對(duì)應(yīng)關(guān)系,政策主題跟蹤法在政策闡釋層面具有一定的關(guān)聯(lián)性和合理性。
4.1 中國(guó)信息政策主題領(lǐng)域分類的歷時(shí)演進(jìn)特征分析
根據(jù)主題詞頻漲落特征,可將信息政策主題領(lǐng)域分為四種類型。
第一類,激活性政策研究,即從某一時(shí)間點(diǎn)“被激活”后,其文獻(xiàn)數(shù)量顯著多于以往并保持研究熱度的研究類型。這類主題包括信息公開政策、信息化政策、信息安全政策、文化產(chǎn)業(yè)政策和科技創(chuàng)新政策等,如2007年的信息公開政策研究、2010年的文化產(chǎn)業(yè)政策以及2013年的科技創(chuàng)新政策研究。
第二類,持續(xù)激活性政策研究,即分階段由幾個(gè)“激活點(diǎn)”或“加速增長(zhǎng)點(diǎn)”,推動(dòng)該主題研究文獻(xiàn)的持續(xù)增長(zhǎng),信息政策總體研究就體現(xiàn)出類似特征。如知識(shí)產(chǎn)權(quán)和電子商務(wù)政策研究,1995年是知識(shí)產(chǎn)權(quán)文獻(xiàn)第一次加速增長(zhǎng)階段,2006年后進(jìn)入第二次加速增長(zhǎng);電子商務(wù)政策研究從1998年開始啟動(dòng),2000—2001年是突破性發(fā)展階段,2014—2015年又開始加速發(fā)展。
第三類,休眠性政策研究,即具有休眠特征,某一階段激活成政策熱點(diǎn)后開始冷卻,文獻(xiàn)數(shù)量持續(xù)降低,直至下一個(gè)階段再次激活。這類主題如信息產(chǎn)業(yè)政策研究,該研究大約每4—5年為一個(gè)周期,1994年第一次爆發(fā)性增長(zhǎng),1999—2002年為第二個(gè)高峰期,2004年、2008年、2013年先后三次成為熱點(diǎn),目前則趨于平緩。
第四類,消褪性政策研究,即過(guò)去某一時(shí)段為研究熱點(diǎn),但高峰期過(guò)后文獻(xiàn)數(shù)量顯著下滑并持續(xù)低迷的研究類型。這類主題如電子政務(wù)宏觀政策研究,該研究于2002年啟動(dòng),2004—2006年是高峰發(fā)展階段,但目前宏觀政策研究已不多,或已轉(zhuǎn)入具體政策問(wèn)題研究。
4.2 中國(guó)信息政策典型關(guān)鍵詞主題的演進(jìn)特征分析
通過(guò)主題頻度的歷時(shí)分布,能夠跟蹤發(fā)現(xiàn)信息政策文獻(xiàn)主題的演進(jìn)與消亡趨勢(shì),發(fā)現(xiàn)當(dāng)前信息政策研究主題的變化特征。通過(guò)對(duì)典型關(guān)鍵詞主題1986—2015年的頻次分布及漲落特征余弦相似度計(jì)算,大部分關(guān)鍵詞分布的兩兩相似度極高,差異性并不顯著;但以五年為區(qū)間跨度,對(duì)政策概念進(jìn)行分區(qū)后,不同區(qū)間政策主題具有顯著差異(見表4)。
表4 信息政策研究關(guān)鍵詞的分區(qū)分布(前10名)
參考分類主題的類型區(qū)分方法,關(guān)鍵詞可區(qū)分為五類(見表5)。
第一類,具有持續(xù)較高的詞頻分布,即信息政策的持續(xù)研究熱點(diǎn),貫通信息政策研究始終,這類關(guān)鍵詞共有48個(gè),典型的如信息產(chǎn)業(yè)、信息服務(wù)、信息基礎(chǔ)設(shè)施、信息技術(shù)、保密工作和信息化等。
第二類,關(guān)鍵詞詞頻呈遞增趨勢(shì)并保持高頻規(guī)模,為信息政策當(dāng)前研究熱點(diǎn),從247個(gè)候選關(guān)鍵詞中找到34個(gè),如信息安全、信息生態(tài)、信息環(huán)境、信息公開和信息倫理等。典型的如信息安全政策,自第三時(shí)區(qū)(1996—2000年)大量出現(xiàn)(14篇),第四時(shí)區(qū)(2001—2005年)增長(zhǎng)到83篇,此后保持持續(xù)高速增長(zhǎng),并穩(wěn)定高頻規(guī)模。
第三類,關(guān)鍵詞詞頻呈遞減趨勢(shì)的,為信息政策以往研究熱點(diǎn),目前已經(jīng)衰退的信息政策關(guān)鍵詞,如信息系統(tǒng)、信息污染、信息機(jī)構(gòu)和信息市場(chǎng)。關(guān)于信息系統(tǒng)的政策研究在第三時(shí)區(qū)和第四時(shí)區(qū)即1996—2005年達(dá)到峰值(35篇)后,從第五時(shí)區(qū)開始迅速遞減(15篇),到第六時(shí)區(qū)已經(jīng)很少有關(guān)于信息系統(tǒng)政策研究的文獻(xiàn)(5篇)。信息污染則是在第三時(shí)區(qū)(1996—2000年)最多,達(dá)到11篇,此后迅速衰減,目前已經(jīng)沒(méi)有關(guān)于信息污染的文獻(xiàn)。信息機(jī)構(gòu),在第二時(shí)區(qū)與第三時(shí)區(qū)之間,相關(guān)的政策研究分別高達(dá)9篇和21篇,而進(jìn)入第四時(shí)區(qū)(2001年)后,相關(guān)文獻(xiàn)銳減為4篇,而第五、第六兩個(gè)時(shí)區(qū)僅1篇相關(guān)研究文獻(xiàn)。
第四類,出現(xiàn)在最近時(shí)區(qū),并迅速增長(zhǎng)至關(guān)鍵詞高頻區(qū),為信息政策潛在研究熱點(diǎn)。典型關(guān)鍵詞是個(gè)人信息保護(hù),在第五時(shí)區(qū)之前鮮有相關(guān)研究,但自從引入該關(guān)鍵詞后,均保持在高頻詞區(qū),年均相關(guān)論文都在40篇以上。
第五類,在多個(gè)時(shí)區(qū)出現(xiàn),詞頻總量較高,但詞頻數(shù)并沒(méi)有嚴(yán)格的時(shí)序變化規(guī)律,為波動(dòng)性研究熱點(diǎn)。這類關(guān)鍵詞廣泛分布于理論研究的核心議題和中頻信息政策概念區(qū)間,如信息素養(yǎng)、信息交流、信息需求等。
表5 信息政策研究的典型關(guān)鍵詞類型
4.3 中國(guó)信息政策關(guān)鍵詞主題突變演進(jìn)特征分析
主題突變演進(jìn)主要跟蹤主題引入或衰退的時(shí)間節(jié)點(diǎn),對(duì)分析政策研究的時(shí)期特色具有一定參考價(jià)值。依典型關(guān)鍵詞的突變期分布可將中國(guó)信息政策研究分為1986—1992年的萌芽發(fā)展期、1993—2000年的加速發(fā)展期、2001—2007年的發(fā)展成熟期以及2008—2015年的穩(wěn)定發(fā)展期四個(gè)典型時(shí)期。根據(jù)上述發(fā)展區(qū)間的突變主題分布(見表6),發(fā)現(xiàn)如下特征。
第一,萌芽發(fā)展期的引入信息政策主題主要集中在知識(shí)產(chǎn)權(quán)相關(guān)術(shù)語(yǔ)和信息活動(dòng)相關(guān)主題。在知識(shí)產(chǎn)權(quán)相關(guān)術(shù)語(yǔ)中,國(guó)際知識(shí)產(chǎn)權(quán)理論的引入是政策研究的亮點(diǎn),比如巴黎公約、伯爾尼公約、涉外知識(shí)產(chǎn)權(quán)等術(shù)語(yǔ)的引入;在信息活動(dòng)相關(guān)主題中,信息交流、信息市場(chǎng)與信息服務(wù)等政策主題的引入是規(guī)范信息活動(dòng)的重要政策術(shù)語(yǔ)。此外,對(duì)于信息安全和保密的關(guān)注則主要以國(guó)際對(duì)抗和國(guó)家安全為主,具有典型的冷戰(zhàn)特色。
表6 信息政策研究典型關(guān)鍵詞突變主題的分期分布
第二,加速發(fā)展期引入的政策主題最多,主要可分為三個(gè)部分:一是以信息技術(shù)和數(shù)字環(huán)境為主的信息活動(dòng)或?qū)ο?,如?jì)算機(jī)、軟件、互聯(lián)網(wǎng)、信息通信、數(shù)據(jù)管理、網(wǎng)絡(luò)服務(wù)、域名、黑客等主題;二是以電子商務(wù)和知識(shí)經(jīng)濟(jì)為對(duì)象的新經(jīng)濟(jì)活動(dòng)研究,如電子商務(wù)、電子簽名、電子合同、跨境電子商務(wù)、信息社會(huì)、不正當(dāng)競(jìng)爭(zhēng)、反不正當(dāng)競(jìng)爭(zhēng)等主題;三是知識(shí)產(chǎn)權(quán)的國(guó)際化和數(shù)字化延伸,如軟件著作權(quán)、商業(yè)秘密、WTO、TRIPS協(xié)議、自主知識(shí)產(chǎn)權(quán)、網(wǎng)絡(luò)知識(shí)產(chǎn)權(quán)等。
第三,發(fā)展成熟期引入的典型政策主題是電子政務(wù)與信息公開、文化創(chuàng)意產(chǎn)業(yè)與創(chuàng)新相關(guān)的主題。電子政務(wù)與信息公開主題是信息政策研究發(fā)展成熟期的典型應(yīng)用主題,包括電子政務(wù)、政務(wù)公開、信息公開、信息披露、信息共享以及與之關(guān)聯(lián)的定密、保密、個(gè)人信息、知情權(quán)、信息隱私權(quán)、信息安全、信息泄露等新的理論實(shí)踐;文化創(chuàng)新產(chǎn)業(yè)與科技創(chuàng)新則是另一個(gè)政策研究創(chuàng)新領(lǐng)域。
第四,穩(wěn)定發(fā)展期采集的高頻政策主題并不多,僅就測(cè)算出的8個(gè)主題而言,主要體現(xiàn)為點(diǎn)狀分布,如物聯(lián)網(wǎng)、云計(jì)算、信息消費(fèi)、大數(shù)據(jù)等與同時(shí)期國(guó)家發(fā)布或推進(jìn)的相關(guān)國(guó)家信息政策密切吻合。此外,關(guān)于科技金融政策和財(cái)稅政策也是同期的政策研究亮點(diǎn),比如知識(shí)產(chǎn)權(quán)的質(zhì)押融資、科技金融支持政策具有典型的時(shí)期特色。
本文通過(guò)對(duì)我國(guó)信息政策文獻(xiàn)集的主題提取、跟蹤統(tǒng)計(jì)以及主題突變測(cè)算,發(fā)現(xiàn)不同政策主題歷時(shí)演進(jìn)的趨同性、差異性以及主題突變的分期分布,也說(shuō)明政策主題跟蹤方法在政策分析、政策預(yù)測(cè)中的可行性。
首先,政策主題歷時(shí)演進(jìn)分析發(fā)現(xiàn)了典型的主題差異和漲落特征。從分類主題和關(guān)鍵詞主題的特征分類看,主題差異和漲落主要體現(xiàn)在四個(gè)方面:第一,政策主題的快速增長(zhǎng),體現(xiàn)了政策熱點(diǎn)的孕育或出現(xiàn)。比如政策主題歷時(shí)跟蹤發(fā)現(xiàn)1993—1994年是我國(guó)信息政策研究的突增點(diǎn),這一判斷與傳統(tǒng)信息政策研究結(jié)論一致[26];而2014年的“互聯(lián)網(wǎng)+”和2015年的個(gè)人信息保護(hù)對(duì)當(dāng)前信息政策的研究導(dǎo)向和政策實(shí)踐的揭示也具有一定輔助和指引。第二,信息政策研究主題的快速衰退或因政策為局部熱點(diǎn)、短期熱點(diǎn),或因替代性政策主題的出現(xiàn),比如2004年信息通信政策、2005年信息化政策、2006年電子政務(wù)等幾組典型政策主題的衰退。第三,信息政策研究主題的漲落具有一定生命周期,體現(xiàn)了信息政策的周期性。如1998—2004年的信息通信政策,從快速增加到快速下降,經(jīng)歷了一個(gè)政策研究周期。第四,個(gè)別政策主題保持了比較穩(wěn)定的熱度增長(zhǎng),比如知識(shí)產(chǎn)權(quán)、信息技術(shù)等。
其次,政策主題突變期分布的分期方法,與我國(guó)信息政策實(shí)踐具有一定趨同性,因而政策主題跟蹤在政策發(fā)現(xiàn)、政策比較研究中具有一定的可用性。雖然有研究報(bào)告發(fā)現(xiàn),信息政策的理論研究熱點(diǎn)與政策實(shí)踐熱點(diǎn)并不完全一致,二者均可能存在一定的滯后或遺漏,但該方法關(guān)于電子商務(wù)、電子政務(wù)、WTO、大數(shù)據(jù)、云計(jì)算等政策主題的趨勢(shì)研判還是比較準(zhǔn)確的。
此外,從研究方法看,基于時(shí)間序列聚類方法的主題跟蹤還存在一些不足。首先,時(shí)間序列聚類方法是一種歷時(shí)性的回溯研究方法,需要基于數(shù)據(jù)積累,而對(duì)于最新涌現(xiàn)的低頻政策概念無(wú)法計(jì)量,其研判精度不如主題頻次統(tǒng)計(jì)跟蹤;其次,時(shí)間序列聚類方法對(duì)封閉系統(tǒng)比較有效,但科學(xué)研究是開放系統(tǒng),處于不同增長(zhǎng)和發(fā)展過(guò)程中,其分期比較受局限;最后,時(shí)間序列聚類方法比較適合單純邏輯增長(zhǎng)的研究主題,進(jìn)行邏輯上的兩段區(qū)分,而對(duì)波動(dòng)性或具有多階段發(fā)展的研究主題無(wú)法準(zhǔn)確區(qū)分。
總之,政策研究主題的歷時(shí)跟蹤更適合對(duì)熱度漲落比較劇烈的政策主題預(yù)警,以及長(zhǎng)期跟蹤政策比較和政策學(xué)習(xí)研究。
[1] 周林彬.試論經(jīng)濟(jì)信息法律關(guān)系[J].法學(xué)雜志,1985(2):37-38,27.
[2] 馬費(fèi)成,裴雷.我國(guó)信息資源政策與法律的實(shí)踐與需求[J].圖書館論壇,2008(1):4-8.
[3] 顧勝杰.我國(guó)信息政策研究綜述[J].晉圖學(xué)刊,1994(4):5-9.
[4] 張新宇,尚萍.國(guó)外信息政策研究述評(píng)(1990—2001)[J].現(xiàn)代情報(bào), 2003,23(4): 27-30.
[5] 王素芳.我國(guó)信息資源開發(fā)利用政策法規(guī)初探[J].圖書館學(xué)刊, 2004,26(4):16-17.
[6] 朱燁.我國(guó)信息政策研究(1994—2003)綜述[J].圖書館建設(shè), 2005(3):27-30.
[7] 李楊.信息政策研究論文定量分析(1999—2008)[J].情報(bào)探索, 2010(3):17-19.
[8] 汪少敏,鄭滿滿,王愛群.我國(guó)信息政策研究評(píng)述 (1999—2008)[J].情報(bào)雜志,2009 (8):37-39.
[9] 張璋.我國(guó)信息資源產(chǎn)業(yè)政策:現(xiàn)狀、分析與前瞻[J].圖書情報(bào)工作,2012,56(12): 85-89,137.
[10] 劉君.中國(guó)信息政策研究論文(1980—1998年)定量分析[J].圖書情報(bào)工作,2000 (2):21-25.
[11] 朱莉,朱慶華.20世紀(jì)90年代以來(lái)我國(guó)信息政策與法規(guī)研究論文的定量分析[J].情報(bào)理論與實(shí)踐,2003,26(4):371-375.
[12] BROWNE M.The field of information policy:2.redefining the boundaries and methodologies[J].Journal of Information Science,1997,23(5): 339-351.
[13] DRAKE M A,MAACK M N. Encyclopedia of Library and Information Science[M].2nd ed.NewYork:CRC Press,2003:1300-1315.
[14] ROWLANDS I.Understanding information policy:concepts,frameworks and research tools[J].Journal of Information Science,1996,22(1):13-25.
[15] POPESCUL A,FLAKE G W,LAWRENCE S,et al. Clustering and identifying temporal trends in document databases[C]//Proceedings of IEEE Advances in Digital Libraries 2000,May 22-24,2000,IEEE Computer Society.Washington:[s.n.],2000:173-182.
[16] ROY S,GEVRY D,POTTENGER W M. Methodologies for trend detection in textual data mining[C]//The 2nd SIAM International Conference on Data Mining,11-13,2002.Arlington:SIAM, 2002:158-174.
[17] 王莉亞.基于關(guān)鍵詞突變的主題突變研究[J].情報(bào)理論與實(shí)踐, 2013,36(11):45-48.
[18] 王莉亞.基于特征詞突變的信息整合領(lǐng)域主題演化研究[J].圖書情報(bào)研究,2014(3):75-78.
[19] CHEN C M.CiteSpace II: detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[20] SHIBATA N,KAJIKAWA Y,TAKEDA Y,et al.Detecting emerging research fronts based on topological measures in citation networks of scientific publications[J].Technovation,2008,28(11):758-775.
[21] MORRIS S A,YEN G G.Crossmaps:visualization of overlapping relationships in collections of journal papers[J].Proceedings of the National Academy of Sciences,2004,101(suppl1):5291-5296.
[22] 李湘東,張嬌,袁滿.基于LDA模型的科技期刊主題演化研究[J].情報(bào)雜志, 2014(7):115-121.
[23] 楊星,李保利,金明舉.基于LDA模型的研究領(lǐng)域熱點(diǎn)及趨勢(shì)分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012(10):66-69,74.
[24] GRAHAM E R,SHIPAN C R,VOLDEN C,et al.The diffusion of policy diffusion research in political science[J].British Journal of Political Science,2013,43:673-701.
[25] BERRY F S.Sizing up state policy innovation research[J].Policy Studies Journal,1994,22(3):442-456.
[26] 杜佳.中國(guó)國(guó)家信息政策法規(guī)體系構(gòu)成研究——基于“國(guó)家信息政策法規(guī)數(shù)據(jù)庫(kù)”的實(shí)證分析[D].武漢:武漢大學(xué),2004.
李向舉,男,1992年生,南京大學(xué)信息管理學(xué)院研究生,研究方向:信息政策分析。
謝添軒,男,1994年生,南京大學(xué)信息管理學(xué)院研究生,研究方向:網(wǎng)絡(luò)信息資源管理。
成吉,女,1993年生,南京大學(xué)信息管理學(xué)院研究生,研究方向:網(wǎng)絡(luò)信息資源管理。
Evolution of Hot Topics of Information Policy Research Throughout Different Periods in China (1986-2015)
PEI Lei, LI XiangJu, XIE TianXuan, CHENG Ji
(School of Information Management, Nanjing University, Nanjing 210093, China)
Based on text computing and historical analyzing methodology, this paper explored the distribution laws of both journal articles and topics frequencies occurred on information policy from 1986 to 2015 in China. Based on the analysis, a quite similar tendency of topics defined by different methods occurred all through the 30 years period, and four distinct phases can be divided according to burst terms' distribution, which demonstrated the possibility and reliability of topic tracking in policy analysis and forecast.
Information Policy; Hot Topics; Topic Tracking; Periodic Division
G20;G35
10.3772/j.issn.1673-2286.2016.7.004
裴雷,男,1981年生,南京大學(xué)信息管理學(xué)院副教授,研究方向:信息經(jīng)濟(jì)與信息政策分析、信息資源規(guī)劃,E-mail: plei@nju.edu.cn。
2016-07-03)
* 本研究得到教育部人文社會(huì)科學(xué)青年項(xiàng)目“基于概念統(tǒng)計(jì)的信息政策文本計(jì)算與實(shí)證”(編號(hào): 11YJC870020)和國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目“信息政策擴(kuò)散與轉(zhuǎn)移研究”(編號(hào): 12CTQ024)資助。