• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于計算機編程的洛特卡驗證研究

      2022-05-31 02:29:06劉友生
      科技創(chuàng)新與應(yīng)用 2022年15期
      關(guān)鍵詞:程序運行洛特定律

      胡 浪,劉友生

      (廣東松山職業(yè)技術(shù)學(xué)院,廣東 韶關(guān) 512126)

      洛特卡定律(Lotka's Law)是美國統(tǒng)計學(xué)家Lotka于1926年在觀察和統(tǒng)計化學(xué)及物理兩個學(xué)科領(lǐng)域科學(xué)文獻時發(fā)現(xiàn)的一個統(tǒng)計規(guī)律,其最初表達式是xny=C,即在一定時期內(nèi)、某領(lǐng)域發(fā)表x篇論文的作者占作者總數(shù)的比例y與其所發(fā)表的論文篇數(shù)x的n次方成反比關(guān)系。Lotka通過頻率對數(shù)分布得到的回歸直線符合平方反比關(guān)系,因而他把這一統(tǒng)計規(guī)律稱為“科學(xué)生產(chǎn)率平方反比律”,并算得C=0.6079,即發(fā)表一篇論文的作者數(shù)占作者總數(shù)的60.79%[1]。這是人們第一次從統(tǒng)計學(xué)角度揭示科學(xué)家的著述規(guī)律以及科學(xué)文獻按著者的分布規(guī)律,因而被后人稱為洛特卡定律。在之后的驗證研究中人們發(fā)現(xiàn),作為一個經(jīng)驗統(tǒng)計規(guī)律,這個定律本身存在較濃的經(jīng)驗色彩和相對準確性,其中n與C隨學(xué)科的不同以及統(tǒng)計時間的長短而出現(xiàn)一定波動。上世紀70-80年代,Vlachy、Pao等學(xué)者對洛特卡定律的驗證工作取得了新的進展,并且得到了n不為2時n與C的逼近估算公式,從而拓展了洛特卡定律的適用范圍,因而也被稱為廣義洛特卡定律[2]。

      洛特卡定律提出已近百年,國外對其的驗證研究由來已久;而國內(nèi)自上世紀80年代后期伴隨著文獻計量學(xué)的發(fā)展,對洛特卡定律的驗證研究才逐步興起。近年來,相關(guān)研究主要包括對一段時期的期刊文獻[3]、專利文獻[4]、某個學(xué)科或主題研究文獻[5]等的驗證。所有這些研究的驗證全過程都是由人工對數(shù)據(jù)進行分步驟計算得來的,由于計算過程繁瑣、數(shù)據(jù)運算量大,人工計算往往容易出錯。為此,我們提出用計算機編程技術(shù)解決人工計算量大易錯問題的思路,并設(shè)計出用于洛特卡驗證的程序系統(tǒng),同時在實際應(yīng)用中得到驗證和確立。本文簡述了洛特卡驗證的理論步驟、程序系統(tǒng)的設(shè)計框架以及基于C#語言的構(gòu)件程序,以期對后續(xù)相關(guān)或相似研究有所裨益。

      1 洛特卡驗證步驟

      1.1 參數(shù)n的估算

      對洛特卡原始表達式xny=C兩邊取對數(shù)得到等式(1):ln y=ln C-n ln x;為使理論值與實際值最接近,在運用最小二乘法估算時,令(2)式Q=Σ(ln y-ln y′)2中Q值最小即可;將(1)式代入(2)式,并將Q分別對n和C取偏微分,整理后得到n的估算式:

      1.2 參數(shù)C的估算

      1985年M.L.Pao教授在《Lotka'law:a testing procedure》一文中提出C的逼近值算式(4):

      同時指出,當(dāng)P=20時,使用該式計算誤差已小于1/110000[6],故P取值為20即可,將P=20代入(4)式得到C的簡算式:

      至此,可以初步得到廣義洛特卡分布的表達式:

      1.3 K-S檢驗

      Pao指出,為校驗計算得到的洛特卡表達式的理論分布與實際分布的擬合程度,須對其進行K-S檢驗,基本思路是比較觀察數(shù)據(jù)對的累積占比率與估算的洛特卡分布理論值累積占比率之間的差值,取其最大值記作Dmax,若Dmax大于臨界值,表明理論值與實際值存在顯著差異;若Dmax小于臨界值,則表明理論值與實際值無顯著差異。在顯著性水平α=0.01情況下,臨界值由公式確定[6]。

      2 系統(tǒng)設(shè)計框架及實現(xiàn)

      2.1 系統(tǒng)設(shè)計框架

      期刊論文與作者分布的洛特卡驗證系統(tǒng)包括原始數(shù)據(jù)錄入、參數(shù)n的估算、參數(shù)C的估算和K-S檢驗4個主要部分。其中,n的估算是按(3)式計算、所得n值保存至數(shù)據(jù)庫中,C的估算按(5)式計算、所需n值從數(shù)據(jù)庫中獲取,所得C值同樣保存至數(shù)據(jù)庫中,以備K-S檢驗調(diào)用。整體系統(tǒng)的結(jié)構(gòu)和框架如圖1所示。

      圖1 期刊論文與作者分布的Lotka驗證系統(tǒng)框架

      2.2 系統(tǒng)框架實現(xiàn)基本步驟

      2.2.1 參數(shù)n估算的實現(xiàn)

      首先要計算論文數(shù)x與作者數(shù)yx的自然對數(shù),根據(jù)結(jié)果,再計算ln x乘ln yx的積和計算ln x的平方;根據(jù)這3個結(jié)果再分別計算:(1)論文數(shù)自然對數(shù)的和Σln x;(2)論文作者數(shù)自然對數(shù)的和Σln yx;(3)由原始數(shù)據(jù)確定數(shù)據(jù)對N的值,并計算NΣ[(ln x)(ln yx)]和N[Σ(ln x)2];(4)計算論文數(shù)自然對數(shù)的和的平方(Σln x)2。最后計算n值將n的值保存至數(shù)據(jù)庫,同時為C估算提供n的值。

      2.2.2 參數(shù)C估算的實現(xiàn)

      2.2.3 K-S檢驗的實現(xiàn)

      K-S檢驗包括(1)首先按表1中實際分布計算實際累積占比率;(2)再通過f(yx)=C/xn計算x從1到N的f(yx)理論值,再計算其理論累積占比率;(3)計算理論累積占比率與實際累積占比率的差值,得到Dmax;(4)比較D臨界與Dmax的大小,得出結(jié)論。

      2.3 系統(tǒng)實現(xiàn)的構(gòu)件編寫舉例

      本系統(tǒng)是由不同構(gòu)件組成,并按Lotka驗證公式進行數(shù)學(xué)計算。由于相關(guān)構(gòu)件較多,本文僅以n的估算中求某一數(shù)列對數(shù)的構(gòu)件設(shè)計為例描述關(guān)鍵構(gòu)件編程要點,其余構(gòu)件則不在此一一贅述。為了使程序具有通用性,我們設(shè)計了一個能夠計算某一列數(shù)據(jù)的自然對數(shù)的通用程序構(gòu)件,該構(gòu)件的核心代碼如下。

      ///求某一列的對數(shù)

      public void Countlnx(string SQL, string lnx_FileName,string ResltFileName)

      {

      連接數(shù)據(jù)庫并打開數(shù)據(jù)庫

      while(objreader.Read())

      {

      int sid=Convert.ToInt32(objreader["ID"].ToString());

      Int32 lnx_FileNameVaule= Convert.ToInt32(objreader[lnx_FileName].ToString());

      try

      {

      UpdateNumberFieldValue("Filemanage",ResltFileName,

      Math.Log(lnx_FileNameVaule).ToString(),sid);

      }

      catch(Exception e)

      {

      HttpContext.Current.Response.Write("<script>alert(’無法計算!’"+e.Message+");</script>");

      }

      }

      }

      該構(gòu)件傳入的參數(shù)包括SQL(執(zhí)行數(shù)據(jù)查詢的SQL語句);lnx_FileName(指定一個數(shù)據(jù)庫中的需要計算的字段列的名稱);ResltFileNam(顯示結(jié)果的字段列的名稱)。

      傳出結(jié)果:某一列l(wèi)nx_FileName,將對數(shù)計算結(jié)果顯示出來。

      3 程序運行結(jié)果及結(jié)果分析

      3.1 原始數(shù)據(jù)的獲取與錄入

      首先使用期刊數(shù)據(jù)庫做基礎(chǔ)數(shù)據(jù)收集以統(tǒng)計期刊論文與作者分布,再通過數(shù)據(jù)錄入程序,將所獲原始數(shù)據(jù)論文數(shù)(x)與作者數(shù)(yx)錄入系統(tǒng),并保存至系統(tǒng)數(shù)據(jù)庫中,如圖1所示,可為后續(xù)參數(shù)n和C的估算以及K-S檢驗等程序調(diào)用,實現(xiàn)程序驗證。本文以某圖情期刊為例,通過中國知網(wǎng)收集、并用Citespace軟件統(tǒng)計獲得其近20年發(fā)表學(xué)術(shù)論文篇數(shù)x與發(fā)表x篇論文的作者人數(shù)yx,見表1。

      表1 某圖情期刊近20年發(fā)表論文篇數(shù)與作者數(shù)列表

      3.2 n值估算

      n值估算程序運行后,分別進行基本數(shù)據(jù)分析計算和單項計算以后的結(jié)果如圖2所示。在代入表1基礎(chǔ)數(shù)據(jù)后,通過系統(tǒng)運算,得到反映該數(shù)據(jù)條件下各分量的值,而其n=2.457 5(與手工計算結(jié)果一致,結(jié)果保留小數(shù)點后4位,下同)保存至數(shù)據(jù)庫中。在以往的洛特卡驗證研究中,Vlachy的工作證明,一般情況下1.2≦n≦3.5[3],洛特卡在對化學(xué)和物理領(lǐng)域文獻的觀察中得到n近似為2的結(jié)論,反映的是這兩個學(xué)科領(lǐng)域的特性。本文中n=2.457 5,與邱均平等[7]關(guān)于圖書館學(xué)研究領(lǐng)域所得到的n=2.756相近,說明在圖書情報領(lǐng)域研究中,n的取值范圍應(yīng)當(dāng)在2~3之間,反映的也是該領(lǐng)域的學(xué)科特性。

      圖2 n估算程序基本數(shù)據(jù)分析計算結(jié)果

      3.3 C值估算

      C值估算程序運行后,分別計算分式中各個分量以及C估算基本指標數(shù)據(jù)以后的結(jié)果如圖3所示,在代入n值后,系統(tǒng)可以得到C的估算值為0.735 6,同樣保存至數(shù)據(jù)庫中。

      圖3 C值估算程序運行結(jié)果

      3.4 K-S驗證

      K-S檢驗程序運行,分別計算理論累積率和實際累積率及其差值,如圖4所示。在本例中0.027 3,從圖4可知Dmax=0.020 1,故有Dmax<D臨界,可以判定:在顯著性水平α=0.01情況下,該刊近20年所刊發(fā)的論文中,作者論文篇數(shù)與作者人數(shù)占比服從廣義洛特卡分布,表達式為f(yx)=0.7356/x2.4575。

      圖4 K-S檢驗程序運行結(jié)果

      4 結(jié)束語

      運用洛特卡定律觀察和研究作者分布情況,既能反映一個學(xué)科領(lǐng)域的科技勞動成果狀況,也能科學(xué)估計科學(xué)研究生產(chǎn)規(guī)模,還能有效掌握科學(xué)論文的作者隊伍,這是該選題歷久彌新的根本所在。本文首次提出并實際運用計算機編程技術(shù)完成了洛特卡驗證程序系統(tǒng),解決了以往相關(guān)驗證研究運算量大易錯的問題,在國內(nèi)文獻中尚未得見,也為文獻計量學(xué)與計算機科學(xué)交叉研究提供了一個成功的例證。

      從實際數(shù)據(jù)的驗證演示來看,本程序系統(tǒng)完全符合洛特卡驗證要求,除期刊原始數(shù)據(jù)外,所有驗證步驟皆由計算機程序運算實現(xiàn);且在實例中當(dāng)顯著性水平為0.01時,所選圖情期刊近20年所刊論文中論文篇數(shù)與作者人數(shù)服從廣義洛特卡分布,所得到的洛特卡分布式與人工計算結(jié)果一致。顯示該程序系統(tǒng)具有設(shè)計思路清晰明確、運算結(jié)果快速準確、實際應(yīng)用廣泛高效的特點,特別適合關(guān)于洛特卡分布參數(shù)n與C值隨統(tǒng)計時間跨度變化而變化等需要反復(fù)計算的應(yīng)用研究,期望本文能對后續(xù)相關(guān)研究有所幫助。

      猜你喜歡
      程序運行洛特定律
      卡洛特水電站:清潔能源賦能“中巴經(jīng)濟走廊”
      中國三峽(2022年8期)2022-11-30 08:39:24
      行政公益訴訟訴前程序運行檢視
      法大研究生(2020年2期)2020-01-19 01:43:04
      多一盎司定律和多一圈定律
      蘇州高洛特電子科技有限公司
      真空與低溫(2019年5期)2019-10-18 09:08:32
      倒霉定律
      萬有引力定律
      論刑事錯案的成因
      《刑事訴訟法》修改背景下刑事和解制度淺析
      耐人尋味的定律
      妥洛特羅貼劑治療嬰幼兒哮喘的療效觀察
      西乌珠穆沁旗| 阿合奇县| 安义县| 南开区| 青州市| 湖南省| 永登县| 荆门市| 马公市| 金秀| 阿瓦提县| 高陵县| 雷山县| 崇州市| 常德市| 康乐县| 漳平市| 观塘区| 马山县| 乡城县| 凤阳县| 云南省| 玛多县| 凤翔县| 乌海市| 新昌县| 瓮安县| 云南省| 双鸭山市| 吴堡县| 左权县| 石林| 青冈县| 仁怀市| 克什克腾旗| 潞西市| 巫山县| 湾仔区| 凤翔县| 荆门市| 鄂伦春自治旗|