• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于復(fù)旦大學(xué)ERU數(shù)據(jù)的學(xué)科交叉程度與研究熱點(diǎn)分析

      2015-09-08 02:01:28張春梅張計(jì)龍殷沈琴汪東偉郭耀東
      現(xiàn)代情報(bào) 2015年3期
      關(guān)鍵詞:動(dòng)態(tài)數(shù)據(jù)學(xué)科交叉聚類(lèi)分析

      張春梅 張計(jì)龍 殷沈琴 汪東偉 郭耀東

      [摘要]本文利用復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺(tái),從底層網(wǎng)絡(luò)數(shù)據(jù)中獲取用戶(hù)訪(fǎng)問(wèn)圖書(shū)館電子資源時(shí)檢索行為的動(dòng)態(tài)數(shù)據(jù),運(yùn)用Sesson ID關(guān)系、因子分析和聚類(lèi)分析等方法,分析我國(guó)高校學(xué)術(shù)研究的學(xué)科交叉程度及研究熱點(diǎn)。結(jié)果表明,學(xué)科交叉研究采用動(dòng)態(tài)數(shù)據(jù)源進(jìn)行分析,可以拓展學(xué)科交叉研究的深度和寬度,彌補(bǔ)以往研究中僅針對(duì)靜態(tài)數(shù)據(jù)分析研究的不足,促進(jìn)學(xué)術(shù)研究和科學(xué)創(chuàng)新上獲得新的生長(zhǎng)點(diǎn)。

      [關(guān)鍵詞]學(xué)科交叉;動(dòng)態(tài)數(shù)據(jù);Session ID;因子分析;聚類(lèi)分析

      DOI:10.3969/j.issn.1008-0821.2015.03.013

      [中圖分類(lèi)號(hào)]G250.73 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2015)03-0068-09

      當(dāng)前學(xué)科交叉研究已成為科學(xué)技術(shù)發(fā)展的一個(gè)重要趨勢(shì)。自20世紀(jì)初學(xué)科交叉研究的萌芽在美國(guó)出現(xiàn)后,人們便開(kāi)始認(rèn)識(shí)到學(xué)科交叉產(chǎn)生的新興學(xué)科,因?yàn)槠淠軌虼蚱苽鹘y(tǒng)學(xué)科研究束縛,為學(xué)科發(fā)展創(chuàng)造新的生長(zhǎng)點(diǎn),為科技進(jìn)步提供新動(dòng)力的特點(diǎn),引起世界各國(guó)的廣泛關(guān)注。學(xué)科交叉借助其研究領(lǐng)域的獨(dú)特優(yōu)勢(shì)在新技術(shù)開(kāi)發(fā)、新興產(chǎn)業(yè)應(yīng)用研究等領(lǐng)域產(chǎn)生極大的影響力,其科學(xué)技術(shù)創(chuàng)新的能力也被置于極其重要的地位。

      發(fā)現(xiàn)學(xué)科研究的交叉點(diǎn),無(wú)異于找到學(xué)科研究的新起點(diǎn),許多科研人員、學(xué)者都希望獲得本學(xué)科與其他學(xué)科的交叉點(diǎn)、學(xué)科研究新的增長(zhǎng)點(diǎn)和研究熱點(diǎn)的信息,那么如何從海量文獻(xiàn)數(shù)據(jù)中發(fā)現(xiàn)這樣的信息,為科學(xué)發(fā)展、研究創(chuàng)新提供動(dòng)力呢?從目前已有的文獻(xiàn)可以看出幾種研究思路:第一種是以期刊引文關(guān)系為基礎(chǔ)研究學(xué)科交叉關(guān)系;第二種是通過(guò)關(guān)聯(lián)規(guī)則挖掘、文本挖掘等現(xiàn)代數(shù)據(jù)挖掘技術(shù)手段研究學(xué)科間的相關(guān)性和交叉知識(shí);第三種是以期刊關(guān)鍵詞為基礎(chǔ)研究學(xué)科交叉的熱點(diǎn);第四種是以不同的研究對(duì)象為基礎(chǔ),從不同的視角研究學(xué)科之間的交叉關(guān)系。以上文獻(xiàn)多以靜態(tài)數(shù)據(jù)為基礎(chǔ)切入不同的分析角度探討學(xué)科之間的交叉關(guān)系,但是對(duì)學(xué)科交叉的程度以及研究熱點(diǎn)缺少量化分析。

      本文將以復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺(tái)所獲得的用戶(hù)使用電子文獻(xiàn)行為的動(dòng)態(tài)數(shù)據(jù)為基礎(chǔ)進(jìn)行數(shù)據(jù)分析。ERU全稱(chēng)為“圖書(shū)館電子資源使用統(tǒng)計(jì)分析軟件”,一般部署在高校核心網(wǎng)絡(luò)交換機(jī)的鏡像口,從旁路出發(fā),基于網(wǎng)絡(luò)底層采集用戶(hù)信息行為的數(shù)據(jù),ERU軟件可以對(duì)圖書(shū)館實(shí)現(xiàn)電子資源知識(shí)庫(kù)定制管理,對(duì)圖書(shū)館所使用的數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)中的文獻(xiàn)內(nèi)容進(jìn)行用戶(hù)使用行為的數(shù)據(jù)采集,并以此為基礎(chǔ)實(shí)現(xiàn)電子資源使用情況的多維統(tǒng)計(jì)和用戶(hù)訪(fǎng)問(wèn)行為的統(tǒng)計(jì)分析。通過(guò)ERU數(shù)據(jù)采集平臺(tái)獲取的動(dòng)態(tài)數(shù)據(jù),實(shí)現(xiàn)挖掘?qū)W科之間可能存在的交叉關(guān)系,為更好地揭示學(xué)科交叉關(guān)系提供一種新思路,不僅通過(guò)網(wǎng)絡(luò)用戶(hù)使用電子文獻(xiàn)資源的行為研究探討學(xué)科之間的交叉程度,而且深入挖掘數(shù)據(jù)的潛在關(guān)系對(duì)學(xué)科交叉的研究熱點(diǎn)也進(jìn)行分析,為師生、學(xué)者和科研人員的研究提供數(shù)據(jù)參考,幫助其找到學(xué)科研究上新的創(chuàng)新點(diǎn)和突破口。

      1.研究方法

      學(xué)科交叉程度的研究分析運(yùn)用Session ID關(guān)系,通過(guò)將SessionID中出現(xiàn)的文獻(xiàn)之間的關(guān)系轉(zhuǎn)換為學(xué)科之間的關(guān)系。以此建立起學(xué)科之間交叉關(guān)系的基礎(chǔ),以學(xué)科之間交叉出現(xiàn)的頻次作為學(xué)科交叉關(guān)系程度的反映。學(xué)科交叉熱點(diǎn)的研究分析則是利用因子分析,將學(xué)科交叉出現(xiàn)的高頻關(guān)鍵詞提取出具有代表性的因子,以這些因子為類(lèi),分析得出學(xué)科交叉的熱點(diǎn)區(qū)域,再結(jié)合聚類(lèi)分析,將結(jié)果進(jìn)行比較,獲得較為滿(mǎn)意的學(xué)科交叉研究熱點(diǎn)的分析結(jié)果。

      1.1Session ID關(guān)系運(yùn)用分析

      本文學(xué)科之間的交叉關(guān)系是建立在Session ID關(guān)系的基礎(chǔ)之上獲得的。在Web中Session是指用戶(hù)在瀏覽某個(gè)網(wǎng)站時(shí),從進(jìn)入網(wǎng)站到瀏覽器關(guān)閉所經(jīng)過(guò)的一段時(shí)間,也就是用戶(hù)瀏覽這個(gè)網(wǎng)站所花費(fèi)的時(shí)間。Session在用戶(hù)第一次訪(fǎng)問(wèn)服務(wù)器的時(shí)候自動(dòng)創(chuàng)建,其生成后,只要用戶(hù)繼續(xù)訪(fǎng)問(wèn),服務(wù)器就會(huì)更新Session的最后訪(fǎng)問(wèn)時(shí)間,并維護(hù)該Session。服務(wù)器會(huì)把長(zhǎng)時(shí)間沒(méi)有活動(dòng)的Session從服務(wù)器內(nèi)存中清除,此時(shí)Session便失效。服務(wù)器會(huì)分配SessionⅢ給不同的用戶(hù),每個(gè)Session ID都是惟一的。文中設(shè)Session ID為一個(gè)分析對(duì)象,在這個(gè)分析對(duì)象中,所有出現(xiàn)的文獻(xiàn)被認(rèn)為是存在關(guān)聯(lián)關(guān)系的,它們之間的關(guān)聯(lián)關(guān)系將作為學(xué)科之間建立交叉關(guān)系的基礎(chǔ)。

      (1)明確一個(gè)Session ID中包含的每篇文獻(xiàn)的學(xué)科分類(lèi)。文獻(xiàn)學(xué)科分類(lèi)確定好之后,Session ID中出現(xiàn)的文獻(xiàn)之間的關(guān)系轉(zhuǎn)換為學(xué)科之間的關(guān)系。

      (2)再以Session ID為基礎(chǔ),交叉運(yùn)算每一個(gè)Session ID當(dāng)中存在的兩學(xué)科、三學(xué)科甚至多學(xué)科之間的相互交叉關(guān)系。假設(shè)一個(gè)Session ID當(dāng)中有若干篇文獻(xiàn),每篇文獻(xiàn)都有學(xué)科歸屬。文獻(xiàn)1學(xué)科分類(lèi)為A,文獻(xiàn)2學(xué)科分類(lèi)為C,文獻(xiàn)3學(xué)科分類(lèi)既屬于學(xué)科A又屬于學(xué)科B,此時(shí)認(rèn)為A和B學(xué)科之間存在交叉關(guān)系,A和C學(xué)科,B和C學(xué)科,A、B和c學(xué)科之間都存在學(xué)科交叉關(guān)系。在同一篇文獻(xiàn)中出現(xiàn)的交叉關(guān)系定義為內(nèi)在關(guān)系,同一個(gè)Session ID中出現(xiàn)的交叉關(guān)系定義為外在關(guān)系。學(xué)科之間每出現(xiàn)1次交叉計(jì)算1次出現(xiàn)頻次,以學(xué)科之間交叉出現(xiàn)的頻次作為學(xué)科交叉關(guān)系程度的反映。

      (3)學(xué)科交叉的研究的熱點(diǎn)分析,也同樣引入Session ID關(guān)系影響因素,擴(kuò)大文獻(xiàn)中出現(xiàn)的關(guān)鍵詞關(guān)聯(lián)關(guān)系,同一個(gè)Session ID的用戶(hù)使用文獻(xiàn)的學(xué)科關(guān)鍵詞,關(guān)鍵詞的共現(xiàn)頻次不僅需要計(jì)算在同一篇文獻(xiàn)中兩兩共現(xiàn)的次數(shù),‘而且還要計(jì)算同一個(gè)Session ID中關(guān)鍵詞的兩兩共現(xiàn)次數(shù)。同一篇文獻(xiàn)中出現(xiàn)的關(guān)鍵詞的共現(xiàn)關(guān)系定義為內(nèi)在關(guān)系,同一Session ID出現(xiàn)的關(guān)鍵詞的共現(xiàn)關(guān)系定義為外在關(guān)系。

      1.2因子分析

      因子分析最早是由英國(guó)心理學(xué)家斯皮爾曼提出的,是一種從變量群中提取共性因子的數(shù)據(jù)簡(jiǎn)化統(tǒng)計(jì)技術(shù)。因子分析通過(guò)研究眾多變量間的內(nèi)部依賴(lài)關(guān)系,探求觀(guān)測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),找出變量中隱藏的具有代表性的因子,將相同本質(zhì)的變量歸入一個(gè)因子中,減少變量的數(shù)目,同時(shí)檢驗(yàn)變量間的假設(shè)關(guān)系,用假想的變量能夠反映出原來(lái)眾多變量的主要信息。換句話(huà)說(shuō),因子分析是尋找潛在的、起支配作用因子的方法。通過(guò)因子分析,將學(xué)科交叉出現(xiàn)的高頻關(guān)鍵詞提取出具有代表性的因子,以這些因子為類(lèi),分析得出學(xué)科交叉的熱點(diǎn)區(qū)域。

      1.3聚類(lèi)分析

      聚類(lèi)分析又稱(chēng)群分析,起源于分類(lèi)學(xué),是一種探索性分析方法,能夠分析事物的內(nèi)在特點(diǎn)和規(guī)律,并根據(jù)相似性原則對(duì)事物進(jìn)行分組,是數(shù)據(jù)挖掘中常用的一種技術(shù)。它特別適用于沒(méi)有先驗(yàn)知識(shí)的分類(lèi)。如果沒(méi)有這些事先的經(jīng)驗(yàn)或一些標(biāo)準(zhǔn),分類(lèi)便會(huì)顯得隨意和主觀(guān),這時(shí)只要設(shè)定比較完善的分類(lèi)變量,就可以通過(guò)聚類(lèi)分析法得到較為科學(xué)合理的類(lèi)別。學(xué)科之間交叉后會(huì)產(chǎn)生怎樣的知識(shí)分類(lèi),事先是無(wú)法得知的,通過(guò)聚類(lèi)分析,可以分類(lèi)得出,這樣就可以與因子分析的結(jié)果進(jìn)行比較,獲得較為滿(mǎn)意的學(xué)科交叉研究熱點(diǎn)的分析結(jié)果。

      2.數(shù)據(jù)采集與分析

      本文以復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺(tái)所獲得的用戶(hù)使用電子文獻(xiàn)行為的動(dòng)態(tài)數(shù)據(jù)為基礎(chǔ),從底層網(wǎng)絡(luò)數(shù)據(jù)中獲取用戶(hù)對(duì)學(xué)校訂購(gòu)的所有中文數(shù)據(jù)庫(kù)的檢索、瀏覽、下載等信息行為的日志數(shù)據(jù),及對(duì)應(yīng)數(shù)據(jù)庫(kù)文獻(xiàn)信息,如關(guān)鍵字、作者、引用、發(fā)表時(shí)間等數(shù)據(jù)。數(shù)據(jù)采集時(shí)間為2013年8月到2014年2月的有效數(shù)據(jù)共241 464條,有48 000多個(gè)Session ID,平均每個(gè)Session ID有5條左右記錄。

      2.1學(xué)科交叉程度分析

      在數(shù)據(jù)分析中學(xué)科分類(lèi)采用的是《中國(guó)圖書(shū)館分類(lèi)法》,以此為基礎(chǔ)揭示學(xué)科之間的交叉情況。將采集到的有效數(shù)據(jù)與Session ID結(jié)合,按照上文介紹的運(yùn)算規(guī)則分析,并且對(duì)于同一篇文獻(xiàn)中學(xué)科交叉頻次,賦值為0.6,同一Session ID出現(xiàn)的學(xué)科交叉頻次,賦值為0.4,獲得的學(xué)科交叉程度結(jié)果如下(見(jiàn)表1):endprint

      猜你喜歡
      動(dòng)態(tài)數(shù)據(jù)學(xué)科交叉聚類(lèi)分析
      云計(jì)算環(huán)境下動(dòng)態(tài)數(shù)據(jù)聚集算法研究
      顳下頜關(guān)節(jié)三維動(dòng)態(tài)數(shù)據(jù)測(cè)量的初步研究
      新形式下計(jì)算機(jī)輔助翻譯實(shí)驗(yàn)室建設(shè)探究
      亞太教育(2016年33期)2016-12-19 03:12:29
      創(chuàng)新創(chuàng)業(yè)設(shè)計(jì)人才培養(yǎng)導(dǎo)向的學(xué)科專(zhuān)業(yè)交叉融合策略
      農(nóng)村居民家庭人均生活消費(fèi)支出分析
      基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
      基于聚類(lèi)分析的互聯(lián)網(wǎng)廣告投放研究
      科技視界(2016年20期)2016-09-29 12:32:48
      大學(xué)科技社團(tuán)關(guān)于學(xué)科交叉建設(shè)的探索和思考
      “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
      《機(jī)電傳動(dòng)控制》課程教學(xué)改革的探索
      考試周刊(2016年18期)2016-04-14 19:13:28
      阳城县| 中西区| 贡觉县| 周口市| 会同县| 温泉县| 武平县| 五常市| 青川县| 鄯善县| 恭城| 合水县| 大埔区| 沅江市| 德钦县| 石渠县| 巫溪县| 临湘市| 新田县| 海口市| 元谋县| 耒阳市| 霸州市| 龙山县| 兴安县| 修文县| 滁州市| 汕尾市| 邵东县| 府谷县| 三台县| 池州市| 宁海县| 庄河市| 佛教| 眉山市| 奉贤区| 廊坊市| 乌拉特前旗| 芮城县| 聂荣县|