• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      用戶標(biāo)簽揭示進(jìn)出口量:基于標(biāo)簽共現(xiàn)的空間關(guān)聯(lián)性分析

      2022-06-05 04:46:04張雙印
      測(cè)繪地理信息 2022年3期
      關(guān)鍵詞:關(guān)聯(lián)性關(guān)聯(lián)標(biāo)簽

      游 想 張雙印 費(fèi) 騰

      1武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北武漢,430079

      2武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北武漢,430079

      區(qū)域間的關(guān)聯(lián)性研究對(duì)促進(jìn)區(qū)域協(xié)調(diào)發(fā)展具有重要意義。而區(qū)域關(guān)聯(lián)性分析取決于如何利用關(guān)聯(lián)這些區(qū)域的各種數(shù)據(jù)。有眾多研究強(qiáng)調(diào)了網(wǎng)絡(luò)嵌入對(duì)區(qū)域關(guān)聯(lián)性研究的重要性[1?7]。而在很大一部分研究中,區(qū)域關(guān)系是基于網(wǎng)絡(luò)中節(jié)點(diǎn)之間的流量數(shù)據(jù)計(jì)算的,如交通流量、乘客流量、人口遷移[8?10];或基于在線用戶生成數(shù)據(jù)計(jì)算。例如,F(xiàn)lickr網(wǎng)站上用戶位置信息作為一種在線用戶生成數(shù)據(jù)資源,被用于量化人類的旅行流量[11,12],進(jìn)而被用于分析區(qū)域間的關(guān)聯(lián)性;微博也是一種在線用戶生成的數(shù)據(jù)資源,可通過研究微博用戶的社會(huì)關(guān)系和地理位置變化來確定區(qū)域相關(guān)性[13,14]。以上研究主要針對(duì)用戶帶來的實(shí)際流和虛擬流,僅利用人口流動(dòng)和人際交往的目標(biāo)和強(qiáng)度來描述區(qū)域間關(guān)聯(lián)性強(qiáng)度不夠全面,這些研究本質(zhì)上只圍繞存在于“第一空間”[15]的流進(jìn)行,“第二空間”中的流則被有意或無意地忽略了?!暗谝豢臻g”即人們看到的“物理”空間,是一門物質(zhì)的、可見的、可測(cè)量的、對(duì)空間客觀判定的正式科學(xué);“第二空間”指人的感知與“第一空間”的結(jié)合,是對(duì)空間進(jìn)行建模和概念化的規(guī)劃者和城市學(xué)家的空間[15]。

      Twitter、Flickr和微博等社交網(wǎng)絡(luò)應(yīng)用程序的使用已然是一種潮流,這為從人的感知角度來研究區(qū)域聯(lián)系提供了數(shù)據(jù)依據(jù)。隨著這些社交應(yīng)用的興起,出現(xiàn)了一些關(guān)于社交網(wǎng)絡(luò)應(yīng)用的共現(xiàn)分析研究[16,17],其中,較為簡(jiǎn)單的標(biāo)簽共現(xiàn)分析主要被用來研究這些標(biāo)簽之間的關(guān)系,或進(jìn)行標(biāo)簽特征分析和語(yǔ)義分析,很少被用于區(qū)域關(guān)聯(lián)性分析。本文利用Flickr中用戶生成的標(biāo)簽數(shù)據(jù),通過標(biāo)簽共現(xiàn)分析從人類感知的角度來研究世界各地之間更加全面的關(guān)聯(lián)。本文使用帶有地理坐標(biāo)的用戶標(biāo)簽數(shù)據(jù)進(jìn)行研究,避免了地名的模糊性問題,在“第二空間”中繪制了區(qū)域間的概念流,且為了進(jìn)一步探索該方法的潛在實(shí)用性,選取了一些樣本國(guó)家,對(duì)由本文方法計(jì)算出的它們之間的概念關(guān)聯(lián)強(qiáng)度與貿(mào)易交互量進(jìn)行了相關(guān)性分析。

      1 研究數(shù)據(jù)與方法

      1.1 研究數(shù)據(jù)

      本文所用的全球用戶標(biāo)簽數(shù)據(jù)和相應(yīng)的位置信息是從Yahoo Flickr Creative Commons 100 Million(YFCC100M)數(shù)據(jù)集中提取的,該數(shù)據(jù)集包含2004?04—2014?08拍攝的公開的照片。提取其中最常用的20 000個(gè)英文標(biāo)簽作為研究數(shù)據(jù),排除了一些沒有實(shí)際意義的單詞,如“at”和“to”這些常用介詞。

      1.2 研究方法

      如果兩個(gè)地名同時(shí)出現(xiàn)在同一文本中,則可以認(rèn)為它們有關(guān)聯(lián)[18,19]。在本文中,如果兩個(gè)區(qū)域被相同的標(biāo)簽標(biāo)記,則認(rèn)為它們有關(guān)聯(lián)。具有相同標(biāo)簽的區(qū)域可視為網(wǎng)絡(luò)中的兩個(gè)節(jié)點(diǎn)被這個(gè)標(biāo)簽所關(guān)聯(lián),并在網(wǎng)絡(luò)中由一條邊連接表示該關(guān)聯(lián)關(guān)系。區(qū)域之間的邊連接得越多,表示這些區(qū)域被越多相同的標(biāo)簽所標(biāo)記,即這些區(qū)域之間的概念關(guān)聯(lián)強(qiáng)度越強(qiáng)。在Bonne投影下,將世界地圖分割成多個(gè)100×100 km的標(biāo)準(zhǔn)網(wǎng)格,構(gòu)造一個(gè)查找表,表的一側(cè)列出了所有有效的用戶標(biāo)簽,表的另一側(cè)對(duì)應(yīng)相應(yīng)用戶標(biāo)簽所在的網(wǎng)格編碼。

      1.2.1 節(jié)點(diǎn)之間的概念關(guān)聯(lián)性

      1)構(gòu)建標(biāo)簽網(wǎng)絡(luò)。在查找表中,一個(gè)標(biāo)簽可以對(duì)應(yīng)多個(gè)網(wǎng)格,先將這些網(wǎng)格視為節(jié)點(diǎn),具有相同標(biāo)簽的任意兩個(gè)節(jié)點(diǎn)都可以通過邊連接,從而形成每個(gè)標(biāo)簽的網(wǎng)絡(luò);再將20 000個(gè)標(biāo)簽的所有網(wǎng)絡(luò)疊加,形成一個(gè)包含13 968個(gè)相關(guān)聯(lián)節(jié)點(diǎn)(網(wǎng)格)的集成網(wǎng)絡(luò)。在這個(gè)集成網(wǎng)絡(luò)中,任意兩個(gè)節(jié)點(diǎn)之間的邊數(shù)表示有多少相同的用戶標(biāo)簽被用來描述這兩個(gè)不同的位置(區(qū)域),或者在另一個(gè)意義上,表示它們之間概念關(guān)聯(lián)強(qiáng)度。通常,節(jié)點(diǎn)之間連接的邊的數(shù)量越多,表示節(jié)點(diǎn)之間的關(guān)聯(lián)度越強(qiáng)。

      2)基于標(biāo)簽網(wǎng)絡(luò)計(jì)算概念關(guān)聯(lián)強(qiáng)度。通過不同方式給節(jié)點(diǎn)之間的邊賦權(quán)重,以下指標(biāo)可用于計(jì)算標(biāo)簽共現(xiàn)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的概念關(guān)聯(lián)強(qiáng)度:

      ①節(jié)點(diǎn)之間的邊數(shù)(number of edges,NE)。在這個(gè)指標(biāo)中,所有邊的權(quán)重都是相等的,具體到每條邊,lm ij表示節(jié)點(diǎn)i和節(jié)點(diǎn)j被標(biāo)簽m同時(shí)標(biāo)記一次,不考慮帶有標(biāo)簽m的照片在這兩個(gè)節(jié)點(diǎn)中的數(shù)量??紤]到節(jié)點(diǎn)所包含的標(biāo)簽個(gè)數(shù)的影響,即對(duì)于同一個(gè)共現(xiàn)標(biāo)簽,不同節(jié)點(diǎn)包含的帶有該標(biāo)簽的照片數(shù)目有所不同。在計(jì)算兩節(jié)點(diǎn)之間的關(guān)聯(lián)強(qiáng)度時(shí),該指標(biāo)記錄了兩個(gè)節(jié)點(diǎn)中出現(xiàn)的所有標(biāo)簽的數(shù)目,再令節(jié)點(diǎn)間的邊數(shù)除以該數(shù)目。即對(duì)于節(jié)點(diǎn)i、j,Ti和Tj分別是節(jié)點(diǎn)i、j中出現(xiàn)的標(biāo)簽集合,Tij是Ti和Tj的并集,tij是集合Tij中包含的不同標(biāo)簽個(gè)數(shù)。NE指標(biāo)計(jì)算的節(jié)點(diǎn)i、j之間的關(guān)聯(lián)強(qiáng)度如下:

      式中,M是所有標(biāo)簽總數(shù),等于20 000;Om i表示節(jié)點(diǎn)i中是否有標(biāo)簽m,有則為1,反之為0。

      ②節(jié)點(diǎn)之間邊的權(quán)重之和(sum of the weight of edges,SWE)。不同共現(xiàn)標(biāo)簽可能對(duì)兩個(gè)節(jié)點(diǎn)之間的關(guān)聯(lián)強(qiáng)度貢獻(xiàn)不同,相同標(biāo)簽所對(duì)應(yīng)的照片數(shù)量在不同節(jié)點(diǎn)中可能會(huì)有很大差異。鑒于此,每個(gè)節(jié)點(diǎn)中每個(gè)標(biāo)簽的照片數(shù)量被記錄下來用于計(jì)算這個(gè)新指標(biāo)(SWE),每條邊的權(quán)重由一對(duì)節(jié)點(diǎn)中所包含的由共同標(biāo)簽所標(biāo)記的較少照片數(shù)量表示,不同的邊可能具有不同的權(quán)重:

      行業(yè)事業(yè)單位需要建立大型設(shè)備的使用管理新模式,不能僅滿足于正常開展教育教學(xué)、衛(wèi)生醫(yī)療、科學(xué)研究等行業(yè)事業(yè)需求,需要借助信息化系統(tǒng)提高使用績(jī)效,最大化提高管理手段的豐富性、規(guī)范性,做到有章可循。國(guó)子軟件長(zhǎng)期致力于行業(yè)資產(chǎn)管理理論研究,將結(jié)合豐富的管理軟件實(shí)踐及服務(wù)經(jīng)驗(yàn),助力各單位的大型設(shè)備使用績(jī)效管理的提升。

      在SWE指標(biāo)中,對(duì)于每個(gè)節(jié)點(diǎn)對(duì),它們之間不同邊的權(quán)重變化很大,權(quán)重較大的邊可能會(huì)掩蓋權(quán)重較小的邊對(duì)節(jié)點(diǎn)間關(guān)聯(lián)強(qiáng)度的貢獻(xiàn)。為了減少權(quán)重大的邊對(duì)節(jié)點(diǎn)之間概念關(guān)聯(lián)強(qiáng)度的貢獻(xiàn),加強(qiáng)邊的數(shù)量對(duì)節(jié)點(diǎn)之間概念關(guān)聯(lián)強(qiáng)度的貢獻(xiàn),本文提出了一個(gè)新的指標(biāo)SWE?log,在這個(gè)指標(biāo)中,邏輯回歸函數(shù)被應(yīng)用于邊權(quán)重的計(jì)算,計(jì)算公式如下:

      式中,z為閾值,通過多次實(shí)驗(yàn)選擇了所有權(quán)重的均值作為z;e表示自然常數(shù)。

      ③詞頻?逆向文檔頻率的節(jié)點(diǎn)間邊的權(quán)值之和(sum of the weight of edges term frequency?inverse document frequency,SWE?TF?IDF)。節(jié)點(diǎn)中普遍存在的標(biāo)簽共現(xiàn)對(duì)節(jié)點(diǎn)之間的概念關(guān)聯(lián)強(qiáng)度通常不太重要,為了減弱廣泛分布的標(biāo)簽(在眾多節(jié)點(diǎn)所有節(jié)點(diǎn)中出現(xiàn))的影響,采用TF?IDF方法來度量邊的權(quán)重。在文本挖掘預(yù)處理中,TF?IDF是一種統(tǒng)計(jì)方法,用于評(píng)估單個(gè)單詞對(duì)文集語(yǔ)料庫(kù)中的文檔集或其中一個(gè)文檔的重要性。單詞對(duì)某個(gè)文檔的重要性隨著它們?cè)谠撐臋n中出現(xiàn)次數(shù)的增加而增加,但隨著它們?cè)谡麄€(gè)語(yǔ)料庫(kù)中出現(xiàn)頻率的上升而降低。在該指標(biāo)中,TF?IDF被用于評(píng)估每條共現(xiàn)邊對(duì)節(jié)點(diǎn)之間概念關(guān)聯(lián)強(qiáng)度的重要性,邊的權(quán)重計(jì)算如下:

      式中,F(xiàn)m表示出現(xiàn)標(biāo)簽m的節(jié)點(diǎn)數(shù);F表示節(jié)點(diǎn)總數(shù);Ni表示節(jié)點(diǎn)i中的照片總數(shù)。節(jié)點(diǎn)之間的概念關(guān)聯(lián)強(qiáng)度計(jì)算公式如下:

      1.2.2 國(guó)家之間的概念關(guān)聯(lián)性

      1.2.3 交互作用與相似性的較量

      為了確定本文方法得到的這些國(guó)家之間的概念關(guān)聯(lián)強(qiáng)度是表明國(guó)家之間的交互作用還是相似性,對(duì)20個(gè)國(guó)家相互之間的關(guān)聯(lián)強(qiáng)度與它們間的交互作用和相似度分別進(jìn)行了相關(guān)性分析。各國(guó)之間的交互作用是根據(jù)從Chatham House收集到的2004—2014年10年間各國(guó)之間的進(jìn)出口量(貿(mào)易量)計(jì)算的。這些進(jìn)出口量和從The World Bank收集的各國(guó)人口、土地面積和人均國(guó)內(nèi)生產(chǎn)總值的平均值被視為各國(guó)的特征,形成每個(gè)國(guó)家的特征向量。歸一化后,通過計(jì)算20個(gè)特征向量?jī)蓛芍g的余弦相似度,得到20個(gè)國(guó)家兩兩之間的相似度。

      1.2.4 探索分析

      為了進(jìn)一步探索本文方法的潛力,且由于Cha?tham House和The World Bank上的數(shù)據(jù)時(shí)間上限為2017年,本文還計(jì)算了2005—2015年、2006—2016年、2007—2017年這20個(gè)國(guó)家兩兩之間的交互作用和相似度,并將其與本文方法所得的國(guó)家間的關(guān)聯(lián)強(qiáng)度(2004—2014年)進(jìn)行皮爾遜相關(guān)性分析。

      2 研究結(jié)果

      實(shí)驗(yàn)得到了20個(gè)國(guó)家兩兩之間的貿(mào)易交互作用和相似度。表1為皮爾遜相關(guān)性分析結(jié)果。4種概念關(guān)聯(lián)強(qiáng)度指標(biāo)與國(guó)家間貿(mào)易交互強(qiáng)度的皮爾遜相關(guān)分析的P值均小于0.01,具有統(tǒng)計(jì)學(xué)意義,且皮爾遜相關(guān)系數(shù)均在0.7左右,相關(guān)性較好。而這4種概念關(guān)聯(lián)強(qiáng)度指標(biāo)與國(guó)家間相似度的相關(guān)系數(shù)要低得多,均小于0.2。這表明用Flickr用戶標(biāo)簽數(shù)據(jù)計(jì)算出的國(guó)家間關(guān)聯(lián)強(qiáng)度與國(guó)家間貿(mào)易交互強(qiáng)度是顯著相關(guān)的,關(guān)系較為密切;而國(guó)家間關(guān)聯(lián)強(qiáng)度與國(guó)家間的社會(huì)經(jīng)濟(jì)相似度間的相關(guān)性則要小得多,幾乎沒什么關(guān)聯(lián)。4個(gè)指標(biāo)中,SWE?TF?IDF關(guān)聯(lián)強(qiáng)度與各國(guó)之間的貿(mào)易交互強(qiáng)度(2004—2014年)之間的相關(guān)性最強(qiáng)。

      表1 皮爾遜相關(guān)性分析結(jié)果(2004—2014年)Tab.1 Pearson Correlation Coefficients(2004—2014)

      通過相關(guān)性分析得到了國(guó)家間4種概念關(guān)聯(lián)強(qiáng)度與2005—2015年、2006—2016年、2007—2017年國(guó)家間貿(mào)易交互強(qiáng)度和相似度之間的皮爾遜相關(guān)系數(shù)。國(guó)家間貿(mào)易交互強(qiáng)度與4種概念關(guān)聯(lián)強(qiáng)度之間的相關(guān)系數(shù)均大于0.69,如圖1(a)所示;而國(guó)家間的4種概念關(guān)聯(lián)強(qiáng)度與2005—2015年、2006—2016年、2007—2017年各國(guó)間相似度之間的皮爾遜相關(guān)系數(shù)均小于0.18,見圖1(b)。進(jìn)一步說明了研究得到的國(guó)家間的概念關(guān)聯(lián)強(qiáng)度更能代表國(guó)家間的貿(mào)易交互強(qiáng)度。圖1(a)還表明,國(guó)家間概念關(guān)聯(lián)強(qiáng)度與2005—2015年、2006—2016年、2007—2017年的國(guó)家間貿(mào)易交互作用之間的皮爾遜相關(guān)系數(shù)均高于其與2004—2014年間的國(guó)家間貿(mào)易交互作用之間的相關(guān)系數(shù),且時(shí)間越往后移,相關(guān)系數(shù)越大。這表明,由Flickr用戶標(biāo)簽數(shù)據(jù)計(jì)算得到的區(qū)域間概念關(guān)聯(lián)強(qiáng)度更能準(zhǔn)確地反映在該數(shù)據(jù)時(shí)間范圍之后的區(qū)域間貿(mào)易交互強(qiáng)度,這意味著本文方法可能具有預(yù)測(cè)國(guó)家之間貿(mào)易量的潛力。由圖1(a)可知,在這4個(gè)指標(biāo)中,SWE?TF?IDF指標(biāo)所得的國(guó)家間關(guān)聯(lián)強(qiáng)度能最好地表示國(guó)家間的貿(mào)易交互強(qiáng)度。

      圖1 相關(guān)性分析結(jié)果Fig.1 Correlation Analysis Results

      3 結(jié)束語(yǔ)

      本文以數(shù)百萬Flickr用戶上傳的照片中的標(biāo)簽和位置數(shù)據(jù)為基礎(chǔ),提出了一種標(biāo)簽共現(xiàn)的區(qū)域聯(lián)系分析方法,用4種指標(biāo)計(jì)算出了世界各地之間的概念關(guān)聯(lián)強(qiáng)度。對(duì)結(jié)果進(jìn)行相關(guān)性分析發(fā)現(xiàn),基于Flickr用戶感知的各種空間關(guān)聯(lián)性分析指標(biāo)都能很好地表示樣本國(guó)之間的貿(mào)易交互強(qiáng)度,并且能更好地表示未來的貿(mào)易交互強(qiáng)度,這表明用戶感知的空間關(guān)聯(lián)強(qiáng)度對(duì)國(guó)家間的貿(mào)易交互強(qiáng)度有一種導(dǎo)向作用。這也許反映了“第一空間”和“第二空間”不是孤立存在的,在社會(huì)歷史領(lǐng)域中,“第二空間”總是控制著“第一空間”,即想象的空間控制著具體的(真實(shí)的)空間[15]。

      與以往試圖揭示區(qū)域間相互作用強(qiáng)度的研究相比,本文方法是一種新的低成本方法,采用的是集體主觀方法,可以避免任意參數(shù)化過程,且使用的數(shù)據(jù)是由分布在世界各地的數(shù)百萬Flickr用戶提供的,故得到的結(jié)果更全面。本文方法在缺乏傳統(tǒng)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的情況下尤其有用,且具有很大潛力。為便于同國(guó)家的貿(mào)易數(shù)據(jù)進(jìn)行比較,本文方法僅在國(guó)家層面上實(shí)現(xiàn)了應(yīng)用,但只要用戶標(biāo)簽數(shù)據(jù)足夠,該方法就可以在任何空間尺度上得到應(yīng)用。此外,該方法對(duì)進(jìn)出口公司、期貨公司、保險(xiǎn)公司等都有利用價(jià)值,也可以幫助制定國(guó)家或地區(qū)的社會(huì)經(jīng)濟(jì)政策。在后續(xù)研究中,仍要不斷改進(jìn),希望在未來能有新發(fā)現(xiàn)。

      猜你喜歡
      關(guān)聯(lián)性關(guān)聯(lián)標(biāo)簽
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      奇趣搭配
      四物湯有效成分的關(guān)聯(lián)性分析
      中成藥(2017年3期)2017-05-17 06:09:05
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      如何準(zhǔn)確認(rèn)定排污行為和環(huán)境損害之間的關(guān)聯(lián)性
      標(biāo)簽化傷害了誰
      CRP檢測(cè)與新生兒感染的關(guān)聯(lián)性
      基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
      辽中县| 临高县| 枣强县| 岑溪市| 武乡县| 丹棱县| 鹤山市| 仙游县| 民丰县| 枣庄市| 陕西省| 定西市| 湘阴县| 宝兴县| 习水县| 鲁山县| 明光市| 葫芦岛市| 东阿县| 鄂尔多斯市| 卫辉市| 吉隆县| 元朗区| 阳东县| 长宁县| 浦江县| 凉山| 宁晋县| 景谷| 武义县| 江孜县| 华安县| 金昌市| 阳山县| 乌什县| 黑龙江省| 鸡泽县| 辉南县| 台中县| 始兴县| 通河县|