劉帥,王佳
(1.南京市城市與交通規(guī)劃設(shè)計研究院股份有限公司,江蘇 南京 210018;2.長沙理工大學 交通運輸工程學院,湖南 長沙 410114)
隨著大數(shù)據(jù)的發(fā)展,電子地圖提供的各類興趣點(point of interest,簡稱為POI)為交通規(guī)劃設(shè)計提供了一種新的數(shù)據(jù)支撐。國外對于POI 數(shù)據(jù)的獲取和應用研究較早。Mummidi[1]等人通過分析用戶在地圖上注釋的標簽,發(fā)現(xiàn)興趣點,增加了POI 數(shù)據(jù)的獲取途徑。Xie[2]等人提出網(wǎng)絡(luò)核密度分析,將線要素引入核密度分析,提高了核密度的運算效率。Lian[3]等人將POI 簽到信息劃分權(quán)重,通過用戶的簽到頻率增大POI 的影響區(qū)域,幫助用戶推薦感興趣的POI 信息。李偉[4]等人通過GIS 平臺對POI 數(shù)據(jù)進行處理,對廈門島內(nèi)常規(guī)公交線路的可達性進行了評價。于浩川[5]等人以公交線路數(shù)據(jù)和POI 數(shù)據(jù)為基礎(chǔ),通過開發(fā)軟件對城市公交線路進行規(guī)劃。這些研究成果表明:國外研究主要集中于POI數(shù)據(jù)分析,而國內(nèi)主要集中于POI 應用,但POI 數(shù)據(jù)在交通規(guī)劃應用中還有諸多缺陷。因此,作者通過分析POI 數(shù)據(jù)的獲取和處理,擬構(gòu)建研究區(qū)域格網(wǎng)坐標,提取模型和分區(qū)導出模型,提高POI 數(shù)據(jù)扒取的準確性和處理效率,以期為交通規(guī)劃提供前期的基礎(chǔ)數(shù)據(jù)。
POI 與人們的日常生活息息相關(guān)[6],其含有地理信息的空間實體[7],是可以通過計算機編程語言從電子地圖檢索和扒取的位置大數(shù)據(jù)來獲取。通常包含ID、名稱、經(jīng)緯度、類別等相關(guān)信息,其中經(jīng)緯度是POI 數(shù)據(jù)的核心屬性。
POI 數(shù)據(jù)具有樣本量大、獲取成本低、更新速度快、位置精度高及涵蓋信息詳細等優(yōu)勢[8]。POI的空間分布可以反映城市的空間結(jié)構(gòu)。POI 數(shù)據(jù)越密集,城市功能越集中,則該區(qū)域可獲得的機會越多。POI 的空間分布對交通規(guī)劃設(shè)計和交通基礎(chǔ)設(shè)施的布局有重要指導作用[9]。
本研究采用高德地圖POI 三級分類標準,一級分類23 種,二級分類264 種,三級分類869 種。通過分析各分類POI 對交通規(guī)劃影響程度的大小,基于居民使用頻次和設(shè)施點數(shù)量,對電子地圖POI各類設(shè)施進行篩選和分類,篩選出與交通規(guī)劃相關(guān)程度較大的設(shè)施類型。從一級分類中,選出12 個POI 類型,見表1。
表1 溆浦縣城區(qū)主要POI 數(shù)量表Table 1 Quantity table of main POI in Xupu County
傳統(tǒng)的POI 獲取方式是實地調(diào)研采集,但數(shù)據(jù)量小不能大范圍的進行數(shù)據(jù)分析。隨著地理信息大數(shù)據(jù)的發(fā)展,人們對全球地理信息數(shù)據(jù)的需求也日趨增加,獲取方式也更加便利。
目前,POI 獲取主要有3 種途徑:①通過爬蟲代碼從電子地圖扒??;②通過電子地圖開放平臺(百度地圖API、高德地圖API 等)來扒取POI,這些網(wǎng)站開放了較為完善的開發(fā)接口[10];③通過集客大數(shù)據(jù)、Geosharp、火車頭和八爪魚等軟件,直接采集POI 數(shù)據(jù)。利用Geosharp 軟件獲取POI 數(shù)據(jù)的操作相對簡單、可行性高,并且POI 數(shù)據(jù)的準確率高,因此,通過它獲取研究區(qū)域的POI。
Geosharp 是一種網(wǎng)絡(luò)地圖數(shù)據(jù)采集軟件,主要包括地理編碼、坐標轉(zhuǎn)換和數(shù)據(jù)采集3 個模塊。地理編碼模塊可以把地址信息解析為經(jīng)緯度;坐標轉(zhuǎn)換提供百度、WGS84 和火星坐標系之間的轉(zhuǎn)換;數(shù)據(jù)采集模塊可采取所有類型的POI 數(shù)據(jù)和天氣預報數(shù)據(jù)。
Geosharp 獲取POI 數(shù)據(jù)可分為3 個步驟:①選擇需要獲取的POI 類型。根據(jù)高德地圖分類標準,采用POI 的一級分類獲取。②確定研究區(qū)域,設(shè)置研究區(qū)域的經(jīng)緯度。如果研究范圍不大,則可以直接獲取。但研究范圍過大,需要進行格網(wǎng)劃分,分區(qū)獲取。③確定數(shù)據(jù)保存路徑。
Geosharp 的“高德地圖POI 采集工具”只需研究范圍的經(jīng)緯度,即可采集該矩形范圍內(nèi)所有POI數(shù)據(jù),根據(jù)需要導出到Excel 中。通過經(jīng)緯度在地圖上添加X,Y 坐標,生成位置信息。通過POI 類別,研究各類型POI 的出行特征。通過ID,確定POI的唯一性。
POI 數(shù)據(jù)在進行大范圍采集時,由于研究區(qū)域過大,如果一次輸入整個范圍的經(jīng)緯度,不僅會花費大量時間,而且容易造成軟件異常和數(shù)據(jù)丟失。因此,會增加獲取數(shù)據(jù)的難度,其結(jié)果的誤差也較大。其解決辦法是對該區(qū)域劃分成格網(wǎng)單元[11],按照每個網(wǎng)格的經(jīng)緯度坐標扒取POI,再對數(shù)據(jù)進行合并。通過多種區(qū)域格網(wǎng)劃分方法進行比較,發(fā)現(xiàn)FME[12]數(shù)據(jù)的交換與處理操作最簡單,自動化程度高。因此,采用FME 對區(qū)域進行格網(wǎng)劃分,并自動提取格網(wǎng)坐標。FME 可以實現(xiàn)超過200 種不同空間數(shù)據(jù)格式(模型)之間的轉(zhuǎn)換,是一款無縫連接多平臺空間數(shù)據(jù)的操作工具。FME 的操作流程主要分為讀模塊、轉(zhuǎn)化器模塊和寫模塊3 個部分。讀模塊可以從外部數(shù)據(jù)源讀取要素數(shù)據(jù)。轉(zhuǎn)換器可以在使用者的控制下,將這些數(shù)據(jù)合并或分割,從一種表達格式轉(zhuǎn)換為另一種表達格式,也可以將這些要素掛接到外部數(shù)據(jù)庫上。寫模塊將這些要素以一種支持的格式進行輸出。
本研究通過FME 軟件進行建模,自動對城市的格網(wǎng)進行劃分,提取格網(wǎng)坐標。具體流程:
1) 通過讀模塊將研究范圍地理文件進行導入;
2) 通過2DGridAccumulator 轉(zhuǎn)換器生成格網(wǎng),按照行列數(shù)進行拆分,創(chuàng)建格網(wǎng)類型,選擇Polygons;
3) 通過GeometryCoercer 轉(zhuǎn)換器將研究范圍面轉(zhuǎn)換為線,幾何對象類型改為fme_line;
4) 通過BoundsExtractor 轉(zhuǎn)換器提取格網(wǎng)坐標;
5) 通過AttributeManager 轉(zhuǎn)換器將經(jīng)緯度合并成一個單元格;
6) 通過counter 轉(zhuǎn)換器進行計數(shù),設(shè)置計數(shù)從1 開始;
7) 通過寫模塊將格網(wǎng)經(jīng)緯度輸出到 Excel文件。
根據(jù)FME 構(gòu)造模型,將研究區(qū)域進行自動化劃分格網(wǎng),得到每個格網(wǎng)左上角和右下角的經(jīng)緯度坐標。再將經(jīng)緯度坐標依次輸入Geosharp 高德地圖的POI 采集工具。最后,通過Geosharp 分區(qū)獲取POI 數(shù)據(jù),得到整個研究區(qū)域所有的POI 數(shù)據(jù)。
通過Geosharp,從高德地圖中采集POI 數(shù)據(jù)類型較多,但采用手動方法對各類Excel 進行合并的,操作比較繁瑣。因此,采用FME 進行建模,自動將各類型POI 進行合并。FME 模型構(gòu)建流程為:
1) 讀取文件夾,將POI 的Excel 文件通過讀模塊進行導入。
2) 通過AttributeSplitter 轉(zhuǎn)換器,對POI 類別進行拆分,創(chuàng)建3 個屬性。Attribute Value 值分別為type_list{0},type_list{1},type_list{2}。
3) 通過寫模塊將所有數(shù)據(jù)輸出到Excel。
通過ArcGIS for Desktop 實現(xiàn)POI 數(shù)據(jù)和地圖的關(guān)聯(lián)。ArcGIS for Desktop 作為GIS 中的主流產(chǎn)品,其特點是數(shù)據(jù)管理效率高、空間分析能力強、可視化程度高。ArcGIS 為大數(shù)據(jù)的管理、分析和可視化提供了有效的處理工具。ArcGIS for Desktop主要由ArcCalalog (管理空間數(shù)據(jù))、ArcGlobe(大型三維場景處理與分析)、ArcMap(二維數(shù)據(jù)的處理、管理和分析)和ArcScene(小型三維場景處理與分析)4 個部分構(gòu)成。
通過FME 數(shù)據(jù)合并模型對POI 數(shù)據(jù)進行整合,導入到ArcMap 中,按照經(jīng)緯度屬性添加X,Y 坐標,生成位置信息,設(shè)置坐標系統(tǒng),將POI 地理信息數(shù)據(jù)可視化,得到整個研究區(qū)域的POI 分布情況。POI 數(shù)據(jù)可視化結(jié)果如圖1 所示。
圖1 POI 點數(shù)據(jù)空間分布示意Fig.1 Spatial distribution of POI point data
如果將每個POI 點均作為一個功能單元,POI密度越高,表明該地區(qū)城市功能越集中。為了分析POI 的聚集特征,了解各類服務設(shè)施的空間分布狀況,利用ArcMap 10.2 的密度分析工具,對研究區(qū)域內(nèi)的各類興趣點進行分析。
3.3.1 核密度分析原理
密度分析是通過輸入數(shù)據(jù)的數(shù)量計算數(shù)據(jù)的集散程度,生成一個連續(xù)的密度分析面。通過計算得到密度,將每個點的密度值分布在研究區(qū)域上,最后得到每個柵格的像元值[13]。
密度分析中,最為重要的是核密度分析。核密度分析一般用于計算要素周圍鄰域的密度。既可以計算點要素的密度,也可以計算線要素的密度。核密度分析示意圖如圖2 所示。
根據(jù)概率理論,核密度分析模型為[14?15]:
圖2 核密度分析輸出要素示意Fig.2 Schematic diagram of output elements of kernel density analysis
式中: k( )為核函數(shù);h 為帶寬,h > 0; x - Xi為估值點x 到事件Xi處的距離。
核密度分析可以體現(xiàn)POI 數(shù)據(jù)點的空間分布,對點狀數(shù)據(jù)進行分析尤為有效。通過核密度分析,計算每個輸出柵格像元周圍點要素的密度,生成POI 數(shù)據(jù)點熱力圖。
核密度分析中,需要設(shè)置輸出像元大小和搜索半徑2 個參數(shù)。設(shè)置的搜索半徑越大,生成的密度柵格越平滑,概化程度越高;搜索半徑值越小,生成柵格顯示的信息越詳細。
3.3.2 交通小區(qū)劃分
交通規(guī)劃需要全面了解POI 對各類交通源的吸引程度。由于不可能對每個POI 單獨進行研究,因此,分析POI 時,需要根據(jù)交通小區(qū)對POI 進行合并處理。
為了將所有POI 數(shù)據(jù)按照交通小區(qū)依次導出,得到每個小區(qū)的各類POI。傳統(tǒng)的方法是劃分好交通小區(qū),依次裁剪,導出POI 數(shù)據(jù)。但當數(shù)據(jù)量較大,該方法費時費力,效率較差。ArcMap 可提供一種自動化處理工具—ModelBuilder,通過ArcMap的模型構(gòu)建器,輕松實現(xiàn)批處理工作。
ModelBuilder 是創(chuàng)建、編輯和管理模型的應用程序[16]。其原理是將一系列地理處理工具串聯(lián)在一起的工作流,它將其中一個工具的輸出作為另一個工具的輸入??蓪odelBuilder 看作一種簡單創(chuàng)建、可循環(huán)操作的可視化編程語言。進行模型構(gòu)建時,可以直接將工具箱的各種地理處理工具和需要處理的數(shù)據(jù)集拖動到模型構(gòu)建器界面中。然后,有序地把它們連接起來,實現(xiàn)批處理工作。
模型構(gòu)建器的優(yōu)勢:①ModelBuilder 可以集合ArcToolbox 各種工具,進行創(chuàng)建,并且自動化處理所構(gòu)建的工作流;②結(jié)合使用ModelBuilder 和腳本,可將ArcGIS 與其他應用程序進行集成;③Model?Builder 創(chuàng)建的自動化模型,可以在Python 腳本中使用。
本模型構(gòu)建中,將劃分好的交通小區(qū)在ArcMap 按字段依次導出,添加裁剪工具,輸入要素為POI 點數(shù)據(jù),裁剪要素為交通小區(qū)面數(shù)據(jù),得到各個交通小區(qū)的POI 數(shù)量。
通過ArcMap 中ModelBuilder 構(gòu)造,批量導出模型,將整體POI 數(shù)據(jù)按照交通小區(qū)進行劃分,依次導出。交通小區(qū)內(nèi),不同類型的POI 對于交通規(guī)劃的影響程度不一。通過結(jié)構(gòu)熵權(quán)法,確定各類POI對公交出行的影響權(quán)重,依次對不同類別POI 進行量化計算,得到各個小區(qū)的當量POI 數(shù)據(jù),為后續(xù)交通規(guī)劃、公交線網(wǎng)優(yōu)化[17]提供數(shù)據(jù)支撐。量化公式為:
式中:Di為交通小區(qū)i 的當量POI;E 為獲取的POI類型數(shù);we為第e 類POI 的權(quán)重;die為交通小區(qū)i第e 類POI 數(shù)量。
以溆浦縣為例,通過Geosharp 軟件和高德地圖,獲取城區(qū)各類POI 數(shù)據(jù)。獲取POI 之前,避免區(qū)域過大,造成數(shù)據(jù)丟失,對研究區(qū)域進行格網(wǎng)劃分,采用FME 格網(wǎng)劃分模型對溆浦縣城區(qū)進行格網(wǎng)劃分,如圖3 所示。
通過Geosharp,由高德地圖分區(qū),獲取格網(wǎng)小區(qū)POI。根據(jù)FME 的數(shù)據(jù)合并模型,將格網(wǎng)小區(qū)POI 數(shù)據(jù)進行合并、數(shù)據(jù)清洗,為ArcGIS 建立POI地理數(shù)據(jù)庫進行前期數(shù)據(jù)準備。本試驗獲取了12個POI 類型,有效POI 數(shù)量為1 800 條,見表1。
圖3 溆浦縣格網(wǎng)劃分示意Fig.3 Grid division diagram of the Xupu County
先將POI 數(shù)據(jù)導入ArcGIS,添加經(jīng)緯度信息,設(shè)置地理坐標系為WGS 1984,導入溆浦縣中心城區(qū)用地現(xiàn)狀圖,進行地理配準。再將POI 數(shù)據(jù)加載到溆浦縣中心城區(qū)用地現(xiàn)狀圖進行核密度分析。設(shè)置熱力圖顏色,顏色越深,表示POI 數(shù)據(jù)比較密集;顏色越淺,表示POI 聚集程度較為稀疏。溆浦縣POI數(shù)據(jù)空間分布如圖4 所示。
圖4 溆浦縣POI 空間分布熱力Fig.4 Thermal map of of POI in the Xupu County
根據(jù)溆浦縣城區(qū)道路現(xiàn)狀和城市規(guī)劃分區(qū)情況,將該區(qū)域劃分為22 個交通小區(qū),小區(qū)劃分示意圖如圖5 所示。
通過ArcMap 的ModelBuilder 構(gòu)造,批量導出模型,將所有POI 數(shù)據(jù)按照劃分的交通小區(qū)依次導出,得到每個小區(qū)的POI 類別和數(shù)量,通過權(quán)重進行量化見表2。
圖5 溆浦縣交通小區(qū)劃分示意Fig.5 Division diagram of traffic district of the Xupu County
表2 量化后交通小區(qū)POI 數(shù)量Table 2 Number of POI in traffic area after quantification
通過FME 構(gòu)造格網(wǎng)坐標提取模型,對研究區(qū)域進行格網(wǎng)劃分,再采用Geosharp 軟件獲取POI數(shù)據(jù),最后基于ArcGIS 模型構(gòu)建分區(qū)導出模型,將POI 數(shù)據(jù)分區(qū)導出,并進行量化處理。通過采用格網(wǎng)坐標提取模型和分區(qū)導出模型進行自動化處理,再導出各類POI 數(shù)據(jù)。該方法比原有裁剪導出操作更節(jié)省時間,也更有效率。