張慶來 張軍 蘇云
摘? 要:隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,城市社區(qū)中各類數(shù)據(jù)量劇增,內(nèi)容也越來越豐富。文章以華林山社區(qū)為例,調(diào)研了社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布現(xiàn)狀,分析了基于物聯(lián)網(wǎng)數(shù)據(jù)的社區(qū)管理決策目標,之后提出語義數(shù)據(jù)融合框架,最后根據(jù)框架提出了華林山社區(qū)的數(shù)據(jù)融合方案。該研究成果,對于推進社區(qū)的信息化建設,提高管理人員的決策水平具有參考作用。
關(guān)鍵詞:社區(qū)管理;數(shù)據(jù)融合;語義網(wǎng);SSN;SOSA
中圖分類號:G202;C916? ? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)23-0173-04
Research on Community Semantic Data Fusion Based on Internet of Things Technology
ZHANG Qinglai, ZHANG Jun, SU Yun
(School of Management, Lanzhou University, Lanzhou? 730013, China)
Abstract: With the development of Internet of Things technology, the amount of all kinds of data in urban communities has increased dramatically, and the content is becoming richer and richer. Taking Hualinshan community as an example, this paper investigates the current situation of community Internet of Things data distribution, analyzes the Community Management decision-making objectives based on Internet of Things data, then puts forward the semantic data fusion framework, and finally puts forward the data fusion scheme of Hualinshan community according to the framework. The research results of this paper can be used as a reference to promote the information construction of the community and improve the decision-making level of managers.
Keywords: Community Management; data fusion; Semantic Web; SSN; SOSA
0? 引? 言
隨著社區(qū)中物聯(lián)網(wǎng)數(shù)據(jù)越來越多,社區(qū)管理人員面對大量的數(shù)據(jù)卻很難做出有效決策。數(shù)據(jù)融合技術(shù)可以根據(jù)管理人員設定的決策目標,快速對數(shù)據(jù)進行加工處理,濃縮數(shù)據(jù)以支持決策。數(shù)據(jù)融合技術(shù)在數(shù)據(jù)的搜集、加工、判斷方面具有獨特的優(yōu)勢,而語義網(wǎng)技術(shù)則在自動推理、機器互動方面具有一定的專長。本文試圖將數(shù)據(jù)融合技術(shù)與語義網(wǎng)技術(shù)結(jié)合起來,提出語義數(shù)據(jù)融合方案,用于支持社區(qū)管理工作中的有效決策。
數(shù)據(jù)融合(Data Fusion,Data Aggregation),又稱數(shù)據(jù)聚集,是指對來自多個傳感器的數(shù)據(jù)進行多級別、多方面、多層次的處理,從而產(chǎn)生新的有意義的信息,而這種新信息是任何單一傳感器所無法獲得的[1]。常見的聚集操作有以下幾種,MAX(求最大值)、MIN(求最小值)、SUM(求和)、COUNT(計數(shù))、AVERAGE(求平均值)、MEDIAN(求中位數(shù))等[2]。多傳感器數(shù)據(jù)融合算法主要有加權(quán)平均法、神經(jīng)網(wǎng)絡法、Kalman濾波法、貝葉斯估計法、D-S證據(jù)理論等[3]。
2017年10月,W3C提出了SSN(Semantic Sensor Network Ontology)本體推薦標準,用于描述傳感器、制動器與采樣器的工作過程。SSN包括一個輕量級的核心本體叫SOSA(Sensor,Observation,Sample and Actuator),用于描述它的基本類與屬性。SSN和SOSA可以描述包括物聯(lián)網(wǎng)在內(nèi)的多種應用場景,這為基于物聯(lián)網(wǎng)技術(shù)的語義數(shù)據(jù)融合提供了基礎。
1? 社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布與決策目標
1.1? 社區(qū)物聯(lián)網(wǎng)數(shù)據(jù)分布現(xiàn)狀
本文選擇了蘭州市華林山社區(qū)作為樣本展開相關(guān)研究工作,該社區(qū)存在監(jiān)控視頻、門禁數(shù)據(jù)、計量傳感器數(shù)據(jù)、特殊傳感器、智能傳感器等類型的物聯(lián)網(wǎng)數(shù)據(jù)。該社區(qū)已經(jīng)安裝了監(jiān)控系統(tǒng),可以實現(xiàn)實時圖像采集。社區(qū)中已經(jīng)開始使用門禁系統(tǒng),可以對社區(qū)門禁與樓宇門禁實現(xiàn)在線監(jiān)控與數(shù)據(jù)統(tǒng)計。部分樓宇開始應用水電氣等物聯(lián)網(wǎng)傳感器來搜集數(shù)據(jù),已有居民使用智能家電、在線監(jiān)控等工具。在華林山社區(qū)中可以通過傳感器采集的數(shù)據(jù)有:
1.1.1? 小區(qū)門禁數(shù)據(jù)
可以來自門禁攝像頭的圖像識別,可以來自車庫的紅外線識別,主要提供與車輛有關(guān)的信息??梢杂脕肀O(jiān)控車輛情況,包括時間、地理位置、車牌號、收費等數(shù)據(jù),進而可以分析擁堵與停車場情況,也可以與駕駛員關(guān)聯(lián)起來,進行行為模式識別。如果小區(qū)采用RFID鑰匙出入,也可以對社區(qū)居民的相關(guān)數(shù)據(jù)進行搜集。
1.1.2? 樓宇門禁數(shù)據(jù)
樓宇門禁主要搜集關(guān)于居民出入的信息,主要來自使用RFID鑰匙的智能門鎖,可以搜集關(guān)于時間、樓宇號、房間號、計數(shù)(天計數(shù))等方面的數(shù)據(jù)。樓宇門禁的數(shù)據(jù)可以用來分析個人行為模式等。
1.1.3? 居民活動數(shù)據(jù)
可以通過搜集小區(qū)基站關(guān)于手機的信息,主要是基站連接數(shù)量等非敏感數(shù)據(jù)。在經(jīng)過授權(quán)的情況下,可以搜集GPS定位數(shù)據(jù)、移動軌跡等敏感數(shù)據(jù)。
1.1.4? 計量傳感器數(shù)據(jù)
數(shù)據(jù)源來自各類傳感器如水電燃氣、溫度等的計量設備。通過數(shù)據(jù)分析判斷特定事件,如水電氣異常事件、異常消費等,可以用于事件監(jiān)控與預警。
1.1.5? 視頻監(jiān)控數(shù)據(jù)
主要來自小區(qū)的各類監(jiān)控攝像頭,其中高清攝像頭可以進行圖像識別和事件識別。
1.1.6? 其他數(shù)據(jù)
包括專門傳感器如壓力傳感器、溫度傳感器、煙霧傳感器、各類氣體檢測傳感器等搜集的數(shù)據(jù),還包括未來會廣泛應用的智能傳感器如個人醫(yī)療設備、智能家居設備數(shù)據(jù)等搜集的數(shù)據(jù)。
1.2? 基于物聯(lián)網(wǎng)數(shù)據(jù)的社區(qū)決策目標
決策目標的識別是一個動態(tài)過程,需要周期性的進行,不斷對決策目標集合進行修正。華林山社區(qū)中的決策目標集合包括以下幾個方面。
1.2.1? 事件預警類
事件預警類內(nèi)容包括:
(1)突發(fā)人群聚集事件管理:社區(qū)的重大節(jié)日,或者傳統(tǒng)活動,可能會出現(xiàn)大量人員聚集。根據(jù)歷年數(shù)據(jù),可以對參與人群的規(guī)模做出大致預測。如果通過數(shù)據(jù)分析手段發(fā)現(xiàn)異常時,應向值班人員發(fā)出預警。
(2)異常行為模式事件管理:通過物聯(lián)網(wǎng)數(shù)據(jù)(攝像頭、小區(qū)門禁)、移動網(wǎng)絡數(shù)據(jù)(地理位置與數(shù)量)的統(tǒng)計,可以發(fā)現(xiàn)異常行為模式,之后做出預警。
1.2.2? 日常監(jiān)測類
日常監(jiān)測類內(nèi)容包括:
(1)常規(guī)監(jiān)測處理:對基于物聯(lián)網(wǎng)的數(shù)據(jù)進行建模,能夠識別特殊的車輛、人員等,甚至可以識別特殊的事件。
(2)閾值監(jiān)測處理:對社區(qū)內(nèi)各類計量傳感器進行監(jiān)控,如果傳感器數(shù)值突破界限即進行預警,此類數(shù)值包括最大值、最小值、頻度、位置變動范圍等。閾值分析可以使用物聯(lián)網(wǎng)方式監(jiān)控設備或資源的運行情況,如水電氣、通信等。
2? 社區(qū)語義數(shù)據(jù)融合框架
2.1? 數(shù)據(jù)融合方式
由于華林山社區(qū)地理范圍較大,傳感器種類較多,傳感器數(shù)量也相對較多,因此采用分布式數(shù)據(jù)融合方式比較合適。源節(jié)點(又稱傳感器節(jié)點,采集節(jié)點)發(fā)送的數(shù)據(jù)經(jīng)中間節(jié)點轉(zhuǎn)發(fā)時,中間節(jié)點(又稱數(shù)據(jù)融合節(jié)點,融合節(jié)點)查看數(shù)據(jù)包的內(nèi)容,進行相應的數(shù)據(jù)融合后再傳送到匯聚節(jié)點,由匯聚節(jié)點實現(xiàn)數(shù)據(jù)的綜合[4]。匯聚節(jié)點與決策目標相關(guān)聯(lián),必要的時候,匯聚節(jié)點可以給中間節(jié)點和源節(jié)點反饋調(diào)節(jié)信息。
2.2? 語義數(shù)據(jù)融合框架
傳統(tǒng)的數(shù)據(jù)融合方法中,從傳感器獲取數(shù)據(jù),要經(jīng)過數(shù)據(jù)(像素)級融合、特征級融合與決策級融合[5],在數(shù)據(jù)級進行數(shù)據(jù)粒度最小的數(shù)據(jù)融合,在特征級需要進行數(shù)學統(tǒng)計計算完成數(shù)據(jù)融合,而在決策級必須對數(shù)據(jù)進行建模分析后,才可以完成數(shù)據(jù)的融合,觸發(fā)決策目標。在決策級融合,數(shù)據(jù)復雜且與決策目標高度相關(guān),語義表達能力與推理能力就顯得尤為重要。
2.2.1? 傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合關(guān)系
傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合各有優(yōu)勢,如果能有效結(jié)合起來,將能兼顧二者的優(yōu)點。傳統(tǒng)的數(shù)據(jù)融合適用于相同類型的傳感器數(shù)據(jù)加工處理,如果涉及不同類型的傳感器,就需要人工干預,事先決定數(shù)據(jù)融合的方式與過程。當不斷有新傳感器類型出現(xiàn),并加入社區(qū)傳感器網(wǎng)絡的時候,人工干預的方式就會由于工作量大,容易出錯而變得效率較低。此時,如果能引入基于語義網(wǎng)的數(shù)據(jù)融合方式,由于數(shù)據(jù)的語義描述只需要進行一次,之后的數(shù)據(jù)融合過程可以由機器自動完成,并可以進行語義推理,效率將會大大提高。
傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合相結(jié)合的過程中,需要決定在哪一級引入語義描述。雖然可以在特征級引入本體描述,也可以在決策級引入本體描述,但數(shù)據(jù)的語義只有在與決策目標相關(guān)聯(lián)時,語義分析與推理的價值才得以展現(xiàn)出來,在數(shù)據(jù)級與特征級主要涉及的是數(shù)據(jù)運算,語義價值并不能得以充分體現(xiàn)。因此,本文擬在數(shù)據(jù)融合的決策級引入語義描述的方案。
2.2.2? 語義數(shù)據(jù)融合
第一步,采取傳統(tǒng)數(shù)據(jù)融合方法完成數(shù)據(jù)級與特征級的數(shù)據(jù)融合。
第二步,采用語義數(shù)據(jù)融合方式完成決策級數(shù)據(jù)融合。在這一步中,需要選擇合適的本體來描述傳感器數(shù)據(jù),如果找不到合適的本體就可能需要自行構(gòu)建本體。如果社區(qū)中的傳感器數(shù)據(jù)需要不同的本體來描述,那么還需要完成不同本體之間的集成工作。最后基于本體描述,可以建立推理規(guī)則,并采用推理工具進行語義推理,之后將推理結(jié)果與決策目標關(guān)聯(lián)。
在這種融合模式中,傳統(tǒng)數(shù)據(jù)融合與語義數(shù)據(jù)融合存在著分工。傳統(tǒng)數(shù)據(jù)融合負責將來自多個傳感器的原始數(shù)據(jù)完成數(shù)據(jù)級與特征級的數(shù)據(jù)融合,之后再由語義數(shù)據(jù)融合負責完成跨越傳感器類型的數(shù)據(jù)融合,并與決策目標關(guān)聯(lián)。本文提出的數(shù)據(jù)融合框架如圖1所示。
3? 社區(qū)語義數(shù)據(jù)融合方案
3.1? 本體選擇與構(gòu)建
社區(qū)中存在多種類型的傳感器,決策目標集合構(gòu)成也相對復雜。因此,需要考慮社區(qū)內(nèi)可供選擇的各類本體規(guī)范。與社區(qū)管理相關(guān)的本體有很多,如RDF、RDFS、OIL、DAML、OWL、SKOS等,這些語言都是遵循XML語言標準,具有良好的語法,支持推理,表達能力強并使用方便[6]。社區(qū)的管理涉及多方面的因素,而不同的領(lǐng)域需要不同的本體進行描述,可供選擇的本體主要有FOAF、SIOC、ORG、vCard、Event Ontology、SSN等。構(gòu)建領(lǐng)域本體常用的描述語言是RDF與OWL,但RDF不能很好地支持精確語言關(guān)系描述,OWL又過于復雜,介于二者之間的SKOS既可以描述語義關(guān)系,又相對簡單靈活,適合輕量級的語義關(guān)系描述。
3.2? 本體集成
基于本體進行數(shù)據(jù)融合時,通常有三種方法:單本體方法、多本體方法與混合方法[7]。但這種本體集成的思想不適用于SSN,SSN可以通過模塊化的方式使用多個本體。在本體領(lǐng)域,本體模塊化是一個用來將本體劃分成更小單位的通用方法。SSN通過使用owl: import語句,通過集成或映射本體的方式,將現(xiàn)有的多個本體進行合成。
SSN的垂直模塊化是將一個本體構(gòu)建于另一個本體之上,高層本體有方向的使用owl: import語句引入低層模塊,SOSA作為核心不引入任何本體。SSN的水平模塊化本體有可能互相依賴,所有給SSN提供領(lǐng)域詞匯的本體均被認為是水平模塊。
3.3? 數(shù)據(jù)描述
3.3.1? 傳感器數(shù)據(jù)SSN描述
SSN可以對數(shù)值型數(shù)據(jù)、日期時間型數(shù)據(jù)、位置數(shù)據(jù)等進行觀測,對數(shù)值型數(shù)據(jù)可以區(qū)分不同的計量單位。以下以溫度傳感器為例,說明SSN對傳感器數(shù)據(jù)的描述過程為:
@prefix rdf:? <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix time: <http://www.w3.org/2006/time#>.
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix ssn:? <http://www.w3.org/ns/ssn/> .
@prefix xsd:? <http://www.w3.org/2001/XMLSchema#> .
@prefix qudt-1-1: <http://qudt.org/1.1/schema/qudt#> .
@prefix qudt-unit-1-1: <http://qudt.org/1.1/vocab/unit#> .
@base <http://examplecomminty.org/data/> .
<Observation/202112301> rdf:type sosa:Observation ;
sosa:observedProperty? <Building/No.5/Appartment/1201/TemperatureDetection> ;
sosa:madeBySensor <sensor/hlsc123> ;
sosa:hasResult [
rdf:type qudt-1-1:QuantityValue ;
qudt-1-1:numericValue “20.5”^^xsd:double ;
qudt-1-1:unit qudt-unit-1-1: DegreeCelsius ] ;
<sensor/hlsc123> rdf:type sosa:Sensor ;
sosa:observes? < Building/No.5/Appartment/1201/TemperatureDetection > ;
sosa:madeObservation <Observation/202112301>, <Observation/202112302>, <Observation/202112303> .
上述文檔描述了一個傳感器,編號為hlsc123,它進行了三次觀測,編號分別為202112301、202112302、202112303,其中編號為202112301的觀測對象為Building/No.5/Appartment/1201,類型為溫度檢測,觀測的結(jié)果為double型的數(shù)值數(shù)據(jù)20.5,單位是攝氏度。
3.3.2? 基于數(shù)據(jù)融合的SSN描述
SSN基于單個傳感器進行語義描述,而傳統(tǒng)數(shù)據(jù)融合是基于多個傳感器的。為了解決這一矛盾,可以采取虛擬節(jié)點的方法。
首先,采用傳統(tǒng)數(shù)據(jù)融合方式得到多個傳感器節(jié)點的值,這些數(shù)據(jù)通常來自同一類傳感器。在數(shù)據(jù)融合過程中需要進行數(shù)據(jù)級與特征級融合,可能的操作類型有總和、平均值、加權(quán)平均、計數(shù)、最大值、最小值、挑選隨機數(shù)等。
其次,在采用SSN描述傳感器數(shù)據(jù)時,將傳感器命名為一個虛擬出來的數(shù)據(jù)融合節(jié)點,由傳統(tǒng)數(shù)據(jù)融合的中間結(jié)點提供數(shù)據(jù)級與特征級融合的結(jié)果數(shù)據(jù),并用comment進行說明:
<Observation/ Virtual_node_hlsc987> rdf:type sosa:Observation ;
rdfs:comment “This is a virtual node composed of hlsc123, hlsc124, hlsc125. “@en ;
最后,描述虛擬節(jié)點其他特征。其他特征語義描述與單個傳感器節(jié)點描述方法相同,但其對應的數(shù)據(jù)已經(jīng)是中間結(jié)點融合后的統(tǒng)計數(shù)據(jù)。
3.4? 語義推理
在進行基于語義數(shù)據(jù)融合的決策時,可以利用語義網(wǎng)內(nèi)置的語義推理功能進行邏輯推理。當前,語義分析與推理多采用Jena開發(fā)包來實現(xiàn)。Jena是惠普公司開發(fā)的一種使用Java語言的語義Web開發(fā)工具,提供了多種類型的推理機,可以為社區(qū)中的各類決策目標如事件預警類、日常監(jiān)測類建立推理規(guī)則。
3.5? 決策目標關(guān)聯(lián)
基于語義融合的結(jié)果數(shù)據(jù),既可以構(gòu)建各類數(shù)據(jù)分析模型建立與決策目標的關(guān)聯(lián),也可以根據(jù)事先設定的語義推理規(guī)則,完成社區(qū)管理決策任務。無論采用哪種方式,都可以實現(xiàn)基于物聯(lián)網(wǎng)數(shù)據(jù)的機器自動分析和預警,從而提升社區(qū)管理能力與水平。
4? 結(jié)? 論
本文基于數(shù)據(jù)融合方法與語義網(wǎng)理論,提出了社區(qū)中語義數(shù)據(jù)融合方案。數(shù)據(jù)融合方法存在著一些固有的問題,如封閉問題域、固定推理關(guān)系等,語義網(wǎng)技術(shù)可以有效地彌補這些缺陷。采用語義數(shù)據(jù)融合方式來進行社區(qū)的數(shù)據(jù)融合,同樣存在著一些問題,如多媒體數(shù)據(jù)類型的語義數(shù)據(jù)融合目前沒有完美解決方案。隨著物聯(lián)網(wǎng)、語義網(wǎng)等技術(shù)的發(fā)展,這些問題將會得以解決,從而讓社區(qū)管理變得更加自動化和智能化。
參考文獻:
[1] 何友等.多傳感器數(shù)據(jù)融合算法綜述 [J].火力與指揮控制,1996,21(1):12-21.
[2] 李建中,高宏.無線傳感器網(wǎng)絡的研究進展 [J].計算機研究與發(fā)展,2008(1):1-15.
[3] 周鵬.多傳感器數(shù)據(jù)融合技術(shù)研究與展望 [J].物聯(lián)網(wǎng)技術(shù),2015,5(5):23-25.
[4] 唐慧,胡向東.無線傳感器網(wǎng)絡數(shù)據(jù)融合研究綜述 [J].信息安全與通信保密,2007(7):62-64+68.
[5] 趙繼軍,劉云飛,趙欣.無線傳感器網(wǎng)絡數(shù)據(jù)融合體系結(jié)構(gòu)綜述 [J].傳感器與微系統(tǒng),2009,28(10):1-4.
[6] 錢斌.基于語義網(wǎng)的輿情監(jiān)控系統(tǒng)的設計與實現(xiàn) [D].蘭州:蘭州大學,2016.
[7] 王薇.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)字資源語義融合研究[D].南京:南京大學,2013
作者簡介:張慶來(1972—),男,漢族,河北保定人,副教授,博士,研究方向:信息管理與管理信息系統(tǒng)、企業(yè)信息化等。