• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于過(guò)程發(fā)現(xiàn)的RFID數(shù)據(jù)軌跡生成方法

      2022-05-12 09:25:32馮健文
      現(xiàn)代計(jì)算機(jī) 2022年5期
      關(guān)鍵詞:分段軌跡語(yǔ)義

      馮健文

      (韓山師范學(xué)院教務(wù)處,潮州 521041)

      0 引言

      附帶射頻識(shí)別(RFID)技術(shù)的移動(dòng)對(duì)象應(yīng)用,如身份證、通行卡、消費(fèi)卡、手環(huán)、電子手表等已廣泛應(yīng)用于社會(huì)各領(lǐng)域,從移動(dòng)對(duì)象RFID時(shí) 空 軌 跡(RFID spatio-temporal trajectories,RFID-STR)數(shù)據(jù)中挖掘移動(dòng)對(duì)象的移動(dòng)模式與規(guī)律,具有重要的社會(huì)和應(yīng)用價(jià)值。

      某次RFID-STR數(shù)據(jù)代表移動(dòng)對(duì)象的一次業(yè)務(wù)應(yīng)用,如上班打卡考勤。從業(yè)務(wù)點(diǎn)關(guān)聯(lián)的角度看,RFID-STR 數(shù)據(jù)分為兩類:一是多點(diǎn)軌跡(MRFID-STR),軌跡中各業(yè)務(wù)點(diǎn)明顯屬于某個(gè)業(yè)務(wù)流程,數(shù)據(jù)格式和語(yǔ)義一致,例如安裝GPS 設(shè)備的出租車、公交車、物流等;另一類是單點(diǎn)軌跡(SRFID-STR),軌跡中只包含單個(gè)業(yè)務(wù)點(diǎn)數(shù)據(jù),不同的軌跡間沒(méi)有明顯的關(guān)聯(lián)和約束,且可能存在數(shù)據(jù)格式和語(yǔ)義異構(gòu),即無(wú)業(yè)務(wù)流程特征。

      當(dāng)前對(duì)于單點(diǎn)軌跡的研究多屬于單個(gè)業(yè)務(wù)點(diǎn)的特征分析。復(fù)旦大學(xué)從一卡通共享數(shù)據(jù)庫(kù)中查詢統(tǒng)計(jì)大學(xué)生消費(fèi)水平,為貧困生認(rèn)定和困難補(bǔ)助發(fā)放提供依據(jù)。大連醫(yī)科大學(xué)以時(shí)間為序把一卡通消費(fèi)記錄整合成為每個(gè)人在校園內(nèi)不同場(chǎng)所的消費(fèi)信息,使用SPSS 分析學(xué)生的消費(fèi)占比,結(jié)果反映學(xué)生的消費(fèi)特征和性別對(duì)消費(fèi)的影響。蘇州大學(xué)用SQL Server 2005 BI工具的ID3 決策樹(shù)算法和OLAP 聯(lián)機(jī)分析處理技術(shù)對(duì)學(xué)生消費(fèi)情況、熱水消費(fèi)情況以及商戶營(yíng)業(yè)狀況分析用于改進(jìn)業(yè)務(wù)管理。哈爾濱工程大學(xué)采用支持向量機(jī)對(duì)校園卡消費(fèi)流水進(jìn)行分類,利用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)學(xué)生校園卡的消費(fèi)模式。西北大學(xué)采用Apriori 算法挖掘貧困生數(shù)據(jù)特征支持貧困生評(píng)定工作。

      上述研究屬于局部?jī)?yōu)化分析,即以一個(gè)業(yè)務(wù)點(diǎn)或一類業(yè)務(wù)點(diǎn)為分析對(duì)象,并結(jié)合用戶的信息進(jìn)行分析,結(jié)果只對(duì)某個(gè)或某類業(yè)務(wù)點(diǎn)有意義,并沒(méi)有考慮業(yè)務(wù)點(diǎn)的關(guān)聯(lián)影響。而軌跡間隱含的全局性信息對(duì)管理決策部門(mén)有著重大價(jià)值。例如食堂可分析學(xué)生消費(fèi)特征,加上學(xué)生其他業(yè)務(wù)點(diǎn)活動(dòng)特征,可幫助食堂優(yōu)化供應(yīng)菜單和時(shí)間。因此,研究把單點(diǎn)軌跡數(shù)據(jù)轉(zhuǎn)化為具有業(yè)務(wù)流程關(guān)聯(lián)的多點(diǎn)軌跡數(shù)據(jù),對(duì)全局分析宏觀管理決策支持有重要意義。

      過(guò)程發(fā)現(xiàn)(process discovery)技術(shù)可從信息系統(tǒng)日志數(shù)據(jù)中發(fā)現(xiàn)用戶的業(yè)務(wù)活動(dòng)過(guò)程模型,并結(jié)合其他信息發(fā)現(xiàn)潛在的有價(jià)值知識(shí)。本文基于過(guò)程發(fā)現(xiàn)技術(shù)研究RFID 數(shù)據(jù)軌跡預(yù)處理技術(shù),提出RFID-STR數(shù)據(jù)類型定義,重點(diǎn)介紹數(shù)據(jù)軌跡分段方法和生成框架,解決無(wú)業(yè)務(wù)流程特征軌跡數(shù)據(jù)分析問(wèn)題,為軌跡數(shù)據(jù)知識(shí)挖掘提供高質(zhì)量數(shù)據(jù)。

      1 RFID-STR數(shù)據(jù)類型

      1.1 RFID-STR原始數(shù)據(jù)定義

      RFID-STR 原始數(shù)據(jù)為={ p|i= 1,},其中軌跡點(diǎn)p=(R,B,X,t)為四元組,分別代表RFID 標(biāo)簽、業(yè)務(wù)點(diǎn)、屬性信息、時(shí)間戳。業(yè)務(wù)點(diǎn)包含業(yè)務(wù)點(diǎn)的地理空間信息、業(yè)務(wù)類型等。屬性信息包含交易金額、經(jīng)手人、交易內(nèi)容等。

      1.2 校準(zhǔn)軌跡定義

      RFID-STR 原始數(shù)據(jù)來(lái)源于多個(gè)RFID 業(yè)務(wù)應(yīng)用,存在數(shù)據(jù)格式、語(yǔ)義等差異,在挖掘前必須進(jìn)行校準(zhǔn),以得到規(guī)范統(tǒng)一的軌跡數(shù)據(jù)。把原始數(shù)據(jù)轉(zhuǎn)化為校準(zhǔn)軌跡數(shù)據(jù),一般包括數(shù)據(jù)清洗、軌跡分段、路網(wǎng)匹配的校準(zhǔn)軌跡數(shù)據(jù)預(yù)處理流程。

      1.3 數(shù)據(jù)庫(kù)軌跡定義

      RFID-STR 校準(zhǔn)軌跡通常包括巨量詳細(xì)記錄,例如電子飯卡應(yīng)用,用戶點(diǎn)餐明細(xì)對(duì)于只關(guān)注業(yè)務(wù)點(diǎn)類型的挖掘無(wú)意義,就需要壓縮處理以減少數(shù)據(jù)量、提高處理效率。常用基于路網(wǎng)和基于軌跡的壓縮方法。

      1.4 語(yǔ)義軌跡定義

      RFID-STR 數(shù)據(jù)軌跡只有賦予業(yè)務(wù)應(yīng)用和用戶行為理解,才有挖掘價(jià)值,在數(shù)據(jù)庫(kù)軌跡上加上語(yǔ)義就產(chǎn)生了RFID-STR知識(shí)。

      2 RFID-STR數(shù)據(jù)軌跡分段方法

      校準(zhǔn)軌跡是產(chǎn)生軌跡知識(shí)的基礎(chǔ),其中軌跡分段是校準(zhǔn)軌跡數(shù)據(jù)生成的關(guān)鍵方法,本文引入過(guò)程發(fā)現(xiàn)的思想建立基于時(shí)間閥值的軌跡分段方法。RFID 軌跡分段目標(biāo)實(shí)際上是要得到在一個(gè)時(shí)間區(qū)間的軌跡點(diǎn)集合。因此尋找分段點(diǎn)就是通過(guò)時(shí)間閥值參數(shù)來(lái)劃分軌跡點(diǎn)集合。

      首先把經(jīng)過(guò)清洗的軌跡數(shù)據(jù)映射到業(yè)務(wù)應(yīng)用中,業(yè)務(wù)應(yīng)用活動(dòng)關(guān)聯(lián)RFID 業(yè)務(wù)點(diǎn),業(yè)務(wù)應(yīng)用活動(dòng)可以由具備業(yè)務(wù)流程聯(lián)系的多個(gè)業(yè)務(wù)點(diǎn)構(gòu)成,如快遞物流;也可能是無(wú)業(yè)務(wù)流程特征的多個(gè)業(yè)務(wù)點(diǎn)構(gòu)成,如學(xué)生校園RFID 應(yīng)用?;顒?dòng)的執(zhí)行事件是RFID 標(biāo)簽在業(yè)務(wù)點(diǎn)的一次操作行為,即軌跡點(diǎn)P。同個(gè)RFID 標(biāo)簽在時(shí)間區(qū)間的軌跡點(diǎn)形成了一個(gè)業(yè)務(wù)過(guò)程,即軌跡點(diǎn)序列P…P。基于過(guò)程發(fā)現(xiàn)的軌跡分段方法是從軌跡數(shù)據(jù)中尋找同個(gè)RFID 標(biāo)簽的軌跡點(diǎn)序列集合,集合中任意兩個(gè)軌跡點(diǎn)的時(shí)間戳距離滿足時(shí)間閥值的要求。采用過(guò)程發(fā)現(xiàn)的方法可以發(fā)現(xiàn)用戶在某個(gè)時(shí)間段的行為軌跡,尤其是能處理無(wú)業(yè)務(wù)流程特征的多個(gè)業(yè)務(wù)點(diǎn)類型數(shù)據(jù)。

      3 RFID-STR數(shù)據(jù)軌跡生成框架

      RFID-STR 數(shù)據(jù)軌跡生成的目標(biāo)是輸入原始軌跡數(shù)據(jù),經(jīng)過(guò)校準(zhǔn)軌跡、數(shù)據(jù)庫(kù)軌跡處理,輸出語(yǔ)義軌跡作為軌跡特征知識(shí)挖掘的數(shù)據(jù)源。

      ①?gòu)姆植际江h(huán)境中抽取RFID-STR原始軌跡數(shù)據(jù);②經(jīng)過(guò)數(shù)據(jù)清洗后,采用基于時(shí)間閥值的過(guò)程發(fā)現(xiàn)技術(shù)進(jìn)行軌跡分段,并通過(guò)路網(wǎng)匹配方法關(guān)聯(lián)軌跡與業(yè)務(wù)點(diǎn)地理位置信息,得到校準(zhǔn)軌跡;③根據(jù)業(yè)務(wù)點(diǎn)類型進(jìn)行軌跡壓縮得到數(shù)據(jù)庫(kù)軌跡,提高數(shù)據(jù)價(jià)值密度和存取效率;最后根據(jù)行為理解方法建立不同主題的語(yǔ)義軌跡數(shù)據(jù)。

      圖1 RFID-STR數(shù)據(jù)軌跡生成框架

      4 應(yīng)用案例

      以某高校一卡通系統(tǒng)RFID 數(shù)據(jù)為實(shí)例闡述RFID-STR 數(shù)據(jù)軌跡生成過(guò)程。該校在校生約2萬(wàn)人,分為四個(gè)校區(qū),一卡通應(yīng)用主要涉及38個(gè)業(yè)務(wù)點(diǎn),覆蓋了校園內(nèi)教學(xué)、學(xué)習(xí)和生活設(shè)施。各業(yè)務(wù)點(diǎn)業(yè)務(wù)特征如表1所示,業(yè)務(wù)數(shù)據(jù)分布在6個(gè)原始軌跡數(shù)據(jù)庫(kù),全部為單點(diǎn)軌跡數(shù)據(jù)。

      表1 一卡通系統(tǒng)業(yè)務(wù)點(diǎn)特征

      4.1 校準(zhǔn)軌跡生成

      選取時(shí)間范圍為2012—2014年數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)清洗、軌跡分段和路網(wǎng)匹配得到校準(zhǔn)軌跡。數(shù)據(jù)量變化如表2所示。

      表2 校準(zhǔn)軌跡生成數(shù)據(jù)量變化(單位:條)

      (1)數(shù)據(jù)清洗。原始軌跡數(shù)據(jù)約2875萬(wàn)條,經(jīng)過(guò)字段不一致、去除重復(fù)等數(shù)據(jù)清洗后為2849 萬(wàn)條,再次對(duì)數(shù)據(jù)合并處理得到1264 萬(wàn)條,典型數(shù)據(jù)合并例子是把2小時(shí)內(nèi)同個(gè)用戶在同個(gè)食堂的消費(fèi)數(shù)據(jù)合并為一條消費(fèi)總數(shù),減少無(wú)意義的數(shù)據(jù)冗余,提高處理效率。

      (2)軌跡分段。采取以時(shí)間閥值參數(shù)方法,得到某用戶在一個(gè)時(shí)間區(qū)間的軌跡點(diǎn)集合,即把多個(gè)單點(diǎn)軌跡集合轉(zhuǎn)換為有時(shí)間關(guān)聯(lián)的多點(diǎn)軌跡集合,為后續(xù)發(fā)現(xiàn)用戶潛在模式打下基礎(chǔ)。例如以1 天24 小時(shí)為時(shí)間閥值參數(shù),經(jīng)過(guò)軌跡分段后,得到用戶活動(dòng)軌跡640萬(wàn)條。

      (3)路網(wǎng)匹配。把業(yè)務(wù)點(diǎn)與地理信息結(jié)合,得到具有地理特征的用戶活動(dòng)圖。例如把校區(qū)匹配表1的業(yè)務(wù)點(diǎn),可得到用戶校區(qū)活動(dòng)軌跡。

      4.2 數(shù)據(jù)庫(kù)軌跡生成

      進(jìn)一步對(duì)校準(zhǔn)軌跡進(jìn)行數(shù)據(jù)壓縮和主題分類,可得到不同主題數(shù)據(jù)集市模型。

      (1)數(shù)據(jù)壓縮。把重復(fù)的用戶活動(dòng)軌跡進(jìn)行壓縮,得到代表活動(dòng)軌跡5萬(wàn)條,大大提高了分析效率,當(dāng)然代價(jià)是丟失了軌跡頻度。

      (2)主題分類。根據(jù)應(yīng)用主題建立數(shù)據(jù)集,例如“消費(fèi)特征主題”數(shù)據(jù)集包含了有消費(fèi)數(shù)據(jù)的軌跡,屬性信息至少包括用戶標(biāo)識(shí)、業(yè)務(wù)點(diǎn)、發(fā)生時(shí)間、消費(fèi)額,以及維度明細(xì)數(shù)據(jù)包括用戶信息、活動(dòng)信息、時(shí)間信息、消費(fèi)額信息。

      4.3 語(yǔ)義軌跡生成

      在數(shù)據(jù)庫(kù)軌跡基礎(chǔ)上,結(jié)合RFID 移動(dòng)對(duì)象用戶行為可理解性和管理層管理應(yīng)用需要,進(jìn)行目的性的軌跡處理,可得到有價(jià)值的語(yǔ)義軌跡。

      例如,對(duì)“消費(fèi)特征主題”數(shù)據(jù)集的軌跡進(jìn)行分析,了解學(xué)生校內(nèi)消費(fèi)行為模式。設(shè)時(shí)間閥值參數(shù)為1 天,得到存在學(xué)生1 天消費(fèi)相關(guān)數(shù)據(jù)庫(kù)軌跡。以消費(fèi)額區(qū)間分析,可知學(xué)生消費(fèi)金額特征,如圖2 所示。學(xué)生平均日均消費(fèi)7.95元,大部分學(xué)生日均消費(fèi)集中在5—30元。

      圖2 學(xué)生消費(fèi)金額特征

      進(jìn)一步,要了解學(xué)生的超市消費(fèi)特征。選取第二校區(qū)的超市業(yè)務(wù)點(diǎn)H,設(shè)置消費(fèi)時(shí)間區(qū)間,其分時(shí)消費(fèi)特征如表3所示。

      表3 業(yè)務(wù)點(diǎn)H分時(shí)消費(fèi)特征

      可發(fā)現(xiàn)學(xué)生常在19:00—24:00 到超市消費(fèi)。再分析與H 關(guān)聯(lián)的前后活動(dòng)業(yè)務(wù)點(diǎn)軌跡,發(fā)現(xiàn)學(xué)生喜歡在食堂C、D和圖書(shū)館B 之后到超市H消費(fèi)。因此,可給H 點(diǎn)標(biāo)上“晚上消費(fèi)頻繁”的語(yǔ)義標(biāo)簽,此外從安全角度還可標(biāo)上“晚上注意周邊擁擠”的標(biāo)簽。上述語(yǔ)義分析對(duì)于學(xué)校后勤和學(xué)生管理部門(mén),要注意控制校內(nèi)物價(jià)水平;對(duì)保衛(wèi)部門(mén),要在晚上注意監(jiān)控業(yè)務(wù)點(diǎn)周邊的交通擁擠情況,尤其是從圖書(shū)館到超市的道路;對(duì)業(yè)務(wù)點(diǎn)H,要提高晚上的供應(yīng)質(zhì)量和數(shù)量,同時(shí)也要分析消費(fèi)額少的時(shí)間段情況,另外0:00—3:00還有消費(fèi)額,是不符合學(xué)校管理規(guī)定的,所以業(yè)務(wù)點(diǎn)H要進(jìn)行整改。

      5 結(jié)語(yǔ)

      在人工智能時(shí)代,物聯(lián)網(wǎng)應(yīng)用產(chǎn)生海量數(shù)據(jù),挖掘知識(shí)輔助管理部門(mén)決策已成為常態(tài)。本文通過(guò)研究附帶RFID 標(biāo)簽物體的軌跡數(shù)據(jù)生成方法,把單點(diǎn)軌跡轉(zhuǎn)為具有關(guān)聯(lián)特征的多點(diǎn)軌跡,并根據(jù)應(yīng)用需求,生成有價(jià)值的語(yǔ)義軌跡,對(duì)下一步提取用戶行為特征知識(shí),研究移動(dòng)趨勢(shì)、移動(dòng)行為、異常行為和移動(dòng)對(duì)象之間的聯(lián)系等特征有重要作用。

      猜你喜歡
      分段軌跡語(yǔ)義
      一類連續(xù)和不連續(xù)分段線性系統(tǒng)的周期解研究
      軌跡
      軌跡
      語(yǔ)言與語(yǔ)義
      分段計(jì)算時(shí)間
      軌跡
      進(jìn)化的軌跡(一)——進(jìn)化,無(wú)盡的適應(yīng)
      3米2分段大力士“大”在哪兒?
      太空探索(2016年9期)2016-07-12 10:00:04
      “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
      認(rèn)知范疇模糊與語(yǔ)義模糊
      依兰县| 十堰市| 新余市| 南投市| 满洲里市| 丹凤县| 汾阳市| 肇源县| 博白县| 徐水县| 开封县| 会泽县| 自贡市| 读书| 哈密市| 宜黄县| 上蔡县| 靖远县| 牙克石市| 鸡西市| 佛山市| 陵水| 沁水县| 宁陵县| 偃师市| 福鼎市| 临城县| 定州市| 沁阳市| 合作市| 恩施市| 南川市| 兰溪市| 扎赉特旗| 甘孜| 会同县| 桦甸市| 潞西市| 蓬莱市| 阿尔山市| 新郑市|