史英杰
(北京服裝學(xué)院 商學(xué)院 北京 100029)
隨著信息產(chǎn)業(yè)的不斷發(fā)展,可穿戴終端設(shè)備不僅具備了更強(qiáng)的計(jì)算能力,而且其收集的數(shù)據(jù)通過網(wǎng)絡(luò)將智能家居、人、物聯(lián)網(wǎng)等連接在一起,成為目前最具市場挖掘潛力的互聯(lián)網(wǎng)智能設(shè)備之一。2019年7月,國務(wù)院發(fā)布了《國務(wù)院關(guān)于實(shí)施健康中國行動(dòng)的意見》[1],指出要引導(dǎo)群眾建立正確健康觀,加強(qiáng)早期干預(yù),形成有利于健康的生活方式,我們將迎來全民健康的時(shí)代??纱┐髟O(shè)備通過傳感器監(jiān)測收集人們的數(shù)字化生活記錄,例如心電圖、腦電圖、肌電圖、血壓和運(yùn)動(dòng)慣性等不同細(xì)節(jié)的數(shù)據(jù),利用大數(shù)據(jù)技術(shù)對其進(jìn)行分析,可以對人們展開中期甚至長期的健康監(jiān)測及預(yù)警,例如睡眠質(zhì)量、心臟健康狀態(tài)監(jiān)測、慢性病預(yù)警等??纱┐饔?jì)算在全民醫(yī)療健康領(lǐng)域具有重要的作用和極大的市場價(jià)值。此外,智能佩飾、智能服裝等可穿戴設(shè)備不僅是市場潛力巨大的時(shí)尚消費(fèi)電子產(chǎn)品,也是互聯(lián)網(wǎng)及云計(jì)算的新型終端。基于這類可穿戴設(shè)備收集的海量數(shù)據(jù),可以采用大數(shù)據(jù)技術(shù)進(jìn)行用戶行為分析、廣告追蹤優(yōu)化、產(chǎn)品分析、推薦決策等,從而在電子商務(wù)、智慧生活及社交網(wǎng)絡(luò)等方面創(chuàng)造極大的社會價(jià)值。此外,在個(gè)人應(yīng)用、智慧交通、智慧安防以及社交網(wǎng)絡(luò)分析等方面,可穿戴計(jì)算的大數(shù)據(jù)分析都可大顯身手??偟膩碚f,可穿戴設(shè)備是用戶數(shù)據(jù)收集以及互動(dòng)的基礎(chǔ),而將云計(jì)算與大數(shù)據(jù)技術(shù)融入到可穿戴計(jì)算中,將成為未來IT行業(yè)發(fā)展的重要趨勢之一。
上世紀(jì)60年代,美國麻省理工學(xué)院媒體實(shí)驗(yàn)室首次提出了可穿戴技術(shù),利用該技術(shù)可以把多媒體、傳感器和通信等技術(shù)嵌入到人們的衣著中,從而支持手勢和眼動(dòng)操作等多種不同的交互方式[2]。伴隨著互聯(lián)網(wǎng)技術(shù)及移動(dòng)技術(shù)的飛速發(fā)展,手機(jī)、平板電腦等智能終端開始占據(jù)人們的生活。此時(shí)與智能終端相關(guān)聯(lián)的可穿戴設(shè)備開始進(jìn)入市場,2012年,谷歌公司發(fā)布Google Glass,從而將可穿戴設(shè)備推向了一個(gè)新的高潮。根據(jù)IDC2020年發(fā)布的全球可穿戴設(shè)備報(bào)告,2019年全年可穿戴設(shè)備出貨量達(dá)到3.365億部,相比2018年的1.78億部增長了89%,目前,可穿戴計(jì)算的終端設(shè)備正朝著更微型化、個(gè)性化和人性化的方向發(fā)展,不僅具備更強(qiáng)的數(shù)據(jù)采集能力及計(jì)算能力,而且可以實(shí)時(shí)進(jìn)行通信并接入互聯(lián)網(wǎng),從而為進(jìn)一步的分析計(jì)算提供海量的基礎(chǔ)數(shù)據(jù)。
與其他數(shù)據(jù)相比,可穿戴計(jì)算中的數(shù)據(jù)具有鮮明的特征。在可穿戴計(jì)算環(huán)境中,數(shù)據(jù)源包括傳感器數(shù)據(jù)源和非傳感器數(shù)據(jù)源。非傳感器數(shù)據(jù)源包括用戶輸入的個(gè)人信息、通過APP上傳的文本及圖像日志等,這類數(shù)據(jù)和傳統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)的特點(diǎn)基本一致。傳感器數(shù)據(jù)源包括心率和血氧等用戶生命體征數(shù)據(jù)、用戶位置與軌跡數(shù)據(jù)、溫濕度和氣壓等環(huán)境數(shù)據(jù),這類由傳感設(shè)備主動(dòng)產(chǎn)生的數(shù)據(jù)規(guī)模龐大,而且具有強(qiáng)烈的時(shí)間和空間相關(guān)性,對該類數(shù)據(jù)的管理和分析則與互聯(lián)網(wǎng)大數(shù)據(jù)管理有很大不同。首先,可穿戴計(jì)算領(lǐng)域的數(shù)據(jù)往往涉及海量空間數(shù)據(jù)管理、海量時(shí)間序列數(shù)據(jù)管理,因此查詢類型也更加復(fù)雜;其次,由于可穿戴計(jì)算領(lǐng)域的數(shù)據(jù)在時(shí)間以及空間上都具有較大的相關(guān)性,數(shù)據(jù)分布極為不均,嚴(yán)重影響了樣本數(shù)據(jù)的平均分布和隨機(jī)性,這為查詢優(yōu)化帶來了較大的難度;此外,在云計(jì)算平臺上,可穿戴數(shù)據(jù)規(guī)模龐大而且分布存儲,但是數(shù)據(jù)的劃分技術(shù)卻不如分布式數(shù)據(jù)庫中的劃分技術(shù)成熟,很難利用數(shù)據(jù)劃分帶來的查詢優(yōu)勢。傳統(tǒng)的大數(shù)據(jù)管理及分析技術(shù)無法直接應(yīng)用于可穿戴計(jì)算領(lǐng)域,這就需要研究者們深入挖掘可穿戴計(jì)算數(shù)據(jù)處理與分析的特質(zhì),分析已有工作在該領(lǐng)域的不足,探索數(shù)據(jù)分布和負(fù)載特征相關(guān)因素并建立相關(guān)理論方法體系,從而支持該領(lǐng)域數(shù)據(jù)的頻繁更新及快速的查詢分析。
心血管疾病是危害人類健康的主要疾病之一[3],研究發(fā)現(xiàn)適量的運(yùn)動(dòng)可以有效減少心血管疾病的死亡率[4]。隨著人們越來越關(guān)心身體健康,越來越多的運(yùn)動(dòng)檢測設(shè)備和應(yīng)用開始出現(xiàn),常用的衡量運(yùn)動(dòng)量的指數(shù)包括運(yùn)動(dòng)步數(shù)、距離和時(shí)間等。然而這類衡量指標(biāo)無法反映用戶身體在運(yùn)動(dòng)中的狀態(tài),因此無法給出運(yùn)動(dòng)指導(dǎo)建議或進(jìn)行疾病風(fēng)險(xiǎn)預(yù)警。檢測心率可以對人體在運(yùn)動(dòng)中的身體狀態(tài)進(jìn)行有效監(jiān)控,HUNT組織在2017年提出了人體運(yùn)動(dòng)智能指數(shù)PAI。PAI指數(shù)通過性別、年齡以及持續(xù)的心率值進(jìn)行計(jì)算,而相關(guān)研究證明PAI指數(shù)可有效反映各年齡段人群罹患心血管疾病的風(fēng)險(xiǎn)。盡管PAI指數(shù)具有較高的實(shí)用價(jià)值,然而由于其計(jì)算公式比較復(fù)雜,而且連續(xù)的心率值數(shù)據(jù)量較大,其計(jì)算過程需要較長時(shí)間,這就使其疾病預(yù)警功能的時(shí)效性大打折扣。對于這類可穿戴計(jì)算的大數(shù)據(jù)分析應(yīng)用來說,與其耗費(fèi)大量時(shí)間等待精確的結(jié)果,短時(shí)間內(nèi)可獲得的“足夠接近”真實(shí)結(jié)果的分析反而更有價(jià)值。大數(shù)據(jù)的在線聚集技術(shù)根據(jù)樣本數(shù)據(jù)估計(jì)查詢結(jié)果,并返回真實(shí)結(jié)果所在的置信區(qū)間[5],其最大優(yōu)勢是可在較短時(shí)間內(nèi)計(jì)算出接近實(shí)際的查詢結(jié)果。將在線聚集技術(shù)應(yīng)用在PAI指數(shù)的計(jì)算上,可以在較短時(shí)間內(nèi)獲得具有一定準(zhǔn)確性保證的“估計(jì)結(jié)果”。
越來越多的便攜式可穿戴設(shè)備逐漸走進(jìn)人們的生活,并通過泛在的傳感設(shè)備收集了海量的用戶數(shù)據(jù),利用大數(shù)據(jù)技術(shù)對這些海量數(shù)據(jù)進(jìn)行管理和分析勢在必行。不同于互聯(lián)網(wǎng)產(chǎn)生的大數(shù)據(jù),可穿戴計(jì)算領(lǐng)域的大數(shù)據(jù)有其自身的特點(diǎn)。本文分析了可穿戴領(lǐng)域大數(shù)據(jù)分析的特點(diǎn),并結(jié)合PAI指數(shù)分析案例闡述了該領(lǐng)域未來的研究方向。