• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)在移動出行中的應用

      2019-05-05 03:41:44
      福建質(zhì)量管理 2019年8期
      關鍵詞:滴滴數(shù)據(jù)挖掘建模

      (山東工藝美術學院公共課教學部 山東 濟南 250000)

      引言

      “分享經(jīng)濟”是通過大數(shù)據(jù)技術以及互聯(lián)網(wǎng)技術進行資源配合,整和重構資源所誕生的一種全新商業(yè)模式,降低了消費者的購買成本和提高了生產(chǎn)效率。隨著分享經(jīng)濟的興起,將會使商業(yè)和社會帶來翻天覆地的變化。從15年滴滴打車與快的打車的合并,再到16年滴滴收購Uber,移動出行巨頭——滴滴出行,為人們的城市交通出行帶來了巨大的變化。滴滴出行作為移動互聯(lián)網(wǎng)背景下“分享經(jīng)濟”的領軍人物,它利用GPS、移動互聯(lián)網(wǎng)、大數(shù)據(jù)等技術,充分利用了閑置的交通資源,使出行更加高效便捷,解決了緊張的交通資源,節(jié)約了人們等車的時間,使人們的出行方式由普通的打車變?yōu)榱爽F(xiàn)在利用互聯(lián)網(wǎng)智慧出行,推動了互聯(lián)網(wǎng)和傳統(tǒng)產(chǎn)業(yè)的創(chuàng)新融合。

      移動出行平臺發(fā)揮了“分享經(jīng)濟”的低成本優(yōu)勢,它們通過運營管理,有效地解決了信息不對稱,通過技術手段,連接了車主和乘客,并且對每個人都有信用記錄,在交易平臺上給出一個清晰透明的價格,使服務順利達成,原本閑置的資源被利用起來,釋放了分享經(jīng)濟的低成本優(yōu)勢。

      近年來,隨著通訊技術的發(fā)展和空間定位的普及和應用,我國大多數(shù)車上都安設了GPS系統(tǒng),通過GPS的定位功能,產(chǎn)生了大量車輛連續(xù)性的時間和空間的軌跡數(shù)據(jù),這些數(shù)據(jù)獲取的成本低,覆蓋范圍廣,擁有動態(tài)特性,使得這些數(shù)據(jù)成為研究人們出行的新數(shù)據(jù)來源。

      一、中國移動出行應用分析

      (一)移動出行應用市場分類

      目前,我國移動出行應用主要有專車、打車、拼車和租車四種類型,這使人們出行選擇多種多樣,也滿足了各個年齡階段、各個地域以及各個階層的需求,表1顯示了四種移動出行的代表應用及其主要特點。

      表1 移動出行市場主流軟件及其特點

      2016年下半年移動出行應用排名如圖1所示,滴滴出行的市場份額和用戶活躍度遠高于其他應用,其原當然離不開各大公司背后強大的資金支持以及技術支持。而更主要的是,滴滴出行與快的打車合并后,又收購了Uber中國,其業(yè)務拓展速度非常之快,占據(jù)了中國超過75%的市場用戶。而其經(jīng)常采取的補貼戰(zhàn)略,更是吸引了一大批消費者。

      圖1 移動出行領域榜單

      圖2 各專車應用的活躍用戶量及啟動次數(shù)

      從圖2中可以看出,滴滴出行APP占據(jù)了絕大部分市場份額,活躍用戶數(shù)量以及啟動次數(shù)遠遠高于其他幾個專車應用。從圖1-3中可以看出,在日均活躍用戶量、日均啟動次數(shù)和日均使用時長上看,占據(jù)領先地位的是Uber和神州專車。

      (二)用戶行為分析

      用戶選擇出行軟件的時候,往往考慮以下幾個因素:首先,在價格方面,用軟件打車的價格是否合理,是否比打普通出租車要便宜。其次,是否能及時到達自己所在的地點。因此商家為了留住顧客,經(jīng)常采取一些補貼優(yōu)惠政策,使價格方面盡量讓人們接受,甚至用白菜價吸引那些潛在的客戶,再利用其便捷的優(yōu)點,使?jié)撛诳蛻舭l(fā)展為長期客戶。隨著注冊的車主越來越多,打車也越來越便捷,打車的人也變得越來越多。因此打車的效率和速度就提高了。

      如圖3顯示的人均行為,我們可以得出人均啟動次數(shù)和人均使用時長最多的是滴滴出行,其次是Uber和神州專車。

      圖3 人均行為分析圖

      (三)用戶構成分析

      移動出行類應用的主要用戶主要集中在20-30歲以下的青年人士,這些年輕人對互聯(lián)網(wǎng)接觸了解的較多,并且樂于嘗試新型的出行方式。而41歲以上的人群只占了10%的份額。

      從使用的領域來看,一線城市的市場份額占據(jù)了50%以上,這與一線城市人群有較高的收入水平有關系,他們的出行頻次也比較高。而隨著年齡的遞增,收入檔次的提高,移動出行用戶數(shù)量逐漸減少,其原因主要有以下兩點:一是我國高收入者占總?cè)丝诘谋戎剌^??;二是高收入者一般有自己的汽車。隨著移動出行應用的普及,將會有更多的年輕人進入這個市場,也會逐步有中年人士放棄自己開車而選擇專車和拼車,這將是綠色出行,實現(xiàn)節(jié)約能源的第一步。

      二、大數(shù)據(jù)挖掘理論綜述

      近年來,在我們生活在互聯(lián)網(wǎng)海洋的每時每刻,都會產(chǎn)生海量的數(shù)據(jù)。而面對這些海量的數(shù)據(jù),人們的肉眼和手工方法很難去處理這些數(shù)據(jù)并發(fā)現(xiàn)其中的價值,在這些數(shù)據(jù)的海洋中,人們急切需要更有效的方法來處理這些數(shù)據(jù)來獲得有用的知識。數(shù)據(jù)挖掘正是在這種強烈需求的背景下應運而生的,為我們從大量數(shù)據(jù)中提煉出有價值的只是提供了可行有效地方法。

      高校承載的社會服務功能,在實現(xiàn)精準扶貧、促進鄉(xiāng)村振興應發(fā)揮作用,為更好的輸出高水平的農(nóng)村電商人才應該構建相對權威標準的人才培養(yǎng)體系,包括培養(yǎng)目標、培養(yǎng)模式、課程體系、實踐教學體系、評價體系等,并加強農(nóng)村電商師資培養(yǎng)的師資、教材和其他資源的建設。高校建立相關的研究所等來深入研究農(nóng)村電商發(fā)展的實際問題,助力農(nóng)村電商發(fā)展。

      (一)大數(shù)據(jù)挖掘技術的概念

      數(shù)據(jù)挖掘結(jié)合了多個領域的技術,如人工智能、概率學、數(shù)據(jù)庫技術、機器學習等。數(shù)據(jù)挖掘是在不完全的數(shù)據(jù)信息中,去除噪聲、重復數(shù)據(jù)、不一致數(shù)據(jù),發(fā)現(xiàn)那些對人們有價值的信息。數(shù)據(jù)挖掘技術還可以用于預測信息,發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律,推測出將來可能的行為。

      數(shù)據(jù)挖掘也往往用來解決商業(yè)的實際問題,首先從商業(yè)角度理解問題,將這些問題轉(zhuǎn)化為數(shù)據(jù),對這些數(shù)據(jù)進行建模,然后對模型進行評估,最后發(fā)布模型得出目標結(jié)果。

      (二)大數(shù)據(jù)挖掘的過程

      數(shù)據(jù)挖掘的整個行程是為了發(fā)現(xiàn)在最初的數(shù)據(jù)中,所隱含著的對我們有價值的信息,所以在進行數(shù)據(jù)挖掘前,我們首先要知道,我們要解決的問題是什么以及想達到什么樣的目的。只有這樣將問題和目的結(jié)合起來才能得到我們想要的結(jié)果。數(shù)據(jù)挖掘的過程分為以下幾個階段:數(shù)據(jù)預處理、數(shù)據(jù)挖掘和模型最終效果的評估。

      1.大數(shù)據(jù)預處理

      我們剛開始收集的原始數(shù)據(jù)往往具有復雜和多樣等特性,為了將這些最初的數(shù)據(jù)轉(zhuǎn)化為我們最終需要的數(shù)據(jù),我們要對數(shù)據(jù)進行一些處理,使原本不完整的數(shù)據(jù)變得完整,使數(shù)據(jù)變得一致起來。我們要對數(shù)據(jù)進行清洗來消除數(shù)據(jù)的噪聲和重復的觀測值。數(shù)據(jù)預處理過程又分為以下四個子階段:

      數(shù)據(jù)清理:數(shù)據(jù)清理包括消除數(shù)據(jù)的噪聲、填補那些遺缺的數(shù)據(jù),使數(shù)據(jù)變得平滑起來。車輛軌跡數(shù)據(jù)存在的主要問題是軌跡點經(jīng)緯度坐標越界和異常的軌跡點,需要對這些異常數(shù)據(jù)進行處理。

      數(shù)據(jù)選擇和分析:是指在大量的數(shù)據(jù)中取出一些相關數(shù)據(jù),在不損失有效信息的情況下,對數(shù)據(jù)的范圍進行合理的選擇,以減少不必要的時間浪費。

      數(shù)據(jù)變換:是指通過離散化、平滑處理以及標準規(guī)則化處理等方法,將數(shù)據(jù)變化成適合進行數(shù)據(jù)挖掘的形式。

      其中對GPS測數(shù)據(jù)的數(shù)據(jù)剔除方法我們可以使用萊茵達準則法和羅曼洛夫斯基準則,這種GPS載波相位差分技術的運用,極大地降低了如衛(wèi)星相關誤差及電離層折射延遲、對流層折射延遲等主要誤差源的影響。為了盡可能可靠地提高GPS定位的精度,必須對測量數(shù)據(jù)進行粗差剔除。

      (1)萊茵達準則

      (2)羅曼洛夫斯基準則

      Pα=(1-α)和t分布的自由度v=n-2確定tg值。若被懷疑并提出的測量值確屬于含有過失誤差,則剩余誤差滿足|vg|≥tgs,即將該測量值剔除是正確的;反之若不滿足上式,則說明該測量值并不敢有過失誤差,應重新將其列入觀測列,并重新估算標準差。

      2.大數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘是為了在初始不規(guī)則的數(shù)據(jù)中發(fā)現(xiàn)對我們有用的信息,數(shù)據(jù)挖掘的模式有兩種,其中一種是描述性模型,用特征化分析、聚類分析、關聯(lián)分析等方法描述數(shù)據(jù)的一般特征,再用數(shù)學統(tǒng)計模型對隱含在這些數(shù)據(jù)中的信息進行解釋;另一種是預測性模式,通過分類、孤立點分析、回歸等方法,在預測和推斷這些數(shù)據(jù)。

      3.模型最終效果的評估

      在數(shù)據(jù)挖掘階段之后,挖掘到的數(shù)據(jù)是需要我們進行分析的,要用恰當?shù)脑u價標準來衡量結(jié)果的正確與否。

      (三)數(shù)據(jù)挖掘的方法任務及分析

      數(shù)據(jù)挖掘有兩種方法類型,一種是統(tǒng)計型的,常用的方法包括聚類分析和相關性分析,這種類型旨在發(fā)現(xiàn)數(shù)據(jù)中藏匿的一般規(guī)律。另一種類型是機器學習類型,它通過大量的數(shù)據(jù)樣本得到模型,然后對未知的樣本進行預測。本論文使用的是第二種類型,通過乘客和司機的出行數(shù)據(jù),對乘客和司機的歷史行為進行分析。這種結(jié)合了概率學、人工智能、數(shù)據(jù)庫等技術的綜合性方法,減少了只在單個分析方法中的缺點和不足,將多重分析方法的優(yōu)勢結(jié)合起來,更好的分析數(shù)據(jù)得出結(jié)論。下面介紹四種數(shù)據(jù)挖掘任務。

      1.預測建模

      預測建模有回歸建模形式和分類建模形式,它們通過提取數(shù)據(jù)的普通模式來預測未來的變化趨勢?;貧w建模的函數(shù)模型是連續(xù)的,可以用線性回歸的方式來解決許多問題,而通過變換,我們也可以將許多非線性問題轉(zhuǎn)化為線性問題來解決。分類建模是預測離散的數(shù)值。這兩種建模形式都是預測問題。分類和回歸預測的經(jīng)典方法有決策樹、貝葉斯、支持向量機、人工神經(jīng)網(wǎng)絡、組合學習方法和K鄰域。

      2.關聯(lián)分析

      關聯(lián)分析方法是為了發(fā)現(xiàn)數(shù)據(jù)集中的關聯(lián)性和相關性。但是,在海量的數(shù)據(jù)中要發(fā)現(xiàn)它們的聯(lián)系要耗費大量的時間和資源,同時,發(fā)現(xiàn)的這些相關性也會有偶然的情況和錯誤的情況,為了解決這兩個問題,在關聯(lián)分析中,要使用規(guī)則的支持度和置信度,使得去除那些偶然出現(xiàn)的規(guī)則,得到最可靠的信息。利用關聯(lián)分析的算法主要有FP-growth和Apriori等。

      3.聚類分析

      聚類分析是一種沒有監(jiān)督的方法,它通過合理劃分那些未標注的樣本,對不同類別使用顯式或隱式的方法進行描述,層次方法、劃分方法、基于網(wǎng)絡的方法等都是聚類分析的主要方法。

      4.異常檢測

      異常檢測的目的是為了發(fā)現(xiàn)那些特征明顯不同于其他數(shù)據(jù)的對象,從而避免將正常的觀測對象標記為異常數(shù)值。異常檢測在公共損失檢測、網(wǎng)絡攻擊、疾病的不尋常模式、醫(yī)療處理等方面都有重要作用。

      猜你喜歡
      滴滴數(shù)據(jù)挖掘建模
      “滴滴”上的叮嚀
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      聯(lián)想等效,拓展建模——以“帶電小球在等效場中做圓周運動”為例
      滴滴斷臂求生?
      汽車觀察(2019年2期)2019-03-15 06:00:00
      “厲害了,我的國”之滴滴打車
      少先隊活動(2018年5期)2018-12-29 12:12:36
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      滴滴Uber 大戰(zhàn)
      嘉义市| 金寨县| 龙海市| 育儿| 福泉市| 新蔡县| 田阳县| 嘉黎县| 麻江县| 宜宾市| 山东省| 漳州市| 宜宾县| 金秀| 兰坪| 屏山县| 安新县| 滕州市| 犍为县| 哈尔滨市| 景泰县| 从江县| 洛浦县| 柞水县| 大悟县| 呼玛县| 新津县| 腾冲县| 同江市| 驻马店市| 调兵山市| 渝中区| 安阳县| 鄂托克前旗| 曲麻莱县| 玉环县| 海南省| 辽宁省| 铁岭市| 华安县| 大兴区|