• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數據挖掘聚類算法在船岸一體化平臺中的應用

      2014-11-30 03:48:08汪益兵徐顯文
      中國航海 2014年2期
      關鍵詞:基準值航程油耗

      汪益兵, 王 捷, 徐顯文

      (浙江國際海運職業(yè)技術學院, 浙江 舟山 316021)

      數據挖掘聚類算法在船岸一體化平臺中的應用

      汪益兵, 王 捷, 徐顯文

      (浙江國際海運職業(yè)技術學院, 浙江 舟山 316021)

      船舶的遠程動態(tài)跟蹤及數據采集、處理與應用是船岸一體化平臺的一項主要內容。船岸一體化平臺收集的數據呈現復雜的關系,而利用數據挖掘技術能從中發(fā)現知識或規(guī)律,及時分析以提供決策支持。介紹船岸一體化平臺的數據采集過程、對數據的要求以及數據挖掘方法的相關理論。以船舶節(jié)能為研究目標,舉例說明k均值聚類算法的應用過程,為船岸一體化平臺的數據處理與功能實現提供一個新的思路。

      水路運輸;數據挖掘;k-means聚類算法;船岸一體化平臺;船舶節(jié)能

      數據挖掘技術是隨著數據庫和人工智能發(fā)展起來的,現已成為信息決策領域研究的前沿,得到了學術界和工業(yè)界的廣泛關注。[1]近年來,該技術在海上交通的交通流數據特征分析、交通事故分析與預防、船舶行為研究等領域得到了研究或應用。[2-6]日漸發(fā)展的船岸一體化平臺在航運公司管理人員實時、高效管理船舶方面顯示出廣闊的應用前景。在船岸一體化平臺中,運用數據挖掘聚類分析技術處理平臺收集的船舶數據,獲得相關知識、規(guī)律,為實現成本控制、節(jié)能減排、決策分析等功能提供技術支持。

      1 船岸一體化平臺及其對船舶數據的要求

      船岸一體化平臺是航運公司將利用現代通信、信息技術采集到的船舶各類運行數據進行集中管理與綜合應用,然后將其作為船岸安全與技術管理決策依據的管理平臺。該平臺將公司(岸基)與所屬船舶(船端)所有日常管理、技術管理、安全管理、航運管理、成本控制集于一體,實現船岸信息資源共享與管理一體化,其核心是實現對船舶航行安全、設備運行狀態(tài)、在船人員、所載貨物與突發(fā)事件等的控制與跟蹤。該平臺能夠提高管理層的調度和經營、決策能力,實現快速、動態(tài)地指導一線船員生產實踐以及船舶管理的現代化。[7-9]

      船岸一體化平臺由船基數據采集處理、船岸數據通信以及岸基數據挖掘與遠程監(jiān)控等幾部分組成。船基數據(包括船舶航行數據、機艙工況數據、海上氣象數據和船舶AIS(Automatic Identification System)數據等)經采集處理,在文本文件加密或壓縮后,通過海事衛(wèi)星和網絡傳輸,以郵件方式發(fā)送到岸基。岸基將收到的郵件進行解壓縮和解密后,分發(fā)到相應的應用系統或儲存到指定的數據庫中,實現船岸數據的同步與共享。[10-11]

      通過數據交換平臺,將不同的數據結構和數據格式轉換成統一的、便于應用的形式,包括數據的解密或解壓縮、數據類型的轉換、數據長度的轉換等。為滿足不同業(yè)務對數據的要求,在對數據進行重組分類的基礎上,再應用數據挖掘技術進行分析與處理。以船舶減少油耗實現節(jié)能目標為例,進行船舶數據挖掘與研究,研究對象除船舶航行數據外主要是機艙監(jiān)測數據。此外,為簡化船舶營運過程中的油耗分析和得到精確的決策規(guī)則,收集的是排除了特殊航行狀態(tài)(如船舶抵離港、在港靠泊、錨地錨泊等)后兩個連續(xù)掛靠港口間的船舶數據。

      2 數據挖掘中的k均值聚類算法

      數據挖掘是通過分析大量數據揭示新的關系、趨勢和模式的過程,其主要任務是對數據庫中的大量業(yè)務數據進行抽取、轉換、分析和模型化處理,從中提取可輔助決策的關鍵性數據和隱藏的預測性信息。通過數據挖掘,能發(fā)掘數據間潛在的模式,找出可能忽略的信息,以可理解和觀察的形式反映給用戶,并給出基于知識的決策分析意見和結論。[12]

      聚類算法是數據挖掘中的一個重要研究領域。聚類是一種常見的數據分析工具,其目的是把大量數據點的集合分成若干類,使得同類中的數據最大程度地相似,而不同類中的數據最大程度地不同。聚類的實質是將性質相似的點聚在一起,以發(fā)現其中的規(guī)律。基于劃分的方法是最常用的聚類分析方法之一,k均值聚類算法是其代表算法。[13]

      k均值聚類算法又稱基于k-means聚類算法,在數據挖掘領域中得到了廣泛應用。k均值聚類算法給定一個例子的集合X(其中包括n個數據對象),并將數據對象劃分為k個聚類(k≤n),通常會采用一個劃分準則(稱為相似度函數),以使同一簇中的對象是相似的,而不同簇中的對象是相異的。k均值聚類算法的處理過程是:對于給定的一個包含n個d維數據點的數據集X={x1,x2,…,xi,…,xn}(其中xi∈Rd)以及要生成的數據子集的數目k,k-means聚類算法將數據對象組織為k個劃分C={ck,i=1,2,…,k},每個劃分代表一個類ck,每個類ck有一個類別中心μi。選取歐氏距離作為相似性和距離判斷準則,計算該類內各點到聚類中心μi的距離平方和J(ck)為

      (1)

      (2)

      式(2)中:若xi∈ci,則dki=1;若xi?ci,則dki=0。

      顯然,根據最小二乘法和拉格朗日原理,聚類中心μk應該取為ck類各數據點的平均值。

      k均值聚類算法從一個初始的k類別劃分開始,將各數據點指派到各個類別中,以減小總的距離平方和。該算法是一個反復迭代過程,目的是使聚類域中所有的樣品到聚類中心距離的平方和J(C)最小,算法具體流程見圖1。

      圖1 k均值聚類算法流程圖

      實踐中,著重發(fā)掘與主要因素相關的船舶運行特性與規(guī)律。k均值聚類算法需要用戶提前輸入聚類作業(yè)所要形成簇的數量,即k值。k值的選取對聚類的結果具有很大影響,通過調整k值評價不同的可能性。k均值聚類算法的優(yōu)勢在于能夠挖掘出包含多個屬性信息的潛在趨勢,可用于識別特定情況與趨勢,但結果分析需要基礎資料的支撐。

      3 數據挖掘聚類算法在船岸一體化平臺實現船舶節(jié)能功能中的應用

      3.1在船岸一體化平臺中數據挖掘聚類算法的基本程序

      1) 針對船岸一體化平臺收集的船舶數據,把船舶節(jié)能作為研究目標,明確數據挖掘的要求與任務。

      2) 對船舶數據采集與監(jiān)控系統收集的數據進行清洗,即對原始數據進行加工(一般包含數據標準化、數據平整、丟失數據處理、時間相關數據處理以及異常數據的分析和處理等),以生成用于數據挖掘的數據庫。

      3) 采用k均值聚類算法實施數據挖掘任務,從船岸一體化平臺的大量數據中尋找船舶主機高效(率)數據集(簇),在各聚類中心點(簇的中心點)與負荷的對應關系上建立基準值模型;針對所屬類別,設計或選擇有效的算法,實施數據挖掘。

      4) 對挖掘結果進行解釋、評估與優(yōu)化。

      5) 通過分析、整理,將結果輸出到航運管理實際工作中,為決策提供依據。

      3.2船舶油耗數據的預處理

      為處理模糊和不確定知識,將粗糙集理論作為數據挖掘的數學工具,把研究對象的屬性分為決策屬性和條件屬性。在對船舶營運油耗的研究中,決策屬性采用的是船舶主機日耗油量與日累積航程的比值,稱作單位航程油耗。而影響耗油的可能條件屬性有:

      1) 船舶因素:船舶種類與大小、裝載狀態(tài)、船舶吃水和吃水差、船舶穩(wěn)性與搖擺性、船殼狀況等。

      2) 機器因素:主要指船舶主機、副機、鍋爐等裝備及其性能、技術狀態(tài)等。

      3) 燃油因素:主要指燃油品質與性能等。

      4) 環(huán)境因素:風、流、浪和天氣狀況等。

      5) 操縱因素:航向、航速和主機轉速等運轉工況。

      在船岸一體化平臺中,采集的數據來自于公司所屬的各船舶。由于公司同系列船舶在船舶、機器等方面存在許多相似的屬性,應用數據挖掘技術具有更豐富、科學的數據基礎。這也是利用船岸一體化平臺進行數據挖掘的有利條件。

      在進行油耗分析前,需將油耗相關數據轉換為船舶油耗信息系統的形式,以確定條件屬性和決策屬性。由于船岸不同的軟硬件設備,數據結構各異,可能造成彼此不能識別對方的數據。因此,需對數據進行標準化。同時,設備故障或其他因素可能導致個別船舶數據不確定或缺失的現象,需對經典粗糙集理論進行擴充,以適應不完備的信息系統。

      3.3建立基準值模型

      對某一具體船舶節(jié)能而言,在一定負荷和環(huán)境參數下,單位航程油耗最小時對應的主機工況為最佳工況,在此工況下,主機效率及相關運行監(jiān)控參數稱為參數基準值。采用k均值聚類算法,在大量數據中尋找船舶機器高效數據集(簇),利用各聚類中心點(簇的重心點)與負荷的對應關系建立基準值模型。隨后,對船舶主機運行數據進行分析,尋找各負荷工況下船舶主機的高效運行工況,將其對應的運行參數作為基準值建模的樣本數據,并確定其基準值模型。[14]

      選擇船舶主機功率、單位航程油耗和主機轉速3個屬性進行分析。

      1) 將主機功率分成N個區(qū)間,如果一個區(qū)間的點數太少,則與相鄰的區(qū)間合并,這樣就保證了每個主機功率區(qū)段有足夠多的記錄。

      2) 對每個區(qū)段的點進行聚類,找到各簇數據對應的聚類中心中單位航程油耗最小的一簇數據,其聚類中心對應的主機功率和主機轉速就是要找的一個基準值樣本點。

      3) 對每一個主機功率區(qū)間進行相同的操作,直到找到所有劃分區(qū)間的樣本點。

      4) 將樣本點進行正交曲線擬合,得到主機轉速的基準值模型。

      3.4實施數據挖掘

      為方便說明,以某公司對3 590 TEU同系列全集裝箱船采集的數據為例,對通過數據挖掘聚類算法實現船舶節(jié)能的目標作詳細描述。

      1) 采集船舶主機功率、單位航程油耗和主機轉速3個屬性參數的所有數據,在對數據預處理后,把該類船舶正常航行時主機功率在10 000~22 000 kW內的所有有效數據生成用于數據挖掘的數據庫,并以每2 000 kW劃分主機功率區(qū)間,共把數據分為6個區(qū)間。

      2) 采用k均值聚類算法對主機功率在各個區(qū)間的單位航程油耗進行聚類分析,并列出聚類分析結果,其中主機功率在14 001~16 000 kW的聚類分析結果見表1。

      在完成聚類分析后,從分析結果中找出單位航程油耗最小的一類,如果該類又包含足夠多的數據記錄,則可被認定為主機功率在該區(qū)間的一個樣本點。例如在表1中,可認定Cluster-5為主機功率在14 001~16 000 kW的一個樣本點。對其他功率區(qū)間依次類推,得到船舶主機功率在各區(qū)間對應單位航程油耗最小的樣本點集合(見表2)。

      根據表2,以主機功率、轉速分別為橫、縱坐標作樣本點位置圖(見圖2),從圖中可直觀地發(fā)現船舶單位航程油耗最小時主機功率、轉速的變化規(guī)律。公司根據船岸一體化平臺的數據挖掘處理結果,獲得同類型船舶在具體航次承受不同負荷下為實現船舶單位航程油耗最小可采用的主機轉速,再把該運行工況應用于其他同類型船舶的航行實踐中。

      表1 主機功率在14 001~16 000 kW下的船舶主機轉速聚類分析結果

      表2 主機功率各區(qū)間對應船舶單位航程油耗最小的樣本點

      圖2 樣本點位置圖

      3.5評估優(yōu)化與結果應用

      從數據挖掘結果可以看出,船舶在每個主機功率區(qū)段采用對應主機轉速的條件下,該樣本點的單位航程油耗最小,與基準值定義的高效運行工況的定義是一致的。船舶在海上航行時,如果受風影響,單位航程油耗將會受到較大影響。海上天氣對船舶單位航程燃油消耗的影響主要是通過影響船舶航程和航速產生的。增加主機轉速和航速也會提高船舶單位航程的燃油消耗。為降低單位航程油耗,在實踐中通常運用良好的船藝,通過調整、控制和穩(wěn)定船舶航向,并采用數據挖掘處理得到一定主機功率下相對應的主機轉速,實現船舶節(jié)能的目標。

      4 結 語

      鑒于數據挖掘技術的人工智能特征和針對復雜數據的處理能力及其已在多個行業(yè)的分析預測中取得的良好效果,提出在船岸一體化平臺中利用數據挖掘技術對數據進行處理以輔助管理人員決策分析的思想。結合船舶節(jié)能實例,運用k均值聚類算法挖掘出影響船舶節(jié)能因素的潛在規(guī)律,給管理決策提供信息支撐,為航運公司提高船舶營運效率、降低營運成本提供科學依據。船舶營運油耗是一個受多因素影響的綜合性過程,采用數據挖掘聚類算法研究分析船舶節(jié)能問題,為更好地發(fā)揮船岸一體化平臺功能提供了一個新的思路。

      [1] 殷瑞飛.數據挖掘中的聚類方法及其應用[D].廈門:廈門大學,2008.

      [2] 鄭濱,陳錦標,夏少生,等.基于數據挖掘的海上交通流數據特征分析[J].中國航海,2009,32(1):60-63.

      [3] 牟軍敏,鄒早建,齊傳新.數據挖掘技術在內河交通事故分析和預防中的應用[J].中國航海,2004,27(1):27-29.

      [4] 朱飛祥,張英俊,高宗江.基于數據挖掘的船舶行為研究[J].中國航海,2012,35(2):50-54.

      [5] 潘家財,邵哲平,姜青山.數據挖掘在海上交通特征分析中的應用研究[J].中國航海,2010,33(2):60-62.

      [6] 朱飛祥.遠洋船舶調度數據挖掘技術研究與應用[D].大連:大連海事大學,2008.

      [7] 岳躍申,鄭士君,黃愛平.新型船岸一體化管理平臺的設計及其功能[J].航海技術,2009(9):70-72.

      [8] 汪益兵,聶建濤.基于嵌入式技術的船岸一體化管理平臺設計與開發(fā)[J].上海海事大學學報,2013,34(4):23-26.

      [9] 蔡曄敏,周亞蘭,朱蕊.船舶自動化系統網絡的設計進展[J].上海工程技術大學學報,2010,24(2):142-144.

      [10] 韓建鋒,陳星.嵌入式船舶數據采集與監(jiān)控系統[J].儀表技術與傳感器,2008(8):61-62.

      [11] 薛明剛,徐承飛,趙衛(wèi)麗,等.船岸一體化數據同步的實現[J].中國修船,2011,24(1):21-24.

      [12] 劉同明.數據挖掘技術及其應用[M].北京:國防工業(yè)出版社,2001.

      [13] 行小帥,焦李成.數據挖掘的聚類方法[J].電路與系統學報,2003,8(1):59-67.

      [14] 錢瑾,王培紅,李琳.聚類算法在鍋爐運行參數基準值分析中的應用[J].中國電機工程學報,2007,27(23):71-74.

      ApplicationofClusteringAlgorithmforDataMininginShip-ShoreIntegrationPlatform

      WANGYibing,WANGJie,XUXianwen
      (Zhejiang International Maritime College, Zhoushan 316021, China)

      Ship-shore integration platform performs ship tracking, data acquisition and processing, and management services. The large amount of data collected in ship-shore integration platform shows a complex relationship and the data mining technique is necessary for extracting knowledge and discovering laws from data and timely supporting decision making. The data acquisition process of the platforms and their requirements for the information as well as some concepts of data mining are introduced. The practical application ofk-means clustering algorithm aiming for energy saving is illustrated. This study demonstrates a new approach of developing a ship-shore integration platform.

      waterway transportation; data mining;k-means clustering algorithm; ship-shore integration platform; ship energy saving

      2013-12-22

      浙江省公益性技術應用研究計劃項目(2013C33084)

      汪益兵(1970-),男,浙江蘭溪人,副教授,船長,從事航海技術、交通運輸管理研究。E-mail:zimcwyb@126.com.

      1000-4653(2014)02-0122-05

      TP311.13

      A

      猜你喜歡
      基準值航程油耗
      河北省啤酒行業(yè)清潔生產水平分析
      價值工程(2023年33期)2023-12-13 01:24:56
      不談油耗 只講運動 試駕第十一代思域e:HEV
      車主之友(2022年5期)2022-11-23 07:22:20
      殲-16挑戰(zhàn)更大航程
      基于5G用戶體驗的業(yè)務質量優(yōu)化模型研究及其應用
      西進執(zhí)教 一段人生的奇異航程
      海峽姐妹(2019年5期)2019-06-18 10:40:34
      一種基于改進差分的測井數據可逆變長碼壓縮方法
      飛越北極的航程
      降低內燃裝卸機械油耗措施的探討
      雙管齊下 YarisL致享綜合油耗測試
      車迷(2017年12期)2018-01-18 02:16:10
      人生航程 “漫”條“思”理
      航海(2016年2期)2016-05-19 03:57:11
      炎陵县| 西林县| 微山县| 德庆县| 菏泽市| 华容县| 苍梧县| 桂平市| 三门县| 车险| 六安市| 甘泉县| 东阳市| 喀喇沁旗| 大余县| 临湘市| 温泉县| 泸水县| 化隆| 富源县| 宁远县| 青州市| 平山县| 重庆市| 深泽县| 楚雄市| 微山县| 贵定县| 任丘市| 基隆市| 韶关市| 乐清市| 永吉县| 琼中| 桦甸市| 尚义县| 井陉县| 湟源县| 清徐县| 湾仔区| 平谷区|