(天津市東方環(huán)亞通信科技有限公司,天津 300110)
隨著高新技術(shù)水平的不斷提高,智能化技術(shù)正在完全融入和影響我們的日常生活和工作,當(dāng)今信息技術(shù)已廣泛應(yīng)用于各行各業(yè)之中,人們越來越依賴的互聯(lián)網(wǎng)產(chǎn)業(yè),信息技術(shù)更是有著充分、全面的應(yīng)用。
大數(shù)據(jù)時代的到來,使得生活中的所有數(shù)據(jù)都變得有意義。數(shù)據(jù)與我們的日常生活越來越緊密地聯(lián)系在一起。從第一臺大型電腦、照相機發(fā)展到家用筆記本電腦、智能手機,數(shù)據(jù)的體量正在成倍的增長,數(shù)據(jù)的收集和利用也正在不斷升級。從目前汽車每日碳排放統(tǒng)計到全球氣溫檢查,從個人在線偏好分析到總統(tǒng)選舉時的投票趨勢預(yù)測,我們利用如今的大數(shù)據(jù)技術(shù)都可以做到。數(shù)據(jù)將人和世界緊密聯(lián)系起來,形成每個人都影響世界、每個人都受他人影響的繁雜網(wǎng)絡(luò)。龐大的數(shù)據(jù)已經(jīng)不能用傳統(tǒng)的統(tǒng)計方法去處理,所以機器需要自己處理,從數(shù)據(jù)中學(xué)習(xí)知識,用學(xué)到的知識處理大量的數(shù)據(jù),這是大數(shù)據(jù)時代不斷發(fā)展的大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)是關(guān)于無法使用通用軟件工具在一段時間內(nèi)捕獲、管理和處理的數(shù)據(jù)收集,只有新的處理模型才能擁有更多的決策、概述和流程優(yōu)化功能,并且具有較大的容量、增長率和多種信息資源。大數(shù)據(jù)技術(shù)是大型數(shù)據(jù)技術(shù)的應(yīng)用技術(shù),通常包括大數(shù)據(jù)平臺、大數(shù)據(jù)索引系統(tǒng)和其他數(shù)據(jù)應(yīng)用技術(shù)。
1.2.1 收集大數(shù)據(jù)
顧名思義,大數(shù)據(jù)收集是全方位地收集各種來源的海量數(shù)據(jù)。通常包括數(shù)據(jù)收集、網(wǎng)絡(luò)數(shù)據(jù)收集和文件收集。
1.2.2 大容量數(shù)據(jù)預(yù)處理
預(yù)處理大量數(shù)據(jù)是指在正式分析大量數(shù)據(jù)之前對原始數(shù)據(jù)進行預(yù)先比較。一般來說,進行一般分類、整合等,明確無效和不正確的文件,提高建立后進行正式分析的數(shù)據(jù)的整體質(zhì)量。鏈接通常分為四個階段:數(shù)據(jù)純化、數(shù)據(jù)整合、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)規(guī)則。
1.2.3 大容量數(shù)據(jù)存儲
大容量數(shù)據(jù)存儲是利用現(xiàn)有存儲以數(shù)據(jù)庫格式存儲收集到的數(shù)據(jù)的過程。
1.2.4 大數(shù)據(jù)分析和挖掘
從可視化分析、數(shù)據(jù)挖掘算法、預(yù)測分析、語義引擎、數(shù)據(jù)質(zhì)量管理等方面提取、微調(diào)和分析無序數(shù)據(jù)的過程。
手機應(yīng)用的發(fā)展與移動互聯(lián)網(wǎng)的發(fā)展和互聯(lián)網(wǎng)的發(fā)展息息相關(guān)。現(xiàn)在智能手機的普及為人們的生活和娛樂提供了很多的舒適,但它們都是通過移動應(yīng)用程序。目前,移動應(yīng)用市場的大部分軟件是由企業(yè)開發(fā)的,涵蓋所有行業(yè)。但是,不能保證這些應(yīng)用程序?qū)⑷娜獾貫橛脩舴?wù)。在某種程度上,它等同于分發(fā)自定義應(yīng)用程序、通過列表吸收用戶流量、內(nèi)置軟件、惡意軟件以及破壞現(xiàn)有應(yīng)用程序市場。為了更好地開發(fā)應(yīng)用程序,智能軟件開發(fā)需要專注于更加便捷化的服務(wù)。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及,電子商務(wù)進入了快速發(fā)展的快車道。網(wǎng)上購物的消費模式改變了人們的習(xí)慣。商場為消費者提供豐富的產(chǎn)品信息、便捷的交易方式、有競爭力的商品價格和寬松的購物環(huán)境。
據(jù)官方稱,消費者通過淘寶、京東、唯品會等購物應(yīng)用程序花費了大量資金,在軟件中存儲了大量消費者數(shù)據(jù)。消費者網(wǎng)站上的消費者行為數(shù)據(jù)正變得越來越重要,收集和分析這些數(shù)據(jù)將有助于商家和軟件預(yù)測進一步的客戶購買。
對于電子商務(wù)來說,沒有什么比知道客戶將來需要什么更重要的了。使用客戶在網(wǎng)站上留下的行為軌跡數(shù)據(jù)來分析客戶瀏覽的項目類別,幫助商家預(yù)測客戶需要的項目,并運行相應(yīng)的相關(guān)產(chǎn)品。通過分析客戶的購物偏好,如您最喜愛的款式、風(fēng)格和尺寸,您可以向客戶推薦合適的產(chǎn)品,并為他們提供良好的工作體驗。跟蹤客戶經(jīng)常購物的購物中心,分析數(shù)據(jù),并預(yù)測下次購買用戶時會發(fā)生什么。根據(jù)客戶查詢,貿(mào)易商可以預(yù)測客戶的購買力,向老客戶推薦品牌商品,向普通客戶推薦廉價商品,滿足不同客戶的不同心理價格。所以,我們應(yīng)該使用大數(shù)據(jù)技術(shù)來明智地分析和預(yù)測準(zhǔn)確的信息,以便它能夠及時、更貼近客戶地應(yīng)用于正確的位置。
商品預(yù)測也是電商常用的大數(shù)據(jù)分析方式。新產(chǎn)品上線后,通過前幾天的交易記錄可以知道該商品能賣多少,是暢銷還是滯銷的初步分析結(jié)果,這是電子商務(wù)和交易平臺供應(yīng)商的雙贏。
旅游類APP 在應(yīng)用大數(shù)據(jù)技術(shù)時,可以為用戶提供便利和旅游開發(fā)商開發(fā)旅游景點的建議。
旅游類應(yīng)用程序中存儲著熱門旅游景點數(shù)據(jù)、用戶的步行體驗、用戶對周邊商店的關(guān)心等多種用戶旅游數(shù)據(jù),通過對這些數(shù)據(jù)的深入分析,可以為用戶定制更加完善的旅游攻略。只要輸入出發(fā)地和目的地,就可以根據(jù)這些信息設(shè)計整個旅行攻略。對于旅游開發(fā)人員,可以利用大數(shù)據(jù)技術(shù)分析游客數(shù)據(jù),預(yù)測未來旅游開發(fā)的熱點。包括熱點游客、熱點旅游商品、熱點旅游開發(fā)地區(qū)、熱點旅游資源等,可以有效提高旅游投資收益率。
隨著大數(shù)據(jù)技術(shù)的持續(xù)開發(fā)和研究,技術(shù)開發(fā)的各個方面主要包括以下三個方面,提出了新的發(fā)展趨勢和挑戰(zhàn):
近年來,大數(shù)據(jù)的概念迅速吸引了公眾的心靈,在公眾面前可以直接看到的大數(shù)據(jù)更直觀地表達了出來??梢暬菍?fù)雜數(shù)據(jù)轉(zhuǎn)換為交互式圖表,使用戶能夠更好地了解數(shù)據(jù)對象分析、內(nèi)部規(guī)則搜索和概述。事實上,數(shù)據(jù)可視化大大拉大了大數(shù)據(jù)與普通人之間的距離,而不懂IT 技術(shù)的普通決策者可以更好地了解大數(shù)據(jù)及其分析的效果和價值。
在學(xué)術(shù)技術(shù)領(lǐng)域,深入分析將繼續(xù)是管理全國大數(shù)據(jù)信息應(yīng)用的代表。有關(guān)情報特別強調(diào)擴大相關(guān)能力,如決策預(yù)測和準(zhǔn)確建議。這種與人類思維、影響和理解相關(guān)的擴展將是深入大數(shù)據(jù)分析應(yīng)用的主要方向。
與傳統(tǒng)的機器學(xué)習(xí)算法相比,將計算機自動學(xué)習(xí)創(chuàng)建功能的方法納入建模過程,以減少人工設(shè)計功能的不完整性。通過深入的神經(jīng)網(wǎng)絡(luò)模型進行深度學(xué)習(xí),更智能地提取不同層次的數(shù)據(jù)特征,使數(shù)據(jù)更準(zhǔn)確、更高效的表達和教育樣本、深度學(xué)習(xí)算法,更誘導(dǎo)傳統(tǒng)機器學(xué)習(xí)算法。
目前,深度學(xué)習(xí)在圖像分類、語音識別、問答系統(tǒng)等領(lǐng)域取得了突破性進展,可以輕松收集樣本教育數(shù)據(jù),確保業(yè)務(wù)應(yīng)用成功。鑒于越來越多的行業(yè)和領(lǐng)域正在逐步改進數(shù)據(jù)收集和存儲,深度學(xué)習(xí)有望得到廣泛應(yīng)用。鑒于大容量數(shù)據(jù)應(yīng)用的復(fù)雜性,多訪問收斂成為持續(xù)的正常狀態(tài)。不斷關(guān)注智能技術(shù)的發(fā)展是有好處的。在規(guī)劃階段、技術(shù)水平、實踐流程等各個分析領(lǐng)域進行深入學(xué)習(xí)。
大數(shù)據(jù)技術(shù)或多或少包括多技術(shù)集成、數(shù)學(xué)與統(tǒng)計、計算機技術(shù)、管理等,大數(shù)據(jù)應(yīng)用和多領(lǐng)域應(yīng)用進一步跨越。這種多學(xué)科的交叉整合需要并將會產(chǎn)生該專業(yè)的基本行業(yè)數(shù)據(jù)主題?;A(chǔ)學(xué)科的多層次基礎(chǔ)將進一步完善學(xué)科的交叉整合。在大數(shù)據(jù)領(lǐng)域,許多相關(guān)領(lǐng)域似乎有著非常不同的研究方向,但在數(shù)據(jù)方面,它們實際上是相互關(guān)聯(lián)的。隨著社會數(shù)字化的深化,越來越多的學(xué)科在數(shù)據(jù)層面趨于一致,類似的理念可用于統(tǒng)一研究。從事大數(shù)據(jù)研究的人不僅包括計算機科學(xué)家,還包括數(shù)學(xué)科學(xué)家。我們希望業(yè)界對大數(shù)據(jù)邊界采取更廣泛和包容性的方法,采用所謂的“小數(shù)據(jù)”,甚至將域邊界擴展到與“數(shù)據(jù)科學(xué)”相對應(yīng)的整個數(shù)據(jù)領(lǐng)域和數(shù)據(jù)行業(yè)。建議共同支持數(shù)據(jù)科學(xué)領(lǐng)域的基礎(chǔ)研究,努力將基礎(chǔ)研究成果展示給技術(shù)研究和應(yīng)用。
作為新興技術(shù)的大數(shù)據(jù)技術(shù)是傳統(tǒng)領(lǐng)域的一場革命,其趨勢是利用全球大數(shù)據(jù)促進經(jīng)濟發(fā)展,改善社會治理,提高政府服務(wù)和監(jiān)管能力。各國已為大型和數(shù)據(jù)來源制定了戰(zhàn)略文件,以支持大量數(shù)據(jù)的開發(fā)和應(yīng)用。從全球大數(shù)據(jù)發(fā)展的趨勢看,大數(shù)據(jù)產(chǎn)業(yè)可以支持網(wǎng)絡(luò)共享、集中集成、聯(lián)合開發(fā)、高效利用社會生產(chǎn)要素,改變現(xiàn)行的生產(chǎn)方式和經(jīng)濟運行機制,顯著提高經(jīng)濟運行水平和效率。中國是一個數(shù)據(jù)制造商,大數(shù)據(jù)管理和分析技術(shù)開發(fā)和應(yīng)用的突破,可以繼續(xù)引導(dǎo)互聯(lián)網(wǎng)創(chuàng)新企業(yè)和創(chuàng)新應(yīng)用的快速發(fā)展。