(上海立信會(huì)計(jì)金融學(xué)院,上海 201209)
隨著世界經(jīng)濟(jì)一體化的持續(xù)推進(jìn),信息技術(shù)突飛猛進(jìn),人類社會(huì)正逐步從工業(yè)經(jīng)濟(jì)時(shí)代向知識(shí)信息經(jīng)濟(jì)時(shí)代轉(zhuǎn)變。對(duì)于大部分行業(yè)和企業(yè),與之相關(guān)聯(lián)的信息技術(shù)已經(jīng)成為組織關(guān)鍵性的、戰(zhàn)略性的資源。信息系統(tǒng)在優(yōu)化企業(yè)組織內(nèi)部的知識(shí)、信息流動(dòng)以及實(shí)現(xiàn)組織資源優(yōu)化配置等方面有著舉足輕重的地位,而數(shù)據(jù)資源管理技術(shù)則是信息系統(tǒng)必不可少的核心技術(shù)。目前,以大數(shù)據(jù)為代表的信息化浪潮將重塑數(shù)據(jù)管理理論,推動(dòng)數(shù)據(jù)管理和信息分析的技術(shù)創(chuàng)新。
根據(jù)勞登夫婦給出的定義,從技術(shù)上講信息系統(tǒng)就是一組相互關(guān)聯(lián)的能夠收集、處理、存儲(chǔ)和傳播信息來支持組織內(nèi)部決策和控制的部件的集合。從管理信息系統(tǒng)的功能上來看,它可以從不同側(cè)面滿足企業(yè)各個(gè)管理層次的信息需求,同時(shí)給相應(yīng)職能部門的管理活動(dòng)提供支持,以使企業(yè)的管理活動(dòng)更加科學(xué)有效。越來越多的企業(yè)領(lǐng)導(dǎo)者已經(jīng)意識(shí)到管理信息系統(tǒng)的重要作用,主要體現(xiàn)在:一,信息是正確決策的基礎(chǔ)。管理者要對(duì)環(huán)境變化做出正確的決策,除了借助個(gè)人經(jīng)驗(yàn)進(jìn)行理性判斷外,還需要收集大量正確、及時(shí)、可靠的信息。信息管理系統(tǒng)的應(yīng)用可以提高管理決策的準(zhǔn)確性同時(shí)兼?zhèn)漕A(yù)測(cè)功能,并且可以減少不必要的時(shí)間花費(fèi),提高效率降低人力成本。二,信息系統(tǒng)可以幫助企業(yè)收集到提高銷售和市場(chǎng)技巧方面的數(shù)據(jù),幫助企業(yè)降低內(nèi)部成本、防止客戶流失、緊固供應(yīng)商。信息管理系統(tǒng)是可以使公司具有強(qiáng)力競(jìng)爭(zhēng)優(yōu)勢(shì)的工具。最后,信息管理系統(tǒng)改變了人們的工作方式,使管理體制更加合理化。企業(yè)信息系統(tǒng)的引入使管理的分散化向集中管理轉(zhuǎn)化。使得組織的機(jī)構(gòu)扁平化,企業(yè)部門組織層次減少,形成部門之間的有機(jī)結(jié)合,保證高層管理者能夠迅速對(duì)決策效果進(jìn)行評(píng)價(jià)和控制。
隨著云時(shí)代的來臨,一場(chǎng)大數(shù)據(jù)革命正在進(jìn)行。各行各業(yè)均存在大數(shù)據(jù),根據(jù)文獻(xiàn)的定義,這些數(shù)據(jù)量大類多、實(shí)時(shí)性強(qiáng)、蘊(yùn)藏巨大價(jià)值,需要搜索、處理、分析、歸納、總結(jié)其深層次的規(guī)律。普遍認(rèn)為“大數(shù)據(jù)”爆發(fā)的根本原因有二:數(shù)據(jù)價(jià)值越來越受到關(guān)注以及收集處理數(shù)據(jù)的技術(shù)顯著提高。數(shù)據(jù)生產(chǎn)要素化使得信息系統(tǒng)模式和理念推陳出新,也使得大數(shù)據(jù)技術(shù)得以發(fā)展和深化??梢哉f大數(shù)據(jù)正是以信息系統(tǒng)這一有力載體為基礎(chǔ)的前沿技術(shù),代表著今后數(shù)據(jù)分析的發(fā)展方向。
近年來隨著信息化技術(shù)的不斷發(fā)展,現(xiàn)有的企業(yè)管理信息系統(tǒng)無論是規(guī)模還是架構(gòu)都很難適應(yīng)在海量數(shù)據(jù)場(chǎng)景下的數(shù)據(jù)管理和分析,直接影響了企業(yè)形勢(shì)預(yù)判和重大決策。因此,需要?jiǎng)?chuàng)建新的能夠匹配當(dāng)前大數(shù)據(jù)場(chǎng)景的業(yè)務(wù)系統(tǒng)。借助此信息系統(tǒng),可從海量數(shù)據(jù)中選取最有價(jià)值含量的信息,并對(duì)其進(jìn)行有效整理和邏輯分析,以期發(fā)現(xiàn)隱藏在繁雜數(shù)據(jù)背后的因果邏輯關(guān)系,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的深度應(yīng)用、綜合應(yīng)用和高端應(yīng)用,承擔(dān)起對(duì)組織戰(zhàn)略應(yīng)用的支撐和服務(wù)。具體來說,信息系統(tǒng)在大數(shù)據(jù)時(shí)代的適用技術(shù)如下所述:
不斷推進(jìn)的信息化建設(shè)以及飛速增長(zhǎng)的數(shù)據(jù)規(guī)模,都對(duì)信息系統(tǒng)的數(shù)據(jù)存儲(chǔ)能力提出了新的更高要求。為了滿足大規(guī)模數(shù)據(jù)的存儲(chǔ)和分析,信息系統(tǒng)應(yīng)支持單一系統(tǒng)擴(kuò)展至10PB以上規(guī)模,以滿足數(shù)據(jù)爆發(fā)的存儲(chǔ)需要。
高質(zhì)量的數(shù)據(jù)是數(shù)據(jù)分析挖掘等應(yīng)用行之有效的必要前提,面對(duì)企業(yè)不同部門之間產(chǎn)生的繁復(fù)數(shù)據(jù),信息系統(tǒng)勢(shì)必需要將這些多源異構(gòu)的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換及裝載,實(shí)現(xiàn)數(shù)據(jù)的整合、消重,提供高質(zhì)量的數(shù)據(jù),并在此基礎(chǔ)上進(jìn)行關(guān)聯(lián)、建模,為實(shí)戰(zhàn)業(yè)務(wù)提供可用的數(shù)據(jù)。
百億條記錄的檢索、上千張表的碰撞、大量的移動(dòng)互聯(lián)網(wǎng)和社交媒體數(shù)據(jù)處理等應(yīng)用,無一不對(duì)信息系統(tǒng)的數(shù)據(jù)分析能力提出更高的要求。
大數(shù)據(jù)的實(shí)質(zhì)是對(duì)數(shù)據(jù)的管理與開發(fā)利用,要想借助大數(shù)據(jù)技術(shù)推動(dòng)企業(yè)管理工作的發(fā)展和變革,在行業(yè)競(jìng)爭(zhēng)中占得先機(jī),技術(shù)選型非常重要。文獻(xiàn)指出在各路組織和技術(shù)人員的助推下,信息系統(tǒng)在大數(shù)據(jù)相關(guān)領(lǐng)域中的技術(shù)呈現(xiàn)出百家爭(zhēng)鳴的局面,在涵蓋數(shù)據(jù)收集、存儲(chǔ)、計(jì)算、挖掘、資源調(diào)度等方面不斷取得突破和創(chuàng)新,下面就以最核心的計(jì)算層和存儲(chǔ)層兩個(gè)維度介紹一下信息系統(tǒng)的相關(guān)技術(shù)路線和發(fā)展趨勢(shì)。
數(shù)據(jù)處理:無論使用何種應(yīng)用,一臺(tái)服務(wù)器面對(duì)海量數(shù)據(jù)的計(jì)算仍然束手無策,而分布式計(jì)算則對(duì)此類問題的處理游刃有余。與此同時(shí),HadoopMapReduce的重要?jiǎng)?chuàng)新便是化繁為簡(jiǎn)把整體大數(shù)據(jù)集拆分成一個(gè)一個(gè)的小任務(wù),并由同時(shí)運(yùn)行的多個(gè)節(jié)點(diǎn)進(jìn)行處理。這種批量處理框架常用于離線的復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)處理,如ETL、數(shù)據(jù)挖掘等場(chǎng)景;與Hadoop的使用硬盤來存儲(chǔ)數(shù)據(jù)不同,Spark是基于內(nèi)存的迭代計(jì)算框架,適用于需要多次操作特定數(shù)據(jù)集的應(yīng)用場(chǎng)合;而Storm則是專門針對(duì)實(shí)時(shí)數(shù)據(jù)類型的流式計(jì)算分析框架,應(yīng)用在低延遲的場(chǎng)景中,實(shí)現(xiàn)海量事件的實(shí)時(shí)分析、處理和決策。除此之外,為應(yīng)對(duì)不斷增長(zhǎng)的海量結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和快速處理以及靈活的業(yè)務(wù)建模需求,信息系統(tǒng)所依存的數(shù)據(jù)庫必將引入分布式架構(gòu)、MPP處理技術(shù)。
數(shù)據(jù)存儲(chǔ):MapReduce可以將處理海量數(shù)據(jù)的任務(wù)分解至多個(gè)節(jié)點(diǎn)服務(wù)器同時(shí)進(jìn)行。而對(duì)于分布式計(jì)算,每臺(tái)節(jié)點(diǎn)服務(wù)器都必須擁有數(shù)據(jù)訪問權(quán)限,這就是HDFS所具有的功能。HDFS有著高容錯(cuò)性、高吞吐量的特點(diǎn),適合大數(shù)據(jù)集的應(yīng)用。與此同時(shí),業(yè)內(nèi)也有許多其他類型的文件系統(tǒng)推出,不僅能解決了傳統(tǒng)存儲(chǔ)體系結(jié)構(gòu)存在的難題,又能提高存儲(chǔ)利用率和數(shù)據(jù)讀寫性能,可以替代HDFS作為Hadoop架構(gòu)的底層文件系統(tǒng)/數(shù)據(jù)存儲(chǔ)。
不同的技術(shù)思路各有偏重。由于不同類型的組織有著不同的組織結(jié)構(gòu),業(yè)務(wù)種類繁多,大數(shù)據(jù)應(yīng)用場(chǎng)景多樣化,只有積極引進(jìn)大數(shù)據(jù)領(lǐng)域的先進(jìn)技術(shù),才能推動(dòng)組織管理工作邁入大數(shù)據(jù)發(fā)展階段。
通過上述分析,我們不難看出,未來信息系統(tǒng)必將圍繞“大數(shù)據(jù)”進(jìn)行建設(shè)。通過合理規(guī)劃企業(yè)信息系統(tǒng)的建設(shè)路線,積極引進(jìn)大數(shù)據(jù)技術(shù),企業(yè)才有可能在未來激烈的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)地位。對(duì)未來信息系統(tǒng)在大數(shù)據(jù)時(shí)代的發(fā)展趨勢(shì),具體有下面幾點(diǎn)思考。
作為二十一世紀(jì)最重要的戰(zhàn)略資源,數(shù)據(jù)信息越來越受到關(guān)注和追捧。所以,企業(yè)為了能在市場(chǎng)競(jìng)爭(zhēng)中取得先機(jī),就必須提前制定有關(guān)大數(shù)據(jù)的企業(yè)戰(zhàn)略。而在制訂計(jì)劃時(shí),需要信息系統(tǒng)提供支持。那么,數(shù)據(jù)資源化就需要一個(gè)合理的規(guī)范和標(biāo)準(zhǔn),以保證數(shù)據(jù)質(zhì)量等要求。
云計(jì)算作為大數(shù)據(jù)的設(shè)備依托,是大數(shù)據(jù)產(chǎn)生的源泉。企業(yè)管理信息系統(tǒng)需要積極引進(jìn)此類技術(shù),主動(dòng)進(jìn)行技術(shù)革新,關(guān)注信息安全和接口安全等方面的新技術(shù)、新方法,為大數(shù)據(jù)革命添磚加瓦,讓大數(shù)據(jù)在計(jì)算機(jī)時(shí)代發(fā)揮出更大的作用。
信息革命如火如荼,與數(shù)據(jù)相關(guān)的云計(jì)算、大數(shù)據(jù)等一系列新概念新觀點(diǎn)也應(yīng)運(yùn)而生,這對(duì)全球企業(yè)來說是把雙刃劍。為了把握機(jī)遇,積極迎接挑戰(zhàn),在行業(yè)競(jìng)爭(zhēng)中拔得頭籌,設(shè)計(jì)建立一個(gè)合適的企業(yè)管理信息系統(tǒng)意義重大。只有以信息系統(tǒng)平臺(tái)為基礎(chǔ),實(shí)現(xiàn)企業(yè)信息共享,才能深度利用海量數(shù)據(jù)背后的有利信息,在競(jìng)爭(zhēng)者中脫穎而出。更重要的是,大數(shù)據(jù)儼然成為信息時(shí)代一種最重要的資源,各個(gè)領(lǐng)域和各部門都受到其影響,從這一層面上來說,大數(shù)據(jù)對(duì)于推動(dòng)國(guó)民經(jīng)濟(jì)發(fā)展舉足輕重。