成 勇
(中國(guó)移動(dòng)通信集團(tuán)廣西有限公司, 南寧 530022)
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,科學(xué)技術(shù)日新月異,不斷地創(chuàng)新和改進(jìn),尤其是計(jì)算機(jī)信息技術(shù)更是成為人們生活和生產(chǎn)過(guò)程中不可分割的重要組成部分,為人們的生活、生產(chǎn)方式帶來(lái)了巨大的改變,受到各界人士的廣泛關(guān)注。近年來(lái),社會(huì)已經(jīng)朝著信息化的方向發(fā)展,一系列信息技術(shù)都取得了不錯(cuò)的成績(jī),無(wú)論是互聯(lián)網(wǎng)或是物理信息系統(tǒng)技術(shù)都得到了充分的發(fā)展,受到各界人士的廣泛關(guān)注。鑒于這種狀況,大數(shù)據(jù)的發(fā)展規(guī)模逐漸擴(kuò)大,所涵蓋的內(nèi)容面積也越來(lái)也多,涉及的范圍逐漸擴(kuò)展。在這種環(huán)境下,許多領(lǐng)域都開(kāi)始紛紛試用大數(shù)據(jù),無(wú)論是制造業(yè)、交通行業(yè)還是服務(wù)業(yè)和醫(yī)療業(yè)等都充分應(yīng)用了大數(shù)據(jù)的作用,取得了有效的成功。信息數(shù)據(jù)的使用已經(jīng)成為我國(guó)社會(huì)經(jīng)濟(jì)的重要內(nèi)容。
大數(shù)據(jù)是一個(gè)數(shù)的幾何體,其具有以下幾個(gè)性質(zhì):第一,大數(shù)據(jù)具有一致性,在數(shù)據(jù)幾何中所包含的各類信息保持相同性,對(duì)于一些無(wú)法與大數(shù)據(jù)信息相符合或是出現(xiàn)錯(cuò)誤的信息則不屬于數(shù)據(jù)集合中。當(dāng)大數(shù)據(jù)中的信息出現(xiàn)不一致的現(xiàn)象,則說(shuō)明其存在一定的危險(xiǎn)性,可進(jìn)行有效的審查。比如說(shuō),某一張信用卡同時(shí)在兩個(gè)城市消費(fèi),而消費(fèi)的數(shù)據(jù)不一致,則說(shuō)明信用卡的使用出現(xiàn)了問(wèn)題;第二,大數(shù)據(jù)具有準(zhǔn)確性。在大數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都代表著一個(gè)實(shí)體,能夠準(zhǔn)確地反映出某一事件的具體情況和數(shù)據(jù);第三,大數(shù)據(jù)具有一定的完整性。數(shù)據(jù)集合中的數(shù)據(jù)應(yīng)當(dāng)包含各方面的數(shù)據(jù)內(nèi)容,要予以人們查詢和計(jì)算,比如說(shuō)在醫(yī)院的數(shù)據(jù)庫(kù)中,為保障醫(yī)療工作的順利開(kāi)展,則必須確保數(shù)據(jù)庫(kù)信息的完整性,不可遺失任何重要的數(shù)據(jù),以防止影響醫(yī)療工作者的判斷;第四,大數(shù)據(jù)具有時(shí)效性。數(shù)據(jù)集合中的數(shù)據(jù)都符合于現(xiàn)階段的發(fā)展情況,能夠保持與時(shí)俱進(jìn),確保信息的先進(jìn)性;第五,大數(shù)據(jù)具有實(shí)體同一性。數(shù)據(jù)幾何中的各項(xiàng)數(shù)據(jù)在描述的過(guò)程中具有統(tǒng)一性,享有共同的描述。我們可以將滿足以上這五種信紙的數(shù)據(jù)集合稱之為大數(shù)據(jù)的可用性。
現(xiàn)階段,在大數(shù)據(jù)可用性的研究過(guò)程中仍然存在著一定的問(wèn)題,還有待進(jìn)一步完善。其問(wèn)題主要在于以下方面:首先,在獲取高質(zhì)量數(shù)據(jù)方面還存在著一定的問(wèn)題。在此方面所遇到的挑戰(zhàn)主要在于如何充分利用高質(zhì)量大數(shù)據(jù)的理論,來(lái)進(jìn)行數(shù)據(jù)的過(guò)濾,剔除一些無(wú)用的數(shù)據(jù),以保障所收獲的數(shù)據(jù)符合要求,具有較高的質(zhì)量。在研究大數(shù)據(jù)的可用性的時(shí)候,應(yīng)當(dāng)考慮如何將數(shù)據(jù)可用性形象化的表示出來(lái),要思考在理論上如何判斷數(shù)據(jù)的可用性并且對(duì)其進(jìn)行定量方面的評(píng)估?,F(xiàn)階段,由于缺乏健全的大數(shù)據(jù)可用性理論體系,以至于難以解決以上這些問(wèn)題。
通常而言,大數(shù)據(jù)的來(lái)源主要來(lái)自于三個(gè)方面。一個(gè)方面是從Web網(wǎng)站上建立的數(shù)據(jù)庫(kù)來(lái)收獲相應(yīng)的數(shù)據(jù)資源,一個(gè)方面是來(lái)自于社會(huì)中的各種物理系統(tǒng)。比如說(shuō)智能電網(wǎng)等,另一個(gè)方面主要是通過(guò)科學(xué)的實(shí)驗(yàn)來(lái)觀測(cè)和采集相應(yīng)的數(shù)據(jù)。為了保障大數(shù)據(jù)的可用性,一定要確保大數(shù)據(jù)的高質(zhì)量。
大數(shù)據(jù)高質(zhì)量的整合,應(yīng)當(dāng)處理好數(shù)據(jù)之間的復(fù)制關(guān)系,對(duì)靜態(tài)數(shù)據(jù)進(jìn)行貝葉斯分析,對(duì)動(dòng)態(tài)數(shù)據(jù)可實(shí)施馬爾可夫模型,以此來(lái)確定數(shù)據(jù)之間的復(fù)制關(guān)系并進(jìn)行有效的改善,保障大數(shù)據(jù)高質(zhì)量的整合效果。
為了提高大數(shù)據(jù)的質(zhì)量,提升大數(shù)據(jù)的可用性,則必須建立完善的大數(shù)據(jù)可用性理論體系。在建立大數(shù)據(jù)可用性理論體系的過(guò)程中,應(yīng)當(dāng)遵循語(yǔ)義規(guī)則,以統(tǒng)計(jì)學(xué)為基礎(chǔ)來(lái)對(duì)大數(shù)據(jù)進(jìn)行描述,以保障數(shù)據(jù)的完整性。除此之外,為了提高數(shù)據(jù)的精準(zhǔn)性,應(yīng)當(dāng)提高數(shù)據(jù)的實(shí)效性,通過(guò)完善的理論體系來(lái)判斷數(shù)據(jù)的時(shí)效性,以確保在第一時(shí)間獲得有效的數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中存在的問(wèn)題,并進(jìn)行自動(dòng)地修復(fù)和完善。為了提高數(shù)據(jù)的同一性,可以應(yīng)用等值理論,通過(guò)對(duì)數(shù)據(jù)屬性的等價(jià)關(guān)系來(lái)進(jìn)行同一性的描述,以保障大數(shù)據(jù)的可用性。
二十一世紀(jì)是一個(gè)信息化時(shí)代,信息技術(shù)日新月異,受到人們的不斷追捧。在制定大數(shù)據(jù)可用性的相關(guān)內(nèi)容之后,我們發(fā)現(xiàn)企業(yè)的相關(guān)研究的內(nèi)容也隨之?dāng)U展,大數(shù)據(jù)的應(yīng)用效果則受到充分的關(guān)注,以求取得一定的突破,提高我國(guó)國(guó)計(jì)民生質(zhì)量,加強(qiáng)社會(huì)和諧建設(shè)的發(fā)展,從而促進(jìn)大數(shù)據(jù)的可持續(xù)發(fā)展。在大數(shù)據(jù)系統(tǒng)的研究發(fā)展過(guò)程中,應(yīng)當(dāng)重視對(duì)大數(shù)據(jù)的應(yīng)用,充分發(fā)揮大數(shù)據(jù)的可用性,提高大數(shù)據(jù)在社會(huì)各領(lǐng)域中的有效作用,從而保障大數(shù)據(jù)可用性的有效應(yīng)用,推動(dòng)大數(shù)據(jù)研究工作健康而穩(wěn)定的發(fā)展。
[1]李建中,劉顯敏.大數(shù)據(jù)的一個(gè)重要方面:數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013(06):1147-1162.
[2]王玲,楊巍.互聯(lián)網(wǎng)大數(shù)據(jù)可用性增長(zhǎng)方式研究[J].國(guó)防科技,2013(06):52-55.
[3]孫立,楊軍,潘坤友.基于大數(shù)據(jù)可用性的政府統(tǒng)計(jì)策略研究[J].科技管理研究,2014(19):35-37.
[4]張?zhí)m廷.大數(shù)據(jù)的社會(huì)價(jià)值與戰(zhàn)略選擇[D].中共中央黨校,2014.