史瑩
春回大地,中央網(wǎng)信辦、國家發(fā)改委、工業(yè)和資訊化部聯(lián)合印發(fā)《公共資訊資源開放試點工作方案》,確定在北京、上海、浙江、福建、貴州5省份開展公共資訊資源開放試點。
上述方案要求,試點地區(qū)要結(jié)合實際抓緊制定具體實施方案,明確試點範圍,細化任務(wù)措施,積極認真有序開展相關(guān)工作,著力提高開放數(shù)據(jù)品質(zhì)、促進社會化利用,探索建立制度規(guī)範,於2018年底前完成試點各項任務(wù)。
數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素
2018年,隨著8大國家大數(shù)據(jù)綜合實驗區(qū)建設(shè)不斷加快,產(chǎn)業(yè)發(fā)展將推動形成特色領(lǐng)域。圍繞京津冀和珠三角跨區(qū)域類綜合試驗區(qū),將更加注重數(shù)據(jù)要素流通,以數(shù)據(jù)流引領(lǐng)技術(shù)流、物質(zhì)流、資金流、人才流,支撐跨區(qū)域公共服務(wù)、社會治理和產(chǎn)業(yè)轉(zhuǎn)移,促進區(qū)域一體化發(fā)展;圍繞上海、重慶、河南和瀋陽四大區(qū)域示範類綜合試驗區(qū),將更加注重數(shù)據(jù)資源統(tǒng)籌,加強大數(shù)據(jù)產(chǎn)業(yè)集聚,發(fā)揮輻射帶動作用,促進區(qū)域協(xié)同發(fā)展,實現(xiàn)經(jīng)濟提質(zhì)增效;圍繞內(nèi)蒙古基礎(chǔ)設(shè)施統(tǒng)籌發(fā)展類綜合試驗區(qū),將在充分發(fā)揮區(qū)域能源、氣候、地質(zhì)等條件基礎(chǔ)上,加大資源整合力度,強化綠色集約發(fā)展,加強與東、中部產(chǎn)業(yè)、人才、應(yīng)用優(yōu)勢地區(qū)合作,實現(xiàn)跨越發(fā)展。此外,結(jié)合地方產(chǎn)業(yè)發(fā)展和應(yīng)用特色,大數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)和大數(shù)據(jù)新型工業(yè)化產(chǎn)業(yè)示範基地建設(shè)也將持續(xù)推進。
權(quán)威數(shù)據(jù)顯示,預(yù)計2020年,中國大數(shù)據(jù)市場規(guī)模將超過8000億元(人民幣,下同),未來中國將成為全球數(shù)據(jù)中心。IT技術(shù)的持續(xù)創(chuàng)新促使大數(shù)據(jù)時代加速到來,在此大背景下,數(shù)據(jù)成為關(guān)鍵的生產(chǎn)要素,預(yù)計到2020年,全球的數(shù)據(jù)總量將達到40ZB,中國的數(shù)據(jù)量將占全球數(shù)據(jù)總量的20%,成為世界第一大數(shù)據(jù)資源大國。
目前,中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)日趨完善,大數(shù)據(jù)技術(shù)、交易、開放共用、工業(yè)大數(shù)據(jù)等產(chǎn)業(yè)鏈縱向發(fā)展逐步延伸;重點區(qū)域產(chǎn)業(yè)佈局有效推進。在行業(yè)應(yīng)用中,預(yù)計到2020年,工業(yè)大數(shù)據(jù)的占比將達到6.64%。中國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展呈現(xiàn)出政府與企業(yè)聯(lián)動的態(tài)勢,近幾年國內(nèi)培育出了一批大數(shù)據(jù)創(chuàng)新企業(yè),發(fā)展勢頭良好。
在美國納斯達克上市的中國第一家大數(shù)據(jù)公司——國雙公司財報顯示,其淨收入增速是行業(yè)平均水準的2倍,預(yù)計2018年營收將達10億元。
國雙迄今不僅為包括中國政府網(wǎng)、國家發(fā)改委、農(nóng)業(yè)部、北京市等在內(nèi)的3000多家政府網(wǎng)站提供大數(shù)據(jù)分析服務(wù),還為國家發(fā)改委、國家林業(yè)局、稅務(wù)總局等眾多單位提供政策大數(shù)據(jù)互聯(lián)網(wǎng)分析服務(wù),同時也為旅遊、政府招商引資、地方產(chǎn)業(yè)促進、電子政務(wù)等垂直領(lǐng)域提供大數(shù)據(jù)整體解決方案。
「在新媒體領(lǐng)域,主要針對傳統(tǒng)廣電系統(tǒng)新媒體轉(zhuǎn)型、三網(wǎng)融合、三屏互動的需求,提供融合媒體大數(shù)據(jù)解決方案,為新媒體運營與運維、節(jié)目創(chuàng)新、全媒體收視考核及領(lǐng)導(dǎo)決策提供即時的全媒體數(shù)據(jù)支持。」國雙公司有關(guān)負責人表示。
四大難題亟待破解
2017年,菜鳥和順豐的「數(shù)據(jù)斷交」事件,暴露出大數(shù)據(jù)發(fā)展中的數(shù)據(jù)共用難題。當前,中國大數(shù)據(jù)產(chǎn)業(yè)正在從起步階段步入黃金期,數(shù)據(jù)開放度低、技術(shù)薄弱、人才缺失、行業(yè)應(yīng)用不深入等都成為產(chǎn)業(yè)發(fā)展中亟待解決的問題。
首先資訊數(shù)據(jù)資源80%以上掌握在各級政府部門手中。據(jù)貴州省大數(shù)據(jù)發(fā)展管理局相關(guān)負責人介紹,部分政府部門在數(shù)據(jù)收集的過程中,由於缺乏統(tǒng)一的標準,收集到的數(shù)據(jù)雖然量大,但品質(zhì)不高,可利用價值低。據(jù)此前媒體報導(dǎo),長江上游地區(qū)一些省份的交通管理部門、運輸公司不願與其他省市共用物流資訊,造成聯(lián)運銜接的資訊壁壘,甚至出現(xiàn)了同樣1噸貨,一百公里公路運費比經(jīng)濟發(fā)達地區(qū)高60元的現(xiàn)象。
據(jù)了解,截至2016年底,廣東省全省87個省直部門有6988類數(shù)據(jù)資源、62332個數(shù)據(jù)項,居全大陸各省(區(qū)、市)首位。但各部門提出的共用需求僅3649類,省級編目共用僅477類,數(shù)據(jù)難以真正發(fā)揮利民惠民、支撐政府決策的作用。
此外,儘管部分數(shù)據(jù)已接入共用開放平臺,但由於不能被機器讀取,成為無法釋放應(yīng)有活力的「休眠數(shù)據(jù)」。
其二是技術(shù)創(chuàng)新滯後。中國大陸大數(shù)據(jù)產(chǎn)業(yè)雖然與國際大數(shù)據(jù)發(fā)展幾近步伐相同,但是仍然存在技術(shù)及應(yīng)用滯後的差距,在新型計算平臺、分佈式計算架構(gòu)、大數(shù)據(jù)處理、分析和呈現(xiàn)方面與國外仍存在較大差距,對開源技術(shù)和相關(guān)生態(tài)系統(tǒng)影響力弱。市場上,由於大陸本土大數(shù)據(jù)企業(yè)技術(shù)上的不足,用戶更加青睞Google、IBM、Oracle、SAP等國外IT企業(yè)。
微軟大中華區(qū)董事長兼CEO柯睿傑認為,數(shù)據(jù)智能並非那麼觸手可及。大數(shù)據(jù)來源眾多、數(shù)量巨大、形式各異,要從中獲得一目了然的資訊,就需要真正高效、可靠的數(shù)據(jù)管理和分析平臺。
如何處理巨量數(shù)據(jù)是中國大數(shù)據(jù)產(chǎn)業(yè)面臨的首要技術(shù)問題。鄂維南表示,「中國的數(shù)據(jù)體量特別大,比如,中國的視頻比任何國家都要多,這些數(shù)據(jù)儲存困難,需要用的時候往往就沒了」。再以基因測序領(lǐng)域為例,中國每年新增的基因組測序原始數(shù)據(jù)超過20PB(1PB相當於100萬GB),面臨數(shù)據(jù)量大、數(shù)據(jù)處理流程長等技術(shù)挑戰(zhàn)。
目前,中國大數(shù)據(jù)技術(shù)創(chuàng)新能力還有待提升?!洞髷?shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016~2020年)》指出,中國在新型計算平臺、分佈式計算架構(gòu)、大數(shù)據(jù)處理、分析和呈現(xiàn)方面與國外仍存在較大差距,對開源技術(shù)和相關(guān)生態(tài)系統(tǒng)影響力弱。同時,大數(shù)據(jù)應(yīng)用水準不高。中國發(fā)展大數(shù)據(jù)具有強勁的應(yīng)用市場優(yōu)勢,但是目前還存在應(yīng)用領(lǐng)域不廣泛、應(yīng)用程度不深、認識不到位等問題。
「中國大數(shù)據(jù)在底層技術(shù)上和國外差距特別大,技術(shù)都來源於穀歌等國外大公司?!箛鴦?wù)院發(fā)展研究中心資訊中心研究處處長李廣乾說,很多時候我們的商業(yè)模式走在了技術(shù)前面,但並沒有通過技術(shù)手段來推動創(chuàng)新。
第三是人才不足限制了大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新發(fā)展的成效。清華大學電腦系教授武永衛(wèi)透露的數(shù)據(jù)顯示,未來3至5年,中國需要180萬數(shù)據(jù)人才,但截至目前,中國大數(shù)據(jù)從業(yè)人員只有約30萬人。
同時,大數(shù)據(jù)行業(yè)選才的標準也在不斷變化。初期,大數(shù)據(jù)人才的需求主要集中在ETL研發(fā)、系統(tǒng)架構(gòu)開發(fā)、數(shù)據(jù)倉庫研究等偏硬體領(lǐng)域,以IT、電腦背景的人才居多。隨著大數(shù)據(jù)往各垂直領(lǐng)域延伸發(fā)展,對統(tǒng)計學、數(shù)學專業(yè)的人才,數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智慧等偏軟體領(lǐng)域的需求加大。
其四,行業(yè)應(yīng)用不深入。賽迪顧問股份有限公司大數(shù)據(jù)產(chǎn)業(yè)研究中心提供的數(shù)據(jù)顯示,互聯(lián)網(wǎng)、金融和電信三大領(lǐng)域的大數(shù)據(jù)應(yīng)用在各行業(yè)總規(guī)模中所占比重超過70%;健康醫(yī)療領(lǐng)域和交通領(lǐng)域近年不斷「上架」新應(yīng)用,但行業(yè)規(guī)模占比相對較??;而在其他眾多民生領(lǐng)域,大數(shù)據(jù)應(yīng)用仍處於淺層次資訊化層面,行業(yè)發(fā)展水準參差不齊。
「目前,大數(shù)據(jù)在多個行業(yè)尚未與業(yè)務(wù)實現(xiàn)深度融合,應(yīng)用場景創(chuàng)新不足,大數(shù)據(jù)技術(shù)人員需要提升行業(yè)業(yè)務(wù)知識和經(jīng)驗?!拱俜贮c首席數(shù)據(jù)科學家杜曉夢表示,國內(nèi)很多行業(yè)仍僅在局部業(yè)務(wù)上使用大數(shù)據(jù)技術(shù),僅掌握數(shù)據(jù)挖掘和分析技術(shù),如不能將技術(shù)與業(yè)務(wù)全面、深度地融合,則無法完全發(fā)掘出數(shù)據(jù)應(yīng)用的真正價值。