蔣潔
摘 要:立足廣域共享信息資源池和聚匯機(jī)器學(xué)習(xí)算法的實(shí)時且廉價的可視化數(shù)據(jù)探勘在充分展現(xiàn)出深度發(fā)掘數(shù)據(jù)資產(chǎn)價值剩余、創(chuàng)新優(yōu)化公共服務(wù)能力、有序增進(jìn)社交福祉等強(qiáng)勁實(shí)力的同時,逐漸暴露出直觀探勘干擾自由表達(dá)、智數(shù)決策破壞平等格局、數(shù)據(jù)鴻溝擾亂競爭秩序等嚴(yán)重背離基本人權(quán)與經(jīng)濟(jì)目標(biāo)的道德風(fēng)險。亟待在弘揚(yáng)超越異質(zhì)群體不同訴求的共在、共生、共享、共榮之共同道德精神的基礎(chǔ)上,全面執(zhí)行安全、自主、適應(yīng)性和利益協(xié)調(diào)等具體道德規(guī)訓(xùn)。
關(guān)鍵詞:大數(shù)據(jù);復(fù)雜數(shù)據(jù)探勘;道德風(fēng)險;共同道德精神;道德規(guī)訓(xùn)
中圖分類號: G203 文獻(xiàn)標(biāo)識碼: A DOI:10.11968/tsyqb.1003-6938.2016114
Abstract When the real-time, low-priced, and visual data are discovered through sharing information resource pool over the wide area, converging machine learning algorithms efficiently reveals powerful strengths like deep mining of the surplus value of data assets, and innovation and improvement of public service capacity makes ordered enhancement of social well-being possible, moral hazards which seriously deviate basic human rights and economic goals are gradually exposed, for instance, intuitive mining interferes free expression, intellectual data decision-making breaks equal structure, and digital divide disturbs competition orders. The solutions to these burning problems lies in the promotion of common moral spirits which is symbiotic, co-existing, shared and co-prosperous to advance the different demand of heterogeneous group. Specific moral disciplines like safety, independence, adaptation, coordination of interests ought to be fully implemented, in order to help the leap development of singularity era.
Key words big data; multiple data discovery; moral hazards; common moral spirits; moral disciplines
1 引言
IT4.0時代,海量數(shù)據(jù)與創(chuàng)新技術(shù)逐漸構(gòu)成人類生存的整體環(huán)境背景,同時,隨著具有語義特征的智數(shù)基礎(chǔ)設(shè)施、并發(fā)采集工具、分布式存儲集群及計(jì)算能力的指數(shù)級攀升,旨在促使數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)選擇、數(shù)據(jù)流轉(zhuǎn)、數(shù)據(jù)挖掘、型式評價等流程日漸澄明,而及時且直觀的復(fù)雜數(shù)據(jù)探勘通過深入揭露事物本質(zhì)特征和內(nèi)在規(guī)律,改善人類族群的思維邏輯與行為模式,助力數(shù)據(jù)引領(lǐng)的爆發(fā)式經(jīng)濟(jì)增長迅速走出混沌無序的狀態(tài),驅(qū)動著整個社會的多棲化自由發(fā)展。復(fù)雜數(shù)據(jù)探勘不僅可以筑造出可供任意需求者(如政府部門、企事業(yè)單位、其他組織和強(qiáng)勢個人)自主挖掘海量數(shù)據(jù)的簡便通路,亦在一定程度上加深了這些探勘主體與原初數(shù)據(jù)權(quán)利人之間資源占有和技術(shù)認(rèn)知的巨大鴻溝。面對數(shù)字經(jīng)濟(jì)的歷史性機(jī)遇,缺乏法律規(guī)制、政策調(diào)控、輿論干預(yù)與信念影響的惡意探勘者通過輸入巨量冗余數(shù)據(jù)、搭建錯漏頻現(xiàn)的集成模型、超界域深度挖掘敏感關(guān)聯(lián)、悄然獨(dú)占數(shù)據(jù)資產(chǎn)價值增幅以及篡改探勘結(jié)果等牟取短線暴利,頻頻引發(fā)了評估失真與預(yù)測偏差,甚至動搖了多元利益群體之間脆弱的動態(tài)平衡。
人類活動的價值基礎(chǔ)和生命意義的判斷標(biāo)尺是道德良善。以道德敗壞為代價的技術(shù)勝利只能使得個人愈益成為別人的奴隸或自身卑劣行為的奴隸[1]。充分發(fā)揮復(fù)雜數(shù)據(jù)探勘推動不同產(chǎn)業(yè)融合創(chuàng)新、助力供給側(cè)結(jié)構(gòu)性改革等正向效應(yīng)亟待建立以公正、平等、效率、互利等為核心的道德規(guī)訓(xùn)機(jī)制,全局閉環(huán)導(dǎo)控直觀可視的海量數(shù)據(jù)存儲、流轉(zhuǎn)與分析過程,有序平衡政治、社會和精神力量,聯(lián)動增進(jìn)全人類福祉。
2 復(fù)雜數(shù)據(jù)探勘概述及分析
復(fù)雜數(shù)據(jù)探勘(Multiple Data Discovery)特指大數(shù)據(jù)時代基于人工智能技術(shù)開發(fā)的創(chuàng)新型數(shù)據(jù)處理平臺中技術(shù)實(shí)力薄弱的泛在探勘主體自助采集、傳輸與分析海量數(shù)據(jù)的直觀流程,具有廉價、簡單(無需編碼)、實(shí)時(數(shù)分鐘內(nèi)完成建模并隨數(shù)據(jù)更新自動運(yùn)轉(zhuǎn))、直觀(可視化透明處理)等特征[2]。如多摩平臺(Domo)從廣大探勘主體正在使用的多元數(shù)據(jù)資源池中直接調(diào)用零散信息并以可視化方式實(shí)時展現(xiàn)濃縮和提煉的挖掘結(jié)果[3]。
復(fù)雜數(shù)據(jù)探勘大幅降低深度挖掘的準(zhǔn)入門檻,有力提升以中小企業(yè)為代表的弱勢探勘需求群體的社會競爭力。近年來,巨量數(shù)據(jù)資產(chǎn)滿溢的潛在價值促使眾多逐利主體通過積極挖掘以前因?yàn)榭萍妓薅雎缘馁Y料,構(gòu)筑嶄新的數(shù)據(jù)引導(dǎo)決策的高效運(yùn)營模式。如亞馬遜公司(Amazon)通過集中分析140萬臺服務(wù)器上10億GB數(shù)據(jù)優(yōu)化供應(yīng)鏈和動態(tài)價格,以提供卓越的個性化購物體驗(yàn),促進(jìn)總銷量和平均盈利增長[4];又如,領(lǐng)英網(wǎng)(LinkedIn)基于高量級、高速率與高辨識度的數(shù)據(jù)挖掘形成推薦列表,提升了職業(yè)雙選滿意度[5];再如,捷孚凱市場研究集團(tuán)(GFK)通過挖掘海量高附加值調(diào)查數(shù)據(jù)及其關(guān)聯(lián)資訊,較為精準(zhǔn)及時地披露受試者的掩飾傾向[6]。然而,這些傳統(tǒng)的深度挖掘模型較高的物理設(shè)施要求與高新技術(shù)障礙等迫使探勘需求者投入大量成本購置基礎(chǔ)設(shè)備并培育和雇傭眾多數(shù)據(jù)專家。復(fù)雜數(shù)據(jù)探勘雖然“沒有完美無缺的內(nèi)部架構(gòu),卻具備簡明、便捷和廉價的優(yōu)勢”[7],確保任一需求者均有能力自主參與多元共治的數(shù)據(jù)資源流轉(zhuǎn),通過實(shí)時關(guān)聯(lián)決策從消費(fèi)源頭重識產(chǎn)品價值、從個人終端完善知識共享[8],推動去中心化的泛化社交平臺逐步替代傳統(tǒng)交互場域[9],引領(lǐng)所有社會領(lǐng)域的革命。如“點(diǎn)對點(diǎn)”的全景億圖系統(tǒng)(Panorama Necto)通過“比Excel更直觀的界面、比Tableau更強(qiáng)的分析能力、比SaS更簡單的操作”[10],為廣大探勘需求者提供動態(tài)自主完成數(shù)據(jù)存儲、挖掘并生成分析報(bào)告的“所見即所得”的自助平臺,促進(jìn)整個市場的公平競爭與有序發(fā)展。
同時,復(fù)雜數(shù)據(jù)探勘避免了委付數(shù)據(jù)引發(fā)的諸多風(fēng)險。高度專業(yè)化的舊式數(shù)據(jù)挖掘迫使無力自建平臺的探勘需求者(如中小企業(yè))冒著泄露、損毀商業(yè)機(jī)密或客戶數(shù)據(jù)的巨大風(fēng)險委托第三方進(jìn)行深度挖掘。受托者卻不可能完全了解委托人的運(yùn)營細(xì)節(jié)和具體市場狀況,常常在算法選擇與模型建構(gòu)上出現(xiàn)錯漏偏失,導(dǎo)致挖掘結(jié)果失真無效,甚至產(chǎn)生較為惡劣的負(fù)面影響。如基于Facebook巨量運(yùn)作數(shù)據(jù)挖掘的精準(zhǔn)廣告投放不斷暴露的實(shí)效偏差迫使全球最大的廣告主寶潔公司(Procter & Gamble)大比例削減精投費(fèi)用,迅速回轉(zhuǎn)傳統(tǒng)營銷平臺[11]。復(fù)雜數(shù)據(jù)探勘為廣大弱勢需求者提供了安全低耗、直觀廉價地自主點(diǎn)亮暗數(shù)據(jù)(Dark Data)的最優(yōu)選擇,正在改變包括天睿(Teradata)、維提卡(Vertica)、哈道普(Hadoop)等在內(nèi)的晦澀深奧的二進(jìn)制運(yùn)作機(jī)體壟斷挖掘市場的局面。
3 復(fù)雜數(shù)據(jù)探勘的道德風(fēng)險
復(fù)雜數(shù)據(jù)探勘技術(shù)與平臺的出現(xiàn),一方面是以梅爾數(shù)據(jù)(Datameer)[12]為代表的“傻瓜式”復(fù)雜數(shù)據(jù)探勘系統(tǒng)廣泛應(yīng)用于政府部門、企事業(yè)單位乃至個人用戶的靶向研發(fā)、精益生產(chǎn)、精準(zhǔn)營銷、個性教學(xué)以及普惠金融等,在一定程度上突破了探勘需求者的技術(shù)局限,填補(bǔ)了專業(yè)數(shù)據(jù)處理機(jī)構(gòu)、數(shù)據(jù)工程師與探勘需求者之間的實(shí)力差距,減輕近乎固化的“自然的或生理上的不平等”以及“精神上的或政治上的不平等”[13],迅速獲得大眾信賴和推崇;另一方面是“基于信息技術(shù)無限擴(kuò)容的數(shù)據(jù)藍(lán)海”[14]的復(fù)雜數(shù)據(jù)探勘私密化的可視化運(yùn)作方式無形之中加深了熟悉對象數(shù)據(jù)內(nèi)涵與關(guān)聯(lián)價值的廣大探勘需求者與原初數(shù)據(jù)權(quán)利人之間的能力鴻溝。道德規(guī)則認(rèn)知有限或自信有能力規(guī)避的需求者為了“多快好省”地“追求眼前短暫的利益”[15],通過違反了自主、公平、不傷害等基本道德要求的自主探勘侵害合法的數(shù)據(jù)權(quán)益,導(dǎo)致原初數(shù)據(jù)權(quán)利人長期處于邊緣化的社會失語狀態(tài)[16]。缺乏道德規(guī)制的直觀探勘情境正在轉(zhuǎn)變?yōu)槭挛锱卸ǖ奈ㄒ粯?biāo)識,日漸引發(fā)不確定、不可靠且有失公允的唯數(shù)主義和數(shù)據(jù)獨(dú)裁,有可能逐步將整個社會推向失控和崩潰的異化邊緣。如應(yīng)用復(fù)雜數(shù)據(jù)探勘的醫(yī)藥企業(yè)和保健機(jī)構(gòu)可以通過直觀的動態(tài)圖表實(shí)時地自如掌控和自主分析成分混雜的多元數(shù)據(jù)資源池集聚信息,導(dǎo)致相關(guān)違法違規(guī)事件的曝光、取證、追責(zé)和救濟(jì)難度幾何乘數(shù)增加[17]。
3.1 直觀探勘干擾自由表達(dá)
數(shù)據(jù)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,我們每個人隨時都在成為大數(shù)據(jù)源端[18],廣大掌握海量原初數(shù)據(jù)的政府機(jī)關(guān)、企事業(yè)單位和強(qiáng)勢個人通過融會貫通新一代信息技術(shù)的復(fù)雜數(shù)據(jù)探勘廉價、直觀且實(shí)時地自主使用元數(shù)據(jù)負(fù)載設(shè)備、聚合集成控制平臺、動態(tài)分割管理布局以及廣域挖掘架構(gòu)等,在未獲原初數(shù)據(jù)權(quán)利人明示同意的情況下肆意采集、闡釋與識別顆粒數(shù)據(jù)變化趨勢。如用于健康醫(yī)療的全景億圖系統(tǒng)助力醫(yī)療機(jī)構(gòu)通過低成本地自行悄然廣域挖掘病案地理位置信息和關(guān)聯(lián)內(nèi)容分享信息,具體識別特定的醫(yī)生、護(hù)士、患者及其家屬等相關(guān)主體并評估預(yù)測其行為模式與趨勢,進(jìn)而成為確定本單位資源補(bǔ)給、價格定位、服務(wù)標(biāo)準(zhǔn)與技術(shù)投入的核心依據(jù)[19]。此類探勘需求者通過廉價、便捷、直觀且實(shí)時的復(fù)雜數(shù)據(jù)探勘系統(tǒng),搭建最優(yōu)化控制成本與提升質(zhì)量的預(yù)測預(yù)警模型,嚴(yán)重侵害了原初數(shù)據(jù)合法持有者的知情權(quán)與自主選擇權(quán),違背了遵循誠信與尊重自由等道德要求。
3.2 智數(shù)決策破壞平等格局
場景時代作為現(xiàn)狀評估與趨勢預(yù)測新標(biāo)尺的易操作的復(fù)雜數(shù)據(jù)探勘為每一個需要數(shù)據(jù)處理的社會主體提供了獨(dú)立、低價、便捷且私密地完成海量數(shù)據(jù)存儲、流轉(zhuǎn)與分析的全新途徑,逐步擴(kuò)展應(yīng)用于勸服、調(diào)整與控制決策領(lǐng)域,切實(shí)提升眾多探勘需求者的洞察力與戰(zhàn)略遠(yuǎn)見,推動產(chǎn)業(yè)轉(zhuǎn)型升級和經(jīng)濟(jì)快速發(fā)展。如眾多科研院所和醫(yī)藥企業(yè)通過共鏈生物銀行(Colink Biotics)進(jìn)行基因數(shù)據(jù)自主探勘,較為準(zhǔn)確地實(shí)時預(yù)測客戶巨量基因數(shù)據(jù)中隱藏的絕癥發(fā)病率[20],相應(yīng)的精準(zhǔn)用藥自動化探勘機(jī)制更是將文明社會的醫(yī)療水平提升到嶄新的高度[21]。包括梅爾數(shù)據(jù)、全景億圖等在內(nèi)的可視化復(fù)雜數(shù)據(jù)探勘平臺使得掌握定量數(shù)據(jù)的機(jī)構(gòu)和個人有能力自行完成數(shù)據(jù)處理并持續(xù)推送精準(zhǔn)量化分析結(jié)果,在一定程度上導(dǎo)致全社會范圍內(nèi)的個人奮斗、企業(yè)選擇、社會服務(wù)和政府管理等異化為固態(tài)計(jì)算程式。相關(guān)價值博弈帶來的負(fù)面效應(yīng)和惡劣后果則進(jìn)一步加劇人性蛻化和創(chuàng)新危機(jī),破壞整個社會的平等格局。如不同規(guī)模的企業(yè)只要耗費(fèi)少量成本就可以在“正確”時間以“正確”形式即時地可視化私密探勘“正確”數(shù)據(jù)引領(lǐng)的長期決策往往侵害平等用工權(quán)或公平交易權(quán)等[22]。又如,掌握大量適齡男女等信息的婚介公司通過操作簡單的可視化復(fù)雜數(shù)據(jù)探勘勾勒的看似理性的配對決策模型試圖將人類情感作為技術(shù)干預(yù)的工具和對象,可能造成嚴(yán)重的心理失衡和人格障礙[23]。將之拓展為全方位優(yōu)婚、優(yōu)育、優(yōu)養(yǎng)的精密探勘計(jì)劃更是肆意侵害了獨(dú)立個體的尊嚴(yán)和權(quán)利,違背“己所不欲,勿施于人”的道德準(zhǔn)則,破壞現(xiàn)代社會引以為傲的平等人際關(guān)系,背離了實(shí)現(xiàn)“兼收并蓄、取長補(bǔ)短、相互容忍、和平共存的人類共同文明”[24]之道德初衷。
3.3 數(shù)據(jù)鴻溝擾亂競爭秩序
復(fù)雜數(shù)據(jù)探勘可視化集聚了廣域深層離散數(shù)據(jù),在一定程度上消減了數(shù)據(jù)資源共享中的信息孤島現(xiàn)象,逐漸展現(xiàn)出“讓一切改頭換面”[25]的顛覆性價值。龐大的政府部門、企事業(yè)單位和個人用戶群通過獨(dú)立自主地開展復(fù)雜數(shù)據(jù)探勘,積極掌握數(shù)據(jù)處理主動權(quán)并占據(jù)發(fā)展制高點(diǎn)[26]。復(fù)雜數(shù)據(jù)探勘助力構(gòu)建“跨行業(yè)、跨部門、跨區(qū)域”的電子政務(wù)智慧管理體系[27];高效且代價合理地優(yōu)化個性化動態(tài)競爭情報(bào)生態(tài)鏈,顛覆地區(qū)封鎖和行業(yè)壟斷[28];真正實(shí)現(xiàn)社會零庫存,改善綜合實(shí)力薄弱中小企業(yè)的前途和命運(yùn)[29]。然而,極簡探勘模式大幅降低了數(shù)據(jù)存儲、流轉(zhuǎn)與分析成本,使得眾多探勘需求者之間的競爭演變?yōu)閺氐椎脑鯏?shù)據(jù)量額和質(zhì)比紛爭。探勘主體出于短期利益需求與長遠(yuǎn)發(fā)展考慮,在數(shù)據(jù)采集、存儲和綜合挖掘中設(shè)置長效割裂原初數(shù)據(jù)橫向轉(zhuǎn)移與縱向傳承的諸多障礙,通過廉價拋售交叉聚探的數(shù)據(jù)變量交互關(guān)系釋放盈利潛能,動態(tài)阻擋創(chuàng)新力量參與行業(yè)競爭[30]。物理世界與數(shù)字世界匯聚進(jìn)程中日漸擴(kuò)大的數(shù)據(jù)鴻溝導(dǎo)致部分新生業(yè)態(tài)陷入難以洞悉周邊態(tài)勢的信息失衡困境,打破有序競爭的良好愿景,嚴(yán)重違背不傷害的基本道德準(zhǔn)則。