景濤
摘要:本文研究構(gòu)建多媒體大數(shù)據(jù)隱私保護(hù)和安全共享平臺(tái),旨在保障多媒體大數(shù)據(jù)的安全性和隱私性,提高數(shù)據(jù)共享的效率和質(zhì)量。以多媒體大數(shù)據(jù)應(yīng)用的金融場(chǎng)景為例,構(gòu)建如實(shí)還原金融機(jī)構(gòu)生產(chǎn)場(chǎng)景的驗(yàn)證環(huán)境,統(tǒng)籌解決多媒體數(shù)據(jù)分域或邏輯隔離存儲(chǔ)問題。本文的研究成果對(duì)于多媒體數(shù)據(jù)隱私保護(hù)和安全共享具有重要的意義。該平臺(tái)的提出不僅可以保護(hù)個(gè)人隱私,還能夠促進(jìn)多媒體數(shù)據(jù)的有效利用和社會(huì)共享。同時(shí),該研究也為相關(guān)領(lǐng)域的研究提供了新的思路和方法,有助于推動(dòng)多媒體大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用。
關(guān)鍵詞:多媒體大數(shù)據(jù);隱私查詢;隱私保護(hù);安全共享
引言
隨著大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和廣泛應(yīng)用,多媒體大數(shù)據(jù)已經(jīng)成為人們?nèi)粘I詈凸ぷ髦械闹匾畔碓矗嗝襟w數(shù)據(jù)逐漸成為推動(dòng)社會(huì)市場(chǎng)經(jīng)濟(jì)發(fā)展的中堅(jiān)力量,但在網(wǎng)絡(luò)安全層面,大數(shù)據(jù)技術(shù)卻成為個(gè)人隱私和企業(yè)隱私泄露的“隱患”,數(shù)據(jù)隱私保護(hù)和安全共享的問題也日益突出。因此,研究多媒體大數(shù)據(jù)隱私保護(hù)與安全共享平臺(tái)具有重要的現(xiàn)實(shí)意義和社會(huì)價(jià)值。如何在滿足數(shù)據(jù)安全和隱私保護(hù)的同時(shí),實(shí)現(xiàn)數(shù)據(jù)的流動(dòng)和價(jià)值的最大化、最優(yōu)化,成為“數(shù)據(jù)控制者”或“數(shù)據(jù)處理者”的普遍訴求。
1. 研究背景
隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)技術(shù)已經(jīng)被廣泛應(yīng)用于金融、能源、醫(yī)療、交通等領(lǐng)域,在應(yīng)用高速發(fā)展的同時(shí),數(shù)據(jù)安全和隱私邊界也愈加重要?,F(xiàn)有的隱私保護(hù)技術(shù)還不能完全滿足多媒體大數(shù)據(jù)的特點(diǎn)和需求,存在隱私泄露的風(fēng)險(xiǎn)。目前,多媒體大數(shù)據(jù)處理和分析技術(shù)還比較煩瑣和復(fù)雜,需要耗費(fèi)大量的人力和時(shí)間成本。在大數(shù)據(jù)訪問控制中,涉及數(shù)據(jù)的采集、傳輸、存儲(chǔ)、處理等一系列行為,針對(duì)視頻、圖像、語音、文本等多媒體大數(shù)據(jù)的隱私保護(hù)差異化、隱私共享多級(jí)訪問控制、隱私保護(hù)加密算法等問題,本研究面向多媒體大數(shù)據(jù)的隱私保護(hù)與安全模型,建立多媒體大數(shù)據(jù)共享隱私動(dòng)態(tài)保護(hù)機(jī)制。
2. 研究?jī)?nèi)容
為解決多媒體大數(shù)據(jù)處理過程中存在的隱私內(nèi)容多樣化、隱私屬性動(dòng)態(tài)量化難、多因素關(guān)聯(lián)的隱私內(nèi)容價(jià)值與泄露風(fēng)險(xiǎn)動(dòng)態(tài)評(píng)估手段缺乏、延伸控制弱化等問題,需要研發(fā)適用于多媒體大數(shù)據(jù)的隱私保護(hù)技術(shù)和安全共享機(jī)制,保障數(shù)據(jù)的安全性和隱私性。本文以金融行業(yè)數(shù)據(jù)安全管理為例,在多媒體大數(shù)據(jù)隱私內(nèi)容檢測(cè)、分級(jí)保護(hù)和安全共享平臺(tái)研究方面,在金融保險(xiǎn)機(jī)構(gòu)示范應(yīng)用并建設(shè)圖像、語音數(shù)據(jù)集。針對(duì)涉及多媒體應(yīng)用的不同金融場(chǎng)景,搭建如實(shí)還原金融機(jī)構(gòu)生產(chǎn)場(chǎng)景的測(cè)試環(huán)境,平臺(tái)架構(gòu)如圖1所示。
系統(tǒng)架構(gòu):采用分層架構(gòu),分為基礎(chǔ)設(shè)施層、數(shù)據(jù)層、平臺(tái)層和應(yīng)用層。其中,基礎(chǔ)設(shè)施層負(fù)責(zé)多媒體大數(shù)據(jù)的存儲(chǔ)和管理,數(shù)據(jù)層和平臺(tái)層負(fù)責(zé)數(shù)據(jù)的分析和處理,應(yīng)用層負(fù)責(zé)提供用戶接口和服務(wù)支持。
功能模塊:包括數(shù)據(jù)處理、隱私保護(hù)、安全共享、數(shù)據(jù)檢索等功能模塊。其中,數(shù)據(jù)處理模塊負(fù)責(zé)對(duì)上傳的數(shù)據(jù)進(jìn)行預(yù)處理和分析,隱私保護(hù)模塊負(fù)責(zé)對(duì)敏感數(shù)據(jù)進(jìn)行加密和匿名化處理,安全共享模塊負(fù)責(zé)控制數(shù)據(jù)的訪問權(quán)限和共享范圍,數(shù)據(jù)檢索模塊負(fù)責(zé)根據(jù)用戶需求提供數(shù)據(jù)查詢和下載服務(wù)。
數(shù)據(jù)傳輸安全:采用加密技術(shù)和身份認(rèn)證技術(shù),確保數(shù)據(jù)在傳輸過程中的安全性和完整性。
2.1 可行性分析
多媒體數(shù)據(jù)容量大,格式復(fù)雜多樣,其加密算法設(shè)計(jì)需要考慮加密效率性和密文格式兼容性。為了提升加密效率,現(xiàn)有的多媒體數(shù)據(jù)加密算法大都選擇采用部分加密技術(shù),通過加密壓縮數(shù)據(jù)中的部分關(guān)鍵信息,以減少加密操作來降低加密算法的時(shí)間開銷?,F(xiàn)有的并行處理技術(shù)相對(duì)成熟,將大容量的多媒體數(shù)據(jù)進(jìn)行分塊,然后用并行加密處理,可進(jìn)一步提升大容量多媒體數(shù)據(jù)的加密速度。因此,輕量級(jí)的多媒體數(shù)據(jù)加密算法的設(shè)計(jì)與實(shí)現(xiàn)是具備可行性的。
針對(duì)多媒體隱私數(shù)據(jù)多源、多維、異構(gòu)特性時(shí)表現(xiàn)出通用性、完備性、一致性差,信息泄露風(fēng)險(xiǎn)高等問題,根據(jù)研究基礎(chǔ)分別定量和定性構(gòu)建安全評(píng)價(jià)標(biāo)準(zhǔn)。在定量安全評(píng)價(jià)標(biāo)準(zhǔn)中,通過特征處理技術(shù)對(duì)原始數(shù)據(jù)和加密數(shù)據(jù)進(jìn)行多分辨率表示,并提取視覺和聲譜圖的特征,最后對(duì)提取特征進(jìn)行相似性度量和加權(quán)融合,構(gòu)建定量安全評(píng)價(jià)標(biāo)準(zhǔn)。同樣地,在定性安全評(píng)價(jià)標(biāo)準(zhǔn)中,以自主研發(fā)的數(shù)據(jù)處理算法為基礎(chǔ),融合最先進(jìn)的深度學(xué)習(xí)思想,分別從圖像和音頻兩方面對(duì)隱私數(shù)據(jù)安全性進(jìn)行評(píng)估,并構(gòu)建多媒體大數(shù)據(jù)安全綜合評(píng)價(jià)系統(tǒng)。
多媒體大數(shù)據(jù)加密存儲(chǔ)平臺(tái)采用全新的硬件構(gòu)架和軟件算法,全方位地釋放NVME閃存顆粒的性能。在工程層面進(jìn)行大量?jī)?yōu)化,包括在數(shù)據(jù)的讀取、加密、傳輸、計(jì)算、解密、存儲(chǔ)等各個(gè)階段實(shí)現(xiàn)優(yōu)化,進(jìn)而將整體性能提升到最優(yōu)狀態(tài),以滿足高吞吐、低時(shí)延,以及特定場(chǎng)景的實(shí)時(shí)性要求。
2.2 先進(jìn)性分析
通過隱私保護(hù)與多媒體數(shù)據(jù)安全性技術(shù),對(duì)多媒體隱私數(shù)據(jù)內(nèi)容進(jìn)行分析,從技術(shù)路線和理論基礎(chǔ)兩方面構(gòu)建的多媒體大數(shù)據(jù)安全綜合評(píng)價(jià)系統(tǒng)均具有先進(jìn)性。
多媒體大數(shù)據(jù)加密存儲(chǔ)平臺(tái)具備自主可信根,從可信根到硬件平臺(tái),到操作系統(tǒng),再到應(yīng)用,在體系架構(gòu)上實(shí)現(xiàn)自主可控的防御機(jī)制,保證平臺(tái)系統(tǒng)的數(shù)據(jù)存儲(chǔ)安全、傳輸安全和計(jì)算安全。在硬件加速層面,通過新的密碼學(xué)技術(shù)和算法協(xié)議,結(jié)合硬件加速技術(shù)和專有算法實(shí)現(xiàn)算力加速,提升平臺(tái)整體算力性能。平臺(tái)在結(jié)構(gòu)化數(shù)據(jù)的加密存儲(chǔ)與隱私保護(hù)、傳輸過程去標(biāo)識(shí)化、匿蹤查詢以及底層硬件的算力和安全性支撐方面已有相對(duì)成熟的方法論,具有較好的先進(jìn)性。
3. 關(guān)鍵科學(xué)問題
多媒體大數(shù)據(jù)隱私保護(hù)與安全共享是信息社會(huì)的重要問題之一。在多媒體大數(shù)據(jù)的處理和共享過程中,涉及許多隱私和安全問題。本文以金融行業(yè)數(shù)據(jù)安全管理為例。
在金融數(shù)據(jù)安全管理方面,按照中國(guó)人民銀行發(fā)布的《金融數(shù)據(jù)安全 數(shù)據(jù)生命周期安全規(guī)范》(JR/T 0223-2021)金融行業(yè)標(biāo)準(zhǔn)要求,金融機(jī)構(gòu)“應(yīng)根據(jù)安全級(jí)別、重要性、量級(jí)、使用頻率等因素,將數(shù)據(jù)分域分級(jí)存儲(chǔ)”“脫敏后的數(shù)據(jù)應(yīng)與用于還原數(shù)據(jù)的恢復(fù)文件隔離存儲(chǔ),并留存相關(guān)審批及操作記錄”“3級(jí)數(shù)據(jù)的存儲(chǔ)應(yīng)采取加密等技術(shù)措施保證數(shù)據(jù)存儲(chǔ)的保密性”“4級(jí)及以上數(shù)據(jù)應(yīng)使用密碼算法加密存儲(chǔ)”[1]。
針對(duì)個(gè)人金融信息管理,中國(guó)人民銀行在遵循《個(gè)人信息保護(hù)法》基礎(chǔ)上,發(fā)布了《個(gè)人金融信息保護(hù)技術(shù)規(guī)范》(JR/T 0171—2020)金融行業(yè)標(biāo)準(zhǔn),根據(jù)信息遭到未經(jīng)授權(quán)的查看或未經(jīng)授權(quán)的變更后所產(chǎn)生的影響和危害,將個(gè)人金融信息按敏感程度從高到低分為C3、C2、C1三個(gè)類別[2]。
針對(duì)C2、C3類別信息,標(biāo)準(zhǔn)規(guī)定:“金融機(jī)構(gòu)應(yīng)使用加密通道或數(shù)據(jù)加密的方式進(jìn)行傳輸,保障個(gè)人金融信息傳輸過程的安全”“對(duì)于C3類別信息,通過受理終端、客戶端應(yīng)用軟件、瀏覽器等方式收集時(shí),應(yīng)采取加密等技術(shù)措施保證數(shù)據(jù)的保密性,防止其被未授權(quán)的第三方獲取”“C3類別個(gè)人金融信息應(yīng)采用加密措施確保數(shù)據(jù)存儲(chǔ)的保密性”“應(yīng)將去標(biāo)識(shí)化、匿名化后的數(shù)據(jù)與可用于恢復(fù)識(shí)別個(gè)人的信息采取邏輯隔離的方式進(jìn)行存儲(chǔ),確保去標(biāo)識(shí)化、匿名化后的信息與個(gè)人金融信息不被混用”“除銀行卡有效期外,C3類別信息不應(yīng)明文展示”。
金融機(jī)構(gòu)的多媒體信息主要是指?jìng)€(gè)人生物識(shí)別信息過程中產(chǎn)生的影像、圖片、聲紋等,其存儲(chǔ)方式大多是非結(jié)構(gòu)化的,且按要求均應(yīng)該使用密碼算法加密存儲(chǔ),采用加密通道或數(shù)據(jù)加密方式傳輸,采取去標(biāo)識(shí)化或匿名化手段展示,并與個(gè)人信息邏輯隔離存儲(chǔ)。金融保險(xiǎn)業(yè)務(wù)場(chǎng)景多媒體大數(shù)據(jù)中的隱私內(nèi)容精準(zhǔn)高效檢測(cè)和分級(jí)保護(hù),結(jié)合輕量化的多媒體數(shù)據(jù)加密算法,研究構(gòu)建高效安全的分布式存儲(chǔ)應(yīng)用系統(tǒng),實(shí)現(xiàn)多級(jí)用戶的差異化隱私保護(hù)需求和數(shù)據(jù)安全共享。
3.1 身份照片核驗(yàn)場(chǎng)景
隱私信息具體內(nèi)容涉及身份證照片、活體檢測(cè)時(shí)隨機(jī)抓取照片。身份照片核驗(yàn)如圖2所示,身份證照片會(huì)通過OCR抓取姓名、身份證號(hào)、有效期信息。因此有必要進(jìn)行隱私脫敏處理的圖片既包括身份證和活體照片中的人臉圖片信息,又包括身份證號(hào)、姓名等個(gè)人信息??蛻粼俅钨徺I保險(xiǎn)產(chǎn)品時(shí),會(huì)再次觸發(fā)活體認(rèn)證環(huán)節(jié),隨機(jī)抓取的圖片會(huì)與之前加密存儲(chǔ)的身份證照片、公安個(gè)人信息庫身份證照片做三方比對(duì)。
信息流方面,客戶手機(jī)端隨機(jī)抓取的照片,明文傳輸至保險(xiǎn)公司業(yè)務(wù)系統(tǒng)(已進(jìn)入公司信息管理安全域)。通過特征提取功能模塊對(duì)照片進(jìn)行特征值提取后,與數(shù)據(jù)庫中加密存儲(chǔ)的存量身份證特征值庫進(jìn)行檢索比對(duì),最終反饋業(yè)務(wù)系統(tǒng)成功與否。
3.2 前端脫敏展示場(chǎng)景
金融保險(xiǎn)業(yè)務(wù)場(chǎng)景,保險(xiǎn)公司分支機(jī)構(gòu)業(yè)務(wù)前臺(tái)和客戶手機(jī)需要展示客戶照片進(jìn)行身份核實(shí)或展示等功能,有可能會(huì)出保險(xiǎn)公司信息系統(tǒng)安全域,因此需要在人工可識(shí)別的前提下對(duì)照片進(jìn)行脫敏處理,具體流程如圖3所示。
處理流程方面,邊緣端發(fā)起申請(qǐng),通過匿蹤查詢技術(shù)從加密的圖片庫中進(jìn)行匿蹤檢索,查得后,保險(xiǎn)公司對(duì)加密的身份照片(可能是身份證或活體照片)進(jìn)行快速解密,通過隱私計(jì)算技術(shù)進(jìn)行脫敏化處理(去特征值化)后,在分支機(jī)構(gòu)業(yè)務(wù)前臺(tái)系統(tǒng)或客戶手機(jī)進(jìn)行脫敏展示。
4. 研究意義
多媒體大數(shù)據(jù)隱私保護(hù)關(guān)鍵技術(shù)集成平臺(tái),支持海量多媒體隱私內(nèi)容的精準(zhǔn)高效檢測(cè)技術(shù)及綜合安全評(píng)價(jià)系統(tǒng)。通過平臺(tái)的金融場(chǎng)景的示范應(yīng)用,將有助于補(bǔ)齊數(shù)字保護(hù)短板,提升我國(guó)大數(shù)據(jù)隱私保護(hù)水平。本項(xiàng)目探索搭建隱私內(nèi)容檢測(cè)、分級(jí)保護(hù)和安全共享平臺(tái),并在金融保險(xiǎn)行業(yè)開展示范應(yīng)用,一方面有利于保護(hù)數(shù)據(jù)存儲(chǔ)、傳輸、展示安全,補(bǔ)齊數(shù)字保護(hù)短板問題;另一方面能加快圖像、視頻等典型多媒體大數(shù)據(jù)保護(hù)技術(shù)落地,提升對(duì)金融保險(xiǎn)用戶隱私數(shù)據(jù)的保護(hù)水平。同時(shí)以此為基礎(chǔ),未來還可以在金融保險(xiǎn)行業(yè)其他場(chǎng)景,以及智慧能源、智慧醫(yī)療、智慧政務(wù)、智慧交通等其他行業(yè)進(jìn)行探索推廣,幫助提升我國(guó)大數(shù)據(jù)行業(yè)的隱私保護(hù)整體水平。
結(jié)語
多媒體大數(shù)據(jù)隱私安全綜合評(píng)價(jià)系統(tǒng)研究對(duì)于保護(hù)多媒體大數(shù)據(jù)隱私具有重大意義,防止因數(shù)據(jù)隱私泄露造成的經(jīng)濟(jì)損失,為多媒體大數(shù)據(jù)安全隱私保駕護(hù)航,可以在多領(lǐng)域進(jìn)行應(yīng)用,有力推動(dòng)信息化進(jìn)程。該平臺(tái)可以有效地保護(hù)多媒體大數(shù)據(jù)的隱私性和安全性,同時(shí)可以提高數(shù)據(jù)共享的效率和質(zhì)量。為聯(lián)合風(fēng)控、聯(lián)合營(yíng)銷、聯(lián)合建模等數(shù)據(jù)融合場(chǎng)景和金融機(jī)構(gòu)的隱私計(jì)算應(yīng)用提供數(shù)據(jù)安全保障,幫助組織構(gòu)建安全、開放、共贏的數(shù)據(jù)生態(tài),助力數(shù)據(jù)融合計(jì)算的健康發(fā)展和數(shù)據(jù)價(jià)值釋放。未來,我們將繼續(xù)深入研究多媒體大數(shù)據(jù)隱私保護(hù)與安全共享平臺(tái)的相關(guān)技術(shù)和服務(wù),為用戶提供更加安全、高效、便捷的數(shù)據(jù)服務(wù)和支持。
參考文獻(xiàn):
[1]中國(guó)人民銀行,全國(guó)金融標(biāo)準(zhǔn)化技術(shù)委員會(huì).金融數(shù)據(jù)安全 數(shù)據(jù)生命周期安全規(guī)范:JR/T 0223-2021[S/OL].2021:5 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1913.
[2]中國(guó)人民銀行,全國(guó)金融標(biāo)準(zhǔn)化技術(shù)委員會(huì).個(gè)人金融信息保護(hù)技術(shù)規(guī)范:JR/T 0171-2020[S/OL].2020:12 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1856.
作者簡(jiǎn)介:景濤,碩士研究生,研究方向:IT基礎(chǔ)設(shè)施信創(chuàng)國(guó)產(chǎn)化。