吳永飛 金賢敏 王彥博 李大偉
數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)作為新型生產(chǎn)要素為生產(chǎn)力帶來了全新的變革,在充分盤活數(shù)據(jù)價(jià)值的同時(shí),做好數(shù)據(jù)安全保護(hù)工作已成為重中之重。2021年9月1日,《中華人民共和國(guó)數(shù)據(jù)安全法》正式施行,數(shù)據(jù)安全已上升至國(guó)家法律高度。金融行業(yè)作為數(shù)據(jù)密集型行業(yè),一直以來都將數(shù)據(jù)安全視為“生命線”,并不斷采取多種技術(shù)保障數(shù)據(jù)安全。本文立足商業(yè)銀行視角,基于光子金融科技框架,創(chuàng)新將光子密碼學(xué)引入金融科技,以期為商業(yè)銀行提供受物理學(xué)定律保護(hù)的光子密碼學(xué)技術(shù)應(yīng)用新思路,為金融機(jī)構(gòu)在數(shù)據(jù)安全合規(guī)的前提下充分釋放數(shù)據(jù)要素潛能提供新方案。
隱私計(jì)算(Privacy Computing)是在保護(hù)數(shù)據(jù)本身不對(duì)外泄露的前提下實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的技術(shù)集合,一般而言主要包含多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、可信執(zhí)行環(huán)境等技術(shù)方向。
多方安全計(jì)算于1982年由姚期智[1]首次提出,可以保證在不透露各參與方數(shù)據(jù)信息的前提下完成多方共同計(jì)算的任務(wù)。當(dāng)前,多方安全計(jì)算領(lǐng)域常用的技術(shù)包括秘密共享、同態(tài)加密和零知識(shí)證明等。目前已經(jīng)有諸多機(jī)構(gòu)和專家學(xué)者開展了對(duì)多方安全計(jì)算的相關(guān)研究與應(yīng)用。2020年11月24日,中國(guó)人民銀行發(fā)布《多方安全計(jì)算金融應(yīng)用技術(shù)規(guī)范》(JR/T 0196-2020),對(duì)多方安全計(jì)算技術(shù)在金融領(lǐng)域的應(yīng)用制定了相應(yīng)要求。同年,譚培強(qiáng)[2]等人將多方安全計(jì)算技術(shù)應(yīng)用于金融數(shù)據(jù)治理,在保證數(shù)據(jù)安全的情況下深挖數(shù)據(jù)價(jià)值。2021年,光大銀行上線企業(yè)級(jí)多方安全計(jì)算平臺(tái),可應(yīng)用于聯(lián)合營(yíng)銷、聯(lián)合風(fēng)控、業(yè)務(wù)合規(guī)等多個(gè)領(lǐng)域[3]。2022年,交通銀行搭建了多方安全計(jì)算技術(shù)平臺(tái),并應(yīng)用于商業(yè)銀行風(fēng)控、營(yíng)銷等場(chǎng)景[4]。
聯(lián)邦學(xué)習(xí)于2016年由McMahan等人首次提出,屬于一種機(jī)器學(xué)習(xí)框架,可分為加密樣本對(duì)齊、加密模型訓(xùn)練與效果激勵(lì)三部分。2020年,陽文斯[5]基于聯(lián)邦學(xué)習(xí)提出了一種帶隱私保護(hù)的信用卡欺詐檢測(cè)方法和系統(tǒng),能夠保證銀行在不上傳私有數(shù)據(jù)集的情況下完成建模任務(wù),從而保障銀行用戶的數(shù)據(jù)安全。2022年,關(guān)杏元[6]等人研究了隱私立法時(shí)代聯(lián)邦學(xué)習(xí)在商業(yè)銀行的應(yīng)用,基于聯(lián)邦學(xué)習(xí)的隱私計(jì)算平臺(tái)能夠解決數(shù)據(jù)合規(guī)問題,打破數(shù)據(jù)壁壘,拓寬金融數(shù)據(jù)使用的邊界。同年,常悅[7]等人提出了基于聯(lián)邦學(xué)習(xí)的風(fēng)控模型,該模型能夠讓多個(gè)機(jī)構(gòu)實(shí)現(xiàn)數(shù)據(jù)共享,解決了因信息不對(duì)稱帶來的融資難問題。2023年,陳彤[8]等人在華夏銀行北京分行從助貸業(yè)務(wù)反欺詐場(chǎng)景入手,為降低行內(nèi)互聯(lián)網(wǎng)渠道消費(fèi)貸產(chǎn)品的欺詐風(fēng)險(xiǎn),提高自主風(fēng)控能力,在獲得客戶授權(quán)的情況下,使用聯(lián)邦學(xué)習(xí)計(jì)算技術(shù)構(gòu)建貸前反欺詐模型,取得良好的模型效果。同年,劉紫微[9]等人基于ResNet深度神經(jīng)網(wǎng)絡(luò)模型與聯(lián)邦學(xué)習(xí)進(jìn)行融合建模,提出一種新的信用風(fēng)險(xiǎn)預(yù)測(cè)方法,首次采用“聯(lián)邦優(yōu)化算法—局部全局聯(lián)合平均算法”優(yōu)化訓(xùn)練過程,對(duì)貸款用戶構(gòu)建信用風(fēng)險(xiǎn)識(shí)別模型,實(shí)現(xiàn)信用風(fēng)險(xiǎn)預(yù)測(cè)并保證用戶數(shù)據(jù)的隱私安全。
無論是多方安全計(jì)算還是聯(lián)邦學(xué)習(xí)都離不開對(duì)數(shù)據(jù)的加密,同態(tài)加密是一種在密文上做運(yùn)算和明文做運(yùn)算保持一致的加密算法。同態(tài)加密從計(jì)算類型與支持計(jì)算的程度視角來看,可分為半同態(tài)加密、部分同態(tài)加密和全同態(tài)加密。作為一種特殊的加密機(jī)制,同態(tài)加密在1978年被Rivest[10]等人首次提出,他們利用RSA公鑰加密體制以及求冪函數(shù)實(shí)現(xiàn)了乘法同態(tài)加密和加法同態(tài)加密,但此方案的安全性無法保證。2009年,Gentry[11]構(gòu)造出一個(gè)全同態(tài)加密方案,是密碼學(xué)研究中的一次重大突破。2017年,Cheon等人[12]提出CKKS全同態(tài)加密算法,支持針對(duì)實(shí)數(shù)或者復(fù)數(shù)的浮點(diǎn)數(shù)加法和乘法同態(tài)運(yùn)算,得到的計(jì)算結(jié)果為近似值,在隱私保護(hù)和云計(jì)算等領(lǐng)域有廣泛的應(yīng)用。2020年,王婧琳[13]提出了基于同態(tài)加密的金融數(shù)據(jù)安全共享方案,從金融領(lǐng)域的視角出發(fā),對(duì)金融數(shù)據(jù)安全共享方案的結(jié)構(gòu)、流程和算法這三方面進(jìn)行詳細(xì)設(shè)計(jì)。2022年,袁露[14]基于多元線性回歸和同態(tài)加密技術(shù),設(shè)計(jì)了縱向聯(lián)邦學(xué)習(xí)的訓(xùn)練和預(yù)測(cè)模型,在訓(xùn)練階段去除第三方,避免數(shù)據(jù)暴露,也直接杜絕了合謀攻擊,同時(shí)使用Paillier同態(tài)加密算法來加密梯度信息,避免參與方的原始特征值和特征參數(shù)直接參與模型訓(xùn)練,提高了數(shù)據(jù)和模型的安全性及隱私性。
近年來,光子金融科技蓬勃發(fā)展。作為光子金融科技的重要領(lǐng)域之一,光子密碼學(xué)與隱私計(jì)算的結(jié)合在金融領(lǐng)域也展現(xiàn)出廣闊的應(yīng)用前景。
1995年,Refregier和Javidi[15]提出了具有開創(chuàng)性的光學(xué)加密方案,即基于傅里葉變換的雙隨機(jī)相位加密方法。在該加密方案中,利用兩個(gè)隨機(jī)相位板分別放置在4F系統(tǒng)(一種光學(xué)成像系統(tǒng),可以利用光學(xué)傅里葉變換技術(shù)、光學(xué)相干技術(shù)進(jìn)行二維處理,實(shí)現(xiàn)圖像加減、圖像微分等)的輸入面和頻譜面中,可以實(shí)現(xiàn)對(duì)原圖像信息分別在空域上和頻域上的調(diào)制,使得原圖像在輸出面變成一幅看不到任何輪廓的無規(guī)則圖像,實(shí)現(xiàn)對(duì)原圖像信息的加密。目前已有諸多光學(xué)加密技術(shù),如利用離軸數(shù)字全息的加密方法、基于分?jǐn)?shù)傅里葉變換的加密方法和基于相位恢復(fù)算法的加密方法等。2020年,許祥馨[16]等人提出了一種基于雙隨機(jī)相位編碼的局部混合光學(xué)加密系統(tǒng),該系統(tǒng)能夠?qū)崿F(xiàn)對(duì)圖像中的部分信息進(jìn)行加密。2022年,英國(guó)Optalysys公司提出了一種基于光子計(jì)算的全同態(tài)加密技術(shù)方案,在該方案中信息可被編碼成許多不同光束的相位和振幅。這些信號(hào)會(huì)被稱為波導(dǎo)的結(jié)構(gòu)引導(dǎo)到特定的方向,然后將其照射到自由空間中,在此空間中信號(hào)會(huì)合并和相互干涉,從而能夠直接在加密數(shù)據(jù)上進(jìn)行計(jì)算,以此可以提升全同態(tài)加密的運(yùn)算效率。
綜上可知,光子密碼學(xué)與隱私計(jì)算天然具有融合的可能,積極探索基于光子特性的隱私計(jì)算效率提升新方案具有重要價(jià)值。
金融機(jī)構(gòu)在給客戶授信時(shí),不僅需要考慮貸款人在本行的貸款情況,往往還需考慮貸款人在其他金融機(jī)構(gòu)的貸款情況,從而避免重復(fù)過度授信。鑒于各金融機(jī)構(gòu)的客戶貸款信息均屬保密信息,此時(shí)需要設(shè)計(jì)一套算法機(jī)制,實(shí)現(xiàn)在不透露隱私的情況下得到貸款人在各金融機(jī)構(gòu)的貸款總額。
具體來看,假設(shè)客戶C要向金融機(jī)構(gòu)B貸款,金融機(jī)構(gòu)B還需要了解其他金融機(jī)構(gòu)針對(duì)客戶C的授信總額r,但不需要知道客戶C在其他各家金融機(jī)構(gòu)的具體授信金額。同態(tài)加密能夠有效地解決這一難題,即可以使用加法同態(tài)加密技術(shù)對(duì)客戶C在其他金融機(jī)構(gòu)的貸款情況進(jìn)行加密,若C在第k家機(jī)構(gòu)的授信金額為l^k,則加密后的金額為:
yk=m(lk)
其中m表示加法同態(tài)加密技術(shù)的加密過程,yk是加密后的結(jié)果,加密技術(shù)可以使用Paillier或Cheon-Kim-Kim-Song(CKKS)等同態(tài)加密技術(shù)對(duì)lk數(shù)據(jù)進(jìn)行加密。由于加法同態(tài)可實(shí)現(xiàn)在密文上做某些運(yùn)算等價(jià)于在明文上做加法運(yùn)算,此時(shí)可以通過同態(tài)加密運(yùn)算給出客戶C在各金融機(jī)構(gòu)的授信總額r,確定該客戶是否存在過度授信的風(fēng)險(xiǎn)。
針對(duì)上述場(chǎng)景進(jìn)行抽象,假設(shè)貸款客戶C在兩家金融機(jī)構(gòu)有授信,每家金融機(jī)構(gòu)對(duì)客戶C的授信金額分別為1.123千萬元和6.914千萬元(上述金額不為第三家金融機(jī)構(gòu)所知)。由于在整個(gè)隱私計(jì)算過程中會(huì)涉及到大量的高階多項(xiàng)式乘法運(yùn)算,使用經(jīng)典計(jì)算機(jī)進(jìn)行運(yùn)算極其耗時(shí)。因此,本研究基于全同態(tài)加密CKKS方案,發(fā)揮CKKS作為近似精度計(jì)算方案的優(yōu)勢(shì),并進(jìn)一步運(yùn)用光學(xué)高并行性的特性進(jìn)行加速,為基于同態(tài)加密的隱私計(jì)算提供光子化解決方案。
本研究采用全同態(tài)加密技術(shù)CKKS對(duì)授信數(shù)據(jù)進(jìn)行加密,整體方案如下:首先通過數(shù)據(jù)編碼將待計(jì)算數(shù)據(jù)編碼到多項(xiàng)式的系數(shù)中,然后使用CKKS方案中生成的公鑰對(duì)數(shù)據(jù)進(jìn)行加密,而后在密文上進(jìn)行多項(xiàng)式運(yùn)算,再針對(duì)密文計(jì)算的結(jié)果進(jìn)行解密,最終得到待計(jì)算明文的和。具體流程如下。
編碼過程
將明文數(shù)據(jù)a1和a2編碼到多項(xiàng)式環(huán)上,其系數(shù)向量記分別為m1和m2。本研究使用的多項(xiàng)式環(huán)Zq[X]/(Xn+1)中n為1024,取模的數(shù)q選取134215681(轉(zhuǎn)化為二進(jìn)制數(shù)是27位)。
密鑰生成過程
隨機(jī)生成一組隨機(jī)數(shù)(s,a,e),每個(gè)隨機(jī)數(shù)表示一個(gè)1024階多項(xiàng)式環(huán)的系數(shù)向量,其中s中每個(gè)數(shù)的取值范圍為{0,1,-1},e中每個(gè)數(shù)的取值為[0,134215680]的隨機(jī)分布,e中每個(gè)數(shù)的取值服從高斯分布,而后根據(jù)加密方案可以計(jì)算出b:
b=-as+e
上式中as表示多項(xiàng)式環(huán)上的乘法運(yùn)算,整個(gè)計(jì)算過程包含hadamard積運(yùn)算和取模運(yùn)算,運(yùn)算過程等價(jià)于進(jìn)行negativewrapped卷積運(yùn)算。通過計(jì)算后即可得到公鑰pk=(b,a),私鑰為(1,s)。
加密過程
利用公鑰pk對(duì)編碼的多項(xiàng)式系數(shù)m1和m2進(jìn)行加密,公式如下:
C1=(C10,C11)=u1pk+(m1+e10,e11)
C2=(C20,C21)=u2pk+(m2+e20,e21)
其中u1、u2、e10、e11、e20、e21分別為隨機(jī)生成的數(shù)值,其中u1和u2表示一個(gè)1024階多項(xiàng)式的系數(shù)向量,每個(gè)數(shù)的取值范圍為{0,1,-1},e10、e11、e20、e21中的每個(gè)數(shù)值為[0,134215680]的隨機(jī)分布。將密文C1和C2求和可得:
C3=(C30,C31)=(C10+C20,C11+C21)
解密過程
利用私鑰,根據(jù)公式對(duì)C3進(jìn)行解密得到明文P,計(jì)算如下:
P=C30+C31s
對(duì)明文P進(jìn)行多項(xiàng)式采樣并縮放后得到計(jì)算結(jié)果r。
光計(jì)算以其內(nèi)在的并行性、超高的帶寬優(yōu)勢(shì)、極低功耗和強(qiáng)大的可重構(gòu)能力,為下一代高性能計(jì)算提供了天然的支撐。此外,伴隨著硅基光電子技術(shù)的飛速發(fā)展,集成光計(jì)算已經(jīng)逐漸成為突破電計(jì)算芯片性能極限和續(xù)寫摩爾定律的技術(shù)選擇。
從硬件實(shí)現(xiàn)來看,本研究使用的光子芯片由光學(xué)硅的薄膜鈮酸鋰(LNOI)材料制作,其具有高調(diào)制速率、高帶寬、低損耗等特點(diǎn),調(diào)制速率可以達(dá)到數(shù)十GHz量級(jí),與傳統(tǒng)的數(shù)十KHz熱光調(diào)制相比,同等規(guī)模的網(wǎng)絡(luò)可以實(shí)現(xiàn)幾個(gè)數(shù)量級(jí)的性能提升。以薄膜鈮酸鋰制作的光芯片,可以工作在幾G甚至幾十G工作頻率上,可以極大地提升芯片算力。
從算法方案來看,研究方案中CKKS加密算法中的公鑰生成、加密部分和解密部分均涉及到多項(xiàng)式環(huán)上的乘法運(yùn)算,在運(yùn)算中涉及到向量之間的hadamard積運(yùn)算,可以利用光子計(jì)算高并行性的優(yōu)點(diǎn),采用光子芯片對(duì)hadamard積運(yùn)算進(jìn)行加速,進(jìn)而加速CKKS加密算法。具體而言,基于光子芯片加速hadamard積運(yùn)算的示意圖如圖1所示。
圖1 基于光子芯片加速hadamard積運(yùn)算的示意圖
圖1是基于高速可調(diào)LNOI芯片的32維向量光學(xué)點(diǎn)積計(jì)算系統(tǒng),該系統(tǒng)可以實(shí)現(xiàn)hadamard積運(yùn)算加速作用:如實(shí)現(xiàn)兩個(gè)向量x=(x1,x2…,xn)和向量a=(a1,a2…,an)的hadamard積運(yùn)算,首先系統(tǒng)采用多個(gè)波長(zhǎng)的光分別通過高速M(fèi)ZI調(diào)制器,通過改變MZI兩臂相位差實(shí)現(xiàn)光的強(qiáng)度調(diào)制,使得數(shù)據(jù)使用振幅編碼的方式加載到光信號(hào)中,隨后經(jīng)過強(qiáng)度調(diào)制的各個(gè)波長(zhǎng)的光通過合束器進(jìn)入光電探測(cè)器被檢測(cè),光電探測(cè)器的輸出即為向量hadamard積結(jié)果。目前由于受到系統(tǒng)工程化規(guī)模限制,尚無法一次性完成維度為1024的大規(guī)模向量的hadamard積計(jì)算,因此本文通過將大維度向量hadamard積計(jì)算拆分為細(xì)粒度的hadamard積操作進(jìn)行計(jì)算予以實(shí)現(xiàn)。
從算法實(shí)現(xiàn)來看,通過上述過程對(duì)a1=1.123,a2=6.914進(jìn)行編碼、加密、運(yùn)算和解密采樣得到最終的結(jié)果,整個(gè)過程使用光子芯片進(jìn)行加速,計(jì)算的結(jié)果r約為8.03,而在明文上兩個(gè)數(shù)值的真實(shí)和為8.037,二者(密文近似計(jì)算結(jié)果與明文計(jì)算結(jié)果)誤差僅為0.087%,初步驗(yàn)證了基于CKKS算法實(shí)現(xiàn)光子同態(tài)加密方案的有效性。具體到聯(lián)合風(fēng)控業(yè)務(wù)場(chǎng)景,即金融機(jī)構(gòu)B可知客戶C在其他多家金融機(jī)構(gòu)的授信總額約為8.03千萬元,該匯總數(shù)據(jù)信息有助于業(yè)務(wù)端對(duì)客戶是否過度授信進(jìn)行直觀判斷。
從加速效果來看,光芯片加速時(shí)間主要體現(xiàn)在加速hadamard積運(yùn)計(jì)算過程上,以主頻是1GHz、單核、單指令測(cè)算,傳統(tǒng)電子芯片計(jì)算一個(gè)1024維向量的hadamard積運(yùn)算需要約1024納秒,而使用光子芯片(采用32維的hadamard積運(yùn)算最小計(jì)算核,執(zhí)行32維向量的hadamard積運(yùn)算需要時(shí)間約為1納秒)則需要約為32納秒,較傳統(tǒng)方法計(jì)算效率提升約為32倍;對(duì)于整個(gè)1024階多項(xiàng)式環(huán)上乘法運(yùn)算,使用傳統(tǒng)電子芯片計(jì)算完成一次計(jì)算的時(shí)間約為13微秒,由于對(duì)于其中的hadamard積運(yùn)算進(jìn)行了光子加速,所以加速后完成一次計(jì)算的時(shí)間約為7微秒,較傳統(tǒng)方法計(jì)算效率提升約為2倍,進(jìn)一步驗(yàn)證了光芯片的加速效果。
數(shù)字經(jīng)濟(jì)時(shí)代,光子金融科技作為光子科技和金融科技相結(jié)合的交叉領(lǐng)域方興未艾。本文面向商業(yè)銀行業(yè)務(wù)場(chǎng)景,創(chuàng)新將光子密碼學(xué)引入到隱私計(jì)算中,運(yùn)用光子科技特有的性質(zhì),初步驗(yàn)證了光子同態(tài)加密技術(shù)在商業(yè)銀行隱私計(jì)算場(chǎng)景應(yīng)用的可行性,在有效提升同態(tài)加密計(jì)算效率的同時(shí)還保證了數(shù)據(jù)信息的安全,為商業(yè)銀行隱私計(jì)算的發(fā)展和創(chuàng)新提出了光子化解決方案。