梁天愷,曾 碧,陳 光
(1.廣州廣電運(yùn)通金融電子股份有限公司 研究總院,廣州 510006;2.廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,廣州 510006)
在人工智能以及大數(shù)據(jù)技術(shù)蓬勃發(fā)展的時代,人們在享受著數(shù)據(jù)信息技術(shù)帶來的便利外,也擔(dān)憂著數(shù)據(jù)的安全性與隱私問題[1]。同時,隨著數(shù)據(jù)確權(quán)的興起,越來越多的實(shí)體開始強(qiáng)調(diào)數(shù)據(jù)的歸屬權(quán)和使用權(quán),降低了不同實(shí)體之間的數(shù)據(jù)流通率,使各實(shí)體逐漸成為“數(shù)據(jù)孤島”[2-5]。在此背景下,學(xué)者們開始研究如何在保證數(shù)據(jù)隱私安全的前提下打破“數(shù)據(jù)孤島”現(xiàn)象,讓數(shù)據(jù)的價值得到更大的發(fā)揮,提高人工智能算法的性能[6-7]。前人的研究成果主要從軟件和硬件兩個層面著手,實(shí)現(xiàn)數(shù)據(jù)的隱私保護(hù),解決“數(shù)據(jù)孤島”的問題[8-9]。
在硬件層面解決問題的主要思路是在重要數(shù)據(jù)與可能的攻擊者之間建立物理隔離,常見的技術(shù)有可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)以及邊緣計(jì)算(Edge Computing,EC)等??尚艌?zhí)行環(huán)境的解決方案是,將隱私數(shù)據(jù)和相應(yīng)的數(shù)據(jù)處理過程置于一個可信的環(huán)境中,與外部服務(wù)請求者之間進(jìn)行物理隔離,以此防止隱私數(shù)據(jù)的泄露[10-11]??偨Y(jié)而言,可信執(zhí)行環(huán)境的建設(shè)難度相對較低;但需要對多方數(shù)據(jù)構(gòu)建統(tǒng)一的可信環(huán)境,因此建設(shè)成本較高[12]。邊緣計(jì)算恰恰相反,其主要思路是把各方設(shè)備的隱私數(shù)據(jù)和相應(yīng)的數(shù)據(jù)操作限制在設(shè)備邊緣,就近提供最近端的計(jì)算服務(wù)[13]。由于邊緣計(jì)算的數(shù)據(jù)收集和數(shù)據(jù)運(yùn)算等操作都是在設(shè)備的邊緣環(huán)境進(jìn)行的,無需將數(shù)據(jù)傳輸?shù)街鞣?wù)器,降低了敏感信息在傳輸過程和主服務(wù)器上泄露的可能性,有效解決了用戶隱私泄露和數(shù)據(jù)安全問題;其次因?yàn)檫吘売?jì)算能在邊緣地帶進(jìn)行必要的計(jì)算分析與過濾,所以具備一定的應(yīng)對數(shù)據(jù)爆炸的能力,有效降低邊緣到中心的網(wǎng)絡(luò)流量壓力[14];但是邊緣計(jì)算對邊緣設(shè)備的要求較高,其次在人工智能領(lǐng)域的應(yīng)用上,邊緣計(jì)算缺乏協(xié)調(diào)多方進(jìn)行聯(lián)合學(xué)習(xí)的能力,使其所習(xí)得的模型性能遠(yuǎn)低于集中式學(xué)習(xí)模型的性能[15-16]。
在軟件層面解決問題的主要思路是在數(shù)據(jù)以及通信層面對數(shù)據(jù)進(jìn)行加密,防止攻擊者截獲并破解隱私數(shù)據(jù),主要的研究成果有網(wǎng)絡(luò)安全通信協(xié)議以及密碼學(xué)技術(shù)等[17],比如:通過密鑰系統(tǒng)為客戶機(jī)和服務(wù)器提供C/S 認(rèn)證服務(wù)的網(wǎng)絡(luò)認(rèn)證的Kerberos 協(xié)議[18]以及為數(shù)據(jù)提供安全加解密功能的密碼學(xué)算法,如非對稱加密算法——RSA(Rivest-Shamir-Adleman)算法,對稱加密算法——數(shù)據(jù)加密標(biāo)準(zhǔn)(Data Encryption Standard,DES)算法等[19-20]。量子計(jì)算的發(fā)展使傳統(tǒng)密碼算法面臨著巨大的挑戰(zhàn),因?yàn)榱孔泳哂懈叨鹊牟⑿杏?jì)算能力,所以量子計(jì)算機(jī)能在可接受的時間范圍內(nèi)破解傳統(tǒng)的加密算法。例如,RSA 加密算法的解密計(jì)算——大整數(shù)分解問題,在傳統(tǒng)計(jì)算機(jī)上需要指數(shù)級別的時間復(fù)雜度,而在量子計(jì)算機(jī)破解的時間復(fù)雜度為多項(xiàng)式級別的時間復(fù)雜度[21]。為解決傳統(tǒng)加密算法所存在的問題,后量子密碼被提出。后量子密碼算法的思路是使用一些無法通過計(jì)算加速求解的數(shù)學(xué)問題,如多項(xiàng)式復(fù)雜程度的非確定性(Nondeterministic Polynomial,NP)完全問題、基于格、基于編碼和基于多變元方程的數(shù)學(xué)問題等,設(shè)計(jì)后量子算法,使得量子計(jì)算的算力優(yōu)勢無法在破解過程中發(fā)揮作用,以此防止密碼被破解[22-23]。在軟件層面的解決方案對硬件環(huán)境的要求低,且能提供較強(qiáng)大的數(shù)據(jù)隱私保護(hù);但是如何利用加密后的數(shù)據(jù)協(xié)調(diào)多方進(jìn)行高效的聯(lián)合訓(xùn)練,成為機(jī)器學(xué)習(xí)領(lǐng)域的難點(diǎn)。
結(jié)合上述的研究現(xiàn)狀,機(jī)器學(xué)習(xí)學(xué)者們提出了一種具備破解“數(shù)據(jù)孤島”的能力,同時具備隱私保護(hù)能力的新范式——聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)[24]。聯(lián)邦學(xué)習(xí)能夠在不暴露各方數(shù)據(jù)的前提下,協(xié)調(diào)各方進(jìn)行聯(lián)合學(xué)習(xí),同時對硬件環(huán)境的改造較少[25]。
本章將介紹機(jī)器學(xué)習(xí)的發(fā)展歷程,闡述聯(lián)邦學(xué)習(xí)出現(xiàn)的歷史必然性,進(jìn)而對聯(lián)邦學(xué)習(xí)的定義與分類進(jìn)行說明。
隨著智能化時代的到來,大規(guī)模數(shù)據(jù)被產(chǎn)生,如何從海量數(shù)據(jù)中提取有用的信息,讓數(shù)據(jù)的潛在價值得到發(fā)揮并造福人類社會,催生了人工智能與機(jī)器學(xué)習(xí)技術(shù)[26-27]。回顧機(jī)器學(xué)習(xí)的發(fā)展歷程,主要可以分為三大階段:集中式學(xué)習(xí)階段、分布式現(xiàn)場學(xué)習(xí)階段及聯(lián)邦學(xué)習(xí)階段[28]。
集中式學(xué)習(xí)是目前使用最廣的學(xué)習(xí)模式,其基本思路是“模型不動,數(shù)據(jù)動”[29]。圖1 示出了集中式學(xué)習(xí)的框架圖。此模式下,所有終端的數(shù)據(jù)需要被傳輸?shù)街鞣?wù)器上,由主服務(wù)器基于收集到的數(shù)據(jù)執(zhí)行機(jī)器學(xué)習(xí)任務(wù),即數(shù)據(jù)會被移動到主服務(wù)器,而模型以及模型的訓(xùn)練過程則被固定在主服務(wù)器上,稱“模型不動,數(shù)據(jù)動”[30]。由于集中式學(xué)習(xí)把所有數(shù)據(jù)都集中到主服務(wù)器,使其所掌握的潛在的數(shù)據(jù)知識面更廣,所以所習(xí)得的模型更能反映數(shù)據(jù)的潛在價值,性能相對更優(yōu)[31]。另一方面,集中式學(xué)習(xí)雖然在傳輸數(shù)據(jù)的過程中使用了密碼學(xué)進(jìn)行加密,但是依舊面臨著被破解的可能性,存在一定的數(shù)據(jù)安全隱患[32]。隨著“數(shù)據(jù)確權(quán)”概念的深入,根據(jù)我國制定的《中華人民共和國個人信息保護(hù)法》[33]及《中華人民共和國網(wǎng)絡(luò)安全法》,越來越多的個人和企業(yè)開始強(qiáng)調(diào)數(shù)據(jù)的歸屬權(quán)和使用權(quán)[34];因此,集中式學(xué)習(xí)模式已經(jīng)不能夠滿足社會發(fā)展的要求,機(jī)器學(xué)習(xí)進(jìn)入到分布式現(xiàn)場學(xué)習(xí)的階段。
圖1 集中式學(xué)習(xí)框架Fig.1 Framework of centralized learning
分布式現(xiàn)場學(xué)習(xí)的提出解決了數(shù)據(jù)安全和隱私保護(hù)的問題,主要思路是一個系統(tǒng)的數(shù)據(jù)分別在來源端各自執(zhí)行機(jī)器學(xué)習(xí)任務(wù),最為典型的例子就是邊緣計(jì)算[35]。邊緣計(jì)算是分布式現(xiàn)場學(xué)習(xí)的一種實(shí)現(xiàn)方式,思路是把需要分析的數(shù)據(jù)限制在設(shè)備的邊緣環(huán)境中進(jìn)行現(xiàn)場學(xué)習(xí),并將最終的學(xué)習(xí)結(jié)果匯聚到主服務(wù)器進(jìn)行匯總和存儲。這種把一個集中式學(xué)習(xí)任務(wù)分布到不同的設(shè)備邊緣進(jìn)行現(xiàn)場學(xué)習(xí)的方式,無需將敏感數(shù)據(jù)傳輸?shù)街鞣?wù)器進(jìn)行學(xué)習(xí),降低了敏感信息的流通率,有效保護(hù)了各方的數(shù)據(jù)權(quán)益;但也導(dǎo)致了“數(shù)據(jù)孤島”現(xiàn)象——由于各方缺乏數(shù)據(jù)上的溝通,導(dǎo)致一個系統(tǒng)內(nèi)的數(shù)據(jù)無法交匯融合,無法得到最大的發(fā)揮,同時導(dǎo)致各方所學(xué)習(xí)到的知識過于片面,模型缺乏全局性和泛化能力[36]。
為了解決集中式學(xué)習(xí)存在的數(shù)據(jù)隱私問題以及分布式現(xiàn)場學(xué)習(xí)的數(shù)據(jù)孤島問題,聯(lián)邦學(xué)習(xí)被提出,因此機(jī)器學(xué)習(xí)的發(fā)展歷程也隨之進(jìn)入了第三階段——聯(lián)邦學(xué)習(xí)階段[37]。
作為面向數(shù)據(jù)孤島和隱私保護(hù)的機(jī)器學(xué)習(xí)解決方案,聯(lián)邦學(xué)習(xí) 最早由Brendan McMahan 等提出[38-39],McMahan等[40-41]將聯(lián)邦學(xué)習(xí)應(yīng)用于谷歌輸入法Gboard 系統(tǒng),實(shí)現(xiàn)輸入法的候選詞預(yù)測。與“模型不動,數(shù)據(jù)動”的集中式學(xué)習(xí)相反,聯(lián)邦學(xué)習(xí)是一種“數(shù)據(jù)不動,模型動”的學(xué)習(xí)模式[42]。在聯(lián)邦學(xué)習(xí)的過程中,各參與方不需要交換樣本數(shù)據(jù)及其變體,僅需要交換與模型相關(guān)的中間數(shù)據(jù)及其變體,然后由主服務(wù)器將中間數(shù)據(jù)進(jìn)行安全聚合并反饋給參與方;參與方則負(fù)責(zé)根據(jù)聚合后的模型信息進(jìn)行己方模型的更新,有效保證了各參與方的敏感數(shù)據(jù)的安全性和隱私性,實(shí)現(xiàn)了在融合多個參與方的數(shù)據(jù)所蘊(yùn)含的知識的同時保護(hù)隱私數(shù)據(jù)[43-45]。聯(lián)邦學(xué)習(xí)的架構(gòu)如圖2 所示。
圖2 聯(lián)邦學(xué)習(xí)的架構(gòu)Fig.2 Architecture of federated learning
根據(jù)參與方數(shù)據(jù)集的特征空間和樣本空間的分布,聯(lián)邦學(xué)習(xí)可被分為:橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)以及聯(lián)邦遷移學(xué)習(xí)[46-47]。假設(shè)X代表某個參與方的樣本空間的某個樣本數(shù)據(jù),Y代表某個參與方的特征空間。如圖3 所示,橫向聯(lián)邦學(xué)習(xí)(Horizontal Federated Learning,HFL)指的是兩個參與方的數(shù)據(jù)集存在較大的特征空間重疊的情況[48]。此模式下,設(shè)定前提為各參與方的數(shù)據(jù)都是具備標(biāo)簽空間的。
圖3 橫向聯(lián)邦學(xué)習(xí)Fig.3 Horizontal federated learning
相反地,在具有較多樣本數(shù)據(jù)重疊的參與方之間執(zhí)行的聯(lián)邦學(xué)習(xí)任務(wù),稱縱向聯(lián)邦學(xué)習(xí)(Vertical Federated Learning,VFL),如圖4 所示[49]。此模式下,設(shè)定前提為只有一個參與方的數(shù)據(jù)具備標(biāo)簽空間,其余參與方的數(shù)據(jù)不具備標(biāo)簽空間。然而,在現(xiàn)實(shí)生活中,還可能存在兩個在樣本空間以及特征空間均存在較小重疊的數(shù)據(jù)集,此種情況下需要使用如圖5 所示的聯(lián)邦遷移學(xué)習(xí)(Federated Transfer Learning,F(xiàn)TL)[50]。此模式下,設(shè)定前提和縱向聯(lián)邦學(xué)習(xí)一樣,只有一個參與方的數(shù)據(jù)是具備標(biāo)簽空間的。
圖4 縱向聯(lián)邦學(xué)習(xí)Fig.4 Vertical federated learning
圖5 聯(lián)邦遷移學(xué)習(xí)Fig.5 Federated transfer learning
橫向聯(lián)邦學(xué)習(xí)適用于參與方之間的特征空間的重疊面積較大的場景[51]。如圖3 所示,橫向聯(lián)邦學(xué)習(xí)的空間涵蓋了多個參與方的樣本數(shù)據(jù),但所使用的特征空間僅限于各參與方之間的重疊部分,因此橫向聯(lián)邦學(xué)習(xí)也被稱為按樣本劃分的聯(lián)邦學(xué)習(xí)[52-54]。
作為最早被提出的聯(lián)邦學(xué)習(xí)范式,橫向聯(lián)邦學(xué)習(xí)的應(yīng)用比較廣泛[55],如谷歌輸入法的Gboard 系統(tǒng)使用橫向聯(lián)邦學(xué)習(xí)預(yù)測用戶下一個詞的輸入[56]。傳統(tǒng)做法是建議用戶將數(shù)據(jù)傳到主服務(wù)器上,然后在主服務(wù)器上基于所有用戶數(shù)據(jù)構(gòu)建聚合預(yù)測模型;但是,隨著隱私保護(hù)觀念的深入,用戶不希望隱私數(shù)據(jù)暴露,此時,聯(lián)邦學(xué)習(xí)派上了用場。在橫向聯(lián)邦學(xué)習(xí)模式下,用戶設(shè)備會把本地模型的模型信息傳輸?shù)街鞣?wù)器,主服務(wù)器將所有的模型信息進(jìn)行安全聚合,并將聚合信息加密后廣播給所有的用戶設(shè)備,最后用戶設(shè)備會根據(jù)主服務(wù)器的聚合信息來更新自身的本地模型[57-58]。在此學(xué)習(xí)模式下,用戶設(shè)備會從主服務(wù)器的聚合信息中間接得到一些其他參與方的模型信息,即其他參與方的數(shù)據(jù)蘊(yùn)含的新知識,從而提升所有用戶設(shè)備的本地模型的泛化能力,提高預(yù)測模型的性能[59]。比如在該系統(tǒng)中存在用戶A、B,用戶A 是金融從業(yè)者,它的數(shù)據(jù)多集中在金融領(lǐng)域的用詞上;而用戶B 是計(jì)算機(jī)行業(yè)從業(yè)者,它的數(shù)據(jù)多集中在計(jì)算機(jī)領(lǐng)域的用詞。在橫向聯(lián)邦學(xué)習(xí)過程中,用戶A 的本地模型的構(gòu)建過程中借鑒了含有用戶B 的數(shù)據(jù)知識的聚合信息,因此用戶A 的本地模型對計(jì)算機(jī)行業(yè)用詞也具備預(yù)測能力[60]。
橫向聯(lián)邦學(xué)習(xí)的架構(gòu)如圖6 所示。一般而言,橫向聯(lián)邦學(xué)習(xí)包括5 個主要步驟[61]:
圖6 橫向聯(lián)邦學(xué)習(xí)架構(gòu)Fig.6 Architecture of horizontal federated learning
步驟1 參與方根據(jù)自身數(shù)據(jù)集,構(gòu)建本地模型。
步驟2 參與方將本地模型的模型信息,如梯度,使用加密算法進(jìn)行加密,如同態(tài)加密,然后把加密后的模型信息發(fā)送給主服務(wù)器[62]。
步驟3 主服務(wù)器根據(jù)參與方的模型信息進(jìn)行安全聚合,常見的安全聚合算法有聯(lián)邦平均算法(Federated Averaging algorithm,F(xiàn)edAvg)以及異構(gòu)聯(lián)邦模型的聯(lián)邦優(yōu)化(Federated Optimization in Heterogeneous Network,F(xiàn)edProx)算法[63-64]等。
步驟4 主服務(wù)器將聚合后的信息廣播給所有參與方。
步驟5 參與方對主服務(wù)器傳來的聚合信息進(jìn)行解密,據(jù)此更新本地模型。
重復(fù)以上步驟,直至達(dá)到預(yù)設(shè)的停止條件[65-66]。
總結(jié)而言,橫向聯(lián)邦學(xué)習(xí)的多方數(shù)據(jù)集的特征空間雷同,因此在聯(lián)邦模型的訓(xùn)練過程中,不需要參與方之間進(jìn)行中間計(jì)算結(jié)果的交換,而是由主服務(wù)器進(jìn)行模型聚合,各方再根據(jù)最新的聚合模型信息進(jìn)行本地模型的更新,能在不得知其他參與方源數(shù)據(jù)的情況下實(shí)現(xiàn)各方知識的交換。然而,橫向聯(lián)邦不適用于各參與方之間特征空間差異較大的跨領(lǐng)域聯(lián)邦學(xué)習(xí)的情況,因此提出了縱向聯(lián)邦學(xué)習(xí)[67-68]。
與橫向聯(lián)邦學(xué)習(xí)相反,縱向聯(lián)邦學(xué)習(xí)適用于參與方之間樣本空間重疊面積較大的應(yīng)用場景。從圖4 可以看出,因?yàn)榭v向聯(lián)邦學(xué)習(xí)是基于特征空間對樣本數(shù)據(jù)進(jìn)行劃分,學(xué)習(xí)的數(shù)據(jù)空間僅包含了具備重疊特征的樣本,所以縱向聯(lián)邦學(xué)習(xí)又被稱為按特征劃分的聯(lián)邦學(xué)習(xí)[69-70]。
縱向聯(lián)邦學(xué)習(xí)更適合執(zhí)行跨行業(yè)跨領(lǐng)域的機(jī)器學(xué)習(xí)任務(wù),如微視與廣告商合作提出的聯(lián)邦廣告投放系統(tǒng)。在此系統(tǒng)中,微視具備包括用戶畫像和用戶點(diǎn)播記錄等數(shù)據(jù),廣告平臺則具備廣告信息、產(chǎn)品信息以及用戶購買記錄等數(shù)據(jù);可見雙方的數(shù)據(jù)集的特征空間截然不同,但是可能存在相同用戶。在此情況下,縱向聯(lián)邦學(xué)習(xí)可以在不泄露、不交換雙方樣本數(shù)據(jù)的同時聚合雙方的數(shù)據(jù)特征和知識特征,構(gòu)建出一個聯(lián)邦推薦模型,在提高微視用戶的體驗(yàn)度和廣告收益的同時提高廣告方的營銷收益,實(shí)現(xiàn)雙贏局面[71]。
縱向聯(lián)邦學(xué)習(xí)的架構(gòu)如圖7 所示。特別地,縱向聯(lián)邦學(xué)習(xí)中主服務(wù)器又叫協(xié)調(diào)方。
圖7 縱向聯(lián)邦學(xué)習(xí)架構(gòu)Fig.7 Architecture of vertical federated learning
縱向聯(lián)邦學(xué)習(xí)的學(xué)習(xí)過程主要包括5 個主要步驟[72]:
步驟1 數(shù)據(jù)對齊。數(shù)據(jù)對齊的目的是在保護(hù)各參與方隱私和數(shù)據(jù)安全的前提下,找到共同樣本并給予共同樣本執(zhí)行聯(lián)邦學(xué)習(xí)任務(wù)。常見的數(shù)據(jù)對齊方法有Li 等[73]提出的算法。此方法下,如要在參與方A、B 之間進(jìn)行數(shù)據(jù)對齊,則需要執(zhí)行以下步驟:
1)參與方B 首先通過RSA 加密算法,生成公鑰n、加密算法e以及解密算法d,然后把(n,e)發(fā)送給參與方A。
2)參與方A 接收到(n,e)后,將己方數(shù)據(jù)A進(jìn)行哈希加密形成H(A),同時添加噪聲r,并對r使用加密算法e加密,得到密文H(A)+e(r)并傳給參與方B。
3)參與方B 拿到密文后,使用解密算法d進(jìn)行解密得到d(H(A)+e(r))=d(H(A))+d(e(r))=d(H(A))+r。同時,參與方B 對己方數(shù)據(jù)B進(jìn)行哈希加密,再通過解密算法d進(jìn)行“解密”,得到d(H(B))。然后進(jìn)行二次哈希加密,得到密文B:H(d(H(B)))。最后將d(H(A))+r和密文B傳送給參與方A。
4)參與方A 接收到參與方B 的信息后,首先對d(H(A))+r去除噪聲r,得到d(H(A)),再進(jìn)行二次哈希得到H(d(H(A))),然后將其傳送給參與方B。
5)可以看出,經(jīng)過步驟4)處理后,參與方A 的加密數(shù)據(jù)為H(d(H(A)));同時,經(jīng)過步驟3)處理后,參與方B 的加密數(shù)據(jù)為H(d(H(B))),兩者處于一個數(shù)據(jù)維度,因此參與方B方可以基于H(d(H(A)))以及H(d(H(B)))進(jìn)行交集運(yùn)算,最終得到雙方的共同樣本ID。最后,將共同樣本共享給其他方,完成數(shù)據(jù)對齊的工作。
步驟2 主服務(wù)器發(fā)送公鑰給各參與方,同時參與方基于共同樣本構(gòu)建初始本地模型;然后將加密后的模型信息,如梯度、損失值等,發(fā)送給主服務(wù)器[74]。
步驟3 主服務(wù)器解密參與方的模型信息,同時計(jì)算參與方更新模型所必須的計(jì)算結(jié)果,并傳送回參與方[75]。
步驟4 參與方根據(jù)主服務(wù)器的計(jì)算結(jié)果,更新本地模型;同時各方會把中間計(jì)算結(jié)果共享給其他參與方,用于協(xié)助對方計(jì)算梯度和損失值等模型信息[76]。
步驟5-1 對于部分縱向聯(lián)邦學(xué)習(xí)算法,參與方還會將本地模型的模型標(biāo)識發(fā)送給主服務(wù)器保存,以便在預(yù)測過程中主服務(wù)器知道需要將新數(shù)據(jù)發(fā)送至哪些參與方進(jìn)行聯(lián)邦預(yù)測。如secureBoost 算法中,參與方會把[記錄id,特征,閾值]以及分割后的樣本空間告知主服務(wù)器;同時,主服務(wù)器會將當(dāng)前的處理節(jié)點(diǎn)與參與方的劃分信息進(jìn)行關(guān)聯(lián)。因此只有主服務(wù)器清楚整棵決策樹的結(jié)構(gòu),當(dāng)有新樣本需要預(yù)測時,主服務(wù)器會將數(shù)據(jù)發(fā)至當(dāng)前節(jié)點(diǎn)所關(guān)聯(lián)的參與方,讓參與方利用本地模型計(jì)算閾值,得知下一步的樹搜索方向[77-78]。
步驟5-2 特別地,部分需要全體參與方參與預(yù)測的縱向聯(lián)邦學(xué)習(xí)算法,如安全聯(lián)邦線性回歸,則不需要參與方告知主服務(wù)器必要的模型標(biāo)識[79]。
綜上可得,縱向聯(lián)邦學(xué)習(xí)中各方所掌握的特征不同,因此在訓(xùn)練聯(lián)邦模型過程中,各方需要進(jìn)行中間結(jié)果的交換來幫助對方學(xué)習(xí)己方所掌握的特征知識[80]。
區(qū)別于橫向聯(lián)邦學(xué)習(xí)以及縱向聯(lián)邦學(xué)習(xí),聯(lián)邦遷移學(xué)習(xí)不需要主服務(wù)器(協(xié)調(diào)方)作為各參與方之間的協(xié)調(diào)者[81];并且聯(lián)邦遷移學(xué)習(xí)旨在讓模型具備舉一反三的能力,在各參與方的樣本空間以及特征空間均存在較少交叉信息的情況下使用遷移學(xué)習(xí)算法互助地構(gòu)建模型[82]。學(xué)習(xí)模式可被總結(jié)為:使用某參與方在當(dāng)前迭代中已訓(xùn)練好的模型參數(shù),遷移到另外一個參與方上,協(xié)助它進(jìn)行新一輪模型的訓(xùn)練。典型的聯(lián)邦遷移學(xué)習(xí)的架構(gòu)如圖8 所示,主要包括以下步驟[83-84]:
圖8 聯(lián)邦遷移學(xué)習(xí)架構(gòu)Fig.8 Architecture of federated transfer learning
步驟1 參與方根據(jù)自身數(shù)據(jù)集構(gòu)建本地模型。
步驟2 參與方分別運(yùn)行各自的本地模型,獲得數(shù)據(jù)表征,以及一組中間結(jié)果,加密后發(fā)送給對方。
步驟3 對方利用接收到的中間結(jié)果計(jì)算模型的加密梯度和損失值,加入掩碼后發(fā)給原參與方。
步驟4 各方對接收到的信息進(jìn)行解密后發(fā)回給對方,然后各方利用發(fā)解密后的模型信息更新各自的模型。
不斷重復(fù)以上步驟,直至損失收斂為止。在此過程中,相當(dāng)于每個參與方都利用了對方的當(dāng)前模型和數(shù)據(jù)潛在的表征,更新各自的本地模型,實(shí)現(xiàn)了遷移學(xué)習(xí)的聯(lián)邦模式,即聯(lián)邦遷移學(xué)習(xí)[85]。
一般而言,聯(lián)邦遷移學(xué)習(xí)可被分為基于樣本的聯(lián)邦遷移學(xué)習(xí)、基于特征的聯(lián)邦遷移學(xué)習(xí)、基于參數(shù)的聯(lián)邦遷移學(xué)習(xí)以及基于相關(guān)性的聯(lián)邦遷移學(xué)習(xí)[86]。
1)基于樣本的聯(lián)邦遷移學(xué)習(xí),又稱基于實(shí)例的聯(lián)邦遷移學(xué)習(xí)?;舅悸肥歉鲄⑴c方通過有選擇地調(diào)整用于訓(xùn)練的樣本的權(quán)重來減少不同參與方樣本之間分布的差異性,并以此協(xié)同地訓(xùn)練得到一個聯(lián)邦遷移模型。
2)基于特征的聯(lián)邦遷移學(xué)習(xí)?;舅悸肥峭ㄟ^最小化不同參與方之間的樣本分布差異性或特征差異性來協(xié)同學(xué)習(xí)一個共同的特征空間,并以此特征空間來降低分類類別數(shù)或回歸誤差來實(shí)現(xiàn)聯(lián)邦遷移模型的構(gòu)建。
3)基于參數(shù)的聯(lián)邦遷移學(xué)習(xí),又稱基于模型的聯(lián)邦遷移學(xué)習(xí)?;舅悸肥菂⑴c方利用其他方的模型信息或先驗(yàn)關(guān)系來初始化或更新本地模型,以此借鑒其他方的數(shù)據(jù)表征和知識。
4)基于相關(guān)性的聯(lián)邦遷移學(xué)習(xí)。對不同參與方的知識或特征空間進(jìn)行相關(guān)性映射,并按照相關(guān)性順序來利用其他參與方的知識映射更新本地模型,以此借鑒更多的知識。
總結(jié)而言,相較于傳統(tǒng)的遷移學(xué)習(xí),聯(lián)邦遷移學(xué)習(xí)最大的特點(diǎn)是基于多方的數(shù)據(jù)表征來建模,但某參與方的數(shù)據(jù)不允許流向其他方;而傳統(tǒng)的遷移學(xué)習(xí)則不做限制,因此聯(lián)邦遷移學(xué)習(xí)有效保護(hù)了用戶數(shù)據(jù)的隱私性和安全性[87]。
聯(lián)邦學(xué)習(xí)除了解決數(shù)據(jù)孤島問題,使得各方數(shù)據(jù)可以進(jìn)行聯(lián)合學(xué)習(xí)外,還必須解決數(shù)據(jù)安全問題,實(shí)現(xiàn)各方的隱私保護(hù)[88]。
安全模型是評價一個聯(lián)邦學(xué)習(xí)系統(tǒng)是否滿足隱私保護(hù)要求的標(biāo)準(zhǔn)之一,要求一個安全的聯(lián)邦學(xué)習(xí)系統(tǒng)應(yīng)當(dāng)滿足以下幾個安全屬性[89]:
1)隱私性。要求能有效保證系統(tǒng)內(nèi)部各方的數(shù)據(jù)安全和隱私安全。
2)正確性。每個參與方都能輸出計(jì)算結(jié)果,且計(jì)算結(jié)果是正確的。
3)公平性。系統(tǒng)能公平看待各方的計(jì)算貢獻(xiàn),公平地進(jìn)行計(jì)算結(jié)果的聚合。
聯(lián)邦學(xué)習(xí)想要滿足安全模型的要求,通常會面臨著4 種常見的潛在敵手以及安全威脅。針對聯(lián)邦學(xué)習(xí)系統(tǒng)的攻擊模型主要包括以下幾種。
1)源自服務(wù)器的攻擊[90]。
根據(jù)源自服務(wù)器的攻擊行為,可以分為誠實(shí)但好奇的服務(wù)器敵手、惡意的服務(wù)器敵手,以及混合的服務(wù)器敵手。
一個誠實(shí)但好奇的服務(wù)器會試圖從參與方的模型更新信息中反推出參與方的隱私數(shù)據(jù)特點(diǎn)等,但不會提供負(fù)反饋信息給參與者,使其錯誤地更改本地模型。相反地,惡意服務(wù)器不僅會試圖從參與方的模型更新信息中反推出參與方的隱私數(shù)據(jù)特點(diǎn)等,還會惡意篡改聚合模型,或者提供錯誤的信息給參與方,破壞參與方的模型性能?;旌系姆?wù)器敵手則同時或者不間斷地充當(dāng)誠實(shí)但好奇的服務(wù)器敵手和惡意的服務(wù)器敵手。
2)源自參與者的攻擊[91]。
有的參與者是誠實(shí)但好奇的,它希望竊聽其他參與方以及主服務(wù)器共享的數(shù)據(jù)信息,以期從中推理出某些有用的信息。這會對聯(lián)邦內(nèi)部造成數(shù)據(jù)安全的威脅,同時它對模型更新會比較消極,不利于聯(lián)邦模型性能的提升。其次,還有惡意的參與者存在,他們的主要目的是反饋錯誤的模型信息到主服務(wù)器,使得聯(lián)邦模型向著消極的方向更新迭代。同樣地,也存在混合類型的敵對參與方。
3)源自外部的攻擊[92]。
參與者和服務(wù)器之間通信更新時,通道上可能存在外部竊聽者竊聽信息,并由此反推出一些有關(guān)模型等的隱私數(shù)據(jù),造成聯(lián)邦內(nèi)部的通信安全威脅。
4)源自系統(tǒng)漏洞的攻擊[93]。
聯(lián)邦學(xué)習(xí)系統(tǒng)本身也可能存在潛在的安全薄弱點(diǎn),比如系統(tǒng)架構(gòu)設(shè)計(jì)不合理等。這些源自系統(tǒng)的漏洞使得攻擊者可以發(fā)起數(shù)據(jù)攻擊以及模型攻擊:
數(shù)據(jù)攻擊 主要是指參與者惡意修改數(shù)據(jù)標(biāo)簽或中間信息,破壞聯(lián)邦學(xué)習(xí)的過程。
模型更新攻擊 通過惡意地惡化本地模型,破壞全局模型的性能。
隱私保護(hù)技術(shù)經(jīng)過多年的發(fā)展,演變出眾多的隱私保護(hù)技術(shù),這些隱私保護(hù)技術(shù)可以被用于聯(lián)邦學(xué)習(xí)過程中,以此保證聯(lián)邦內(nèi)部各參與方的數(shù)據(jù)安全和隱私安全。常見的隱私保護(hù)技術(shù),常見有不經(jīng)意傳輸(Oblivious Transfer,OT)[94]、混淆電路(Garbled Circuit,GC)[95]、秘密共享(Secret Sharing,SS)[96]、隱私集合交集(Private Set Intersection,PSI)[97]、差分隱 私(Differential Privacy,DP)[98]以及同 態(tài)加密(Homomorphic Encryption,HE)[99]等。
不經(jīng)意傳輸 發(fā)送方把多條數(shù)據(jù)基于不同的密鑰加密,并將所有公鑰發(fā)送給接收方,接收方按需使用特定的公鑰生成隨機(jī)數(shù),雙方再分別進(jìn)行異或運(yùn)算等,最后接收方只會得到特定數(shù)據(jù)的明文信息,其余數(shù)據(jù)的運(yùn)算結(jié)果為亂碼[100]。
混淆電路 屬于不經(jīng)意傳輸?shù)囊环N應(yīng)用,基本思路是:根據(jù)運(yùn)算函數(shù)設(shè)計(jì)出一個電路,加密方首先對該電路進(jìn)行加密,即加密方負(fù)責(zé)電路的生成任務(wù)。解密方在不能得知原始電路的情況下,雙方通過不經(jīng)意傳輸使得解密方可以獲得相應(yīng)的數(shù)據(jù),即解密方負(fù)責(zé)電路的解密任務(wù)[101]。
秘密共享 基本思路是化整為散,將需要計(jì)算的秘密分割成多份小秘密,分別分發(fā)給若干個參與方進(jìn)行處理,最后將結(jié)果進(jìn)行聚合。在此設(shè)計(jì)下,因?yàn)楦鞣街坏玫搅艘恍〔糠值拿孛?,無法重構(gòu)出真實(shí)的秘密,保證了數(shù)據(jù)的安全性和隱私性[102]。
隱私集合交集 是一種基于多方的單獨(dú)輸入尋找多方數(shù)據(jù)的交集,并返回給特定方的技術(shù)。隱私集合交集技術(shù)常被用于聯(lián)邦學(xué)習(xí)的數(shù)據(jù)對齊任務(wù)中[103]。
差分隱私 基本思路是針對需要保密的數(shù)據(jù)加入噪聲的處理。該動作雖然有效保護(hù)了數(shù)據(jù)的安全性與隱私性,但噪聲的加入會對計(jì)算結(jié)果產(chǎn)生一定的影響[104]。
同態(tài)加密 相較于其他加密算法,同態(tài)加密的最大優(yōu)勢在于在計(jì)算過程中不需要頻繁進(jìn)行加解密的操作,可以直接對密文進(jìn)行計(jì)算,且計(jì)算結(jié)果解密后得到的值,與直接使用明文計(jì)算得到的結(jié)果一致,有效提高了計(jì)算效率[105]。
隨著聯(lián)邦學(xué)習(xí)的發(fā)展與應(yīng)用,出現(xiàn)了越來越多的開源框架,為聯(lián)邦學(xué)習(xí)的理論落到真實(shí)的應(yīng)用場景提供了開發(fā)條件。
目前主流的聯(lián)邦學(xué)習(xí)開源框架主要包括:微眾銀行牽頭提出的FATE(Federated AI Technology Enabler)框架[106]、百度牽頭提出的PaddleFL(Paddle Federated Learning)框架[107]、谷歌牽頭 提出的TFF(TensorFlow Federated)框 架[108],以 及OpenMind 牽頭提出的PySyft 框架[109]。表1 給出了以上幾個聯(lián)邦學(xué)習(xí)開源框架的對比。
表1 4種主流的聯(lián)邦學(xué)習(xí)開源框架對比Tab.1 Comparison of four mainstream federated learning open-source frameworks
FATE 框架作為目前國內(nèi)比較優(yōu)秀的聯(lián)邦學(xué)習(xí)開源框架,支持橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)以及聯(lián)邦遷移學(xué)習(xí)的實(shí)現(xiàn),同時還提供了其他框架所沒有的聯(lián)邦特征工程算法、Kubernetes 容器化應(yīng)用和聯(lián)邦在線推理[110]。
相對而言,PaddleFL 僅支持橫向和縱向的聯(lián)邦學(xué)習(xí);而PySyft 和TFF 框架僅實(shí)現(xiàn)了橫向聯(lián)邦學(xué)習(xí)的支持。目前三者均缺乏聯(lián)邦樹模型算法的實(shí)現(xiàn),如梯度提升決策樹(Gradient Boosting Decision Tree,GDBT)和SecureBoost[111]。
在對數(shù)據(jù)安全性以及隱私性要求較高的領(lǐng)域,比如智慧城市、智慧政務(wù)、智慧醫(yī)療、金融保險(xiǎn)、物聯(lián)網(wǎng)、跨域推薦以及多方推理等,聯(lián)邦學(xué)習(xí)展現(xiàn)出了不可預(yù)估的前景[112]。
智慧城市 隨著企業(yè)與個人對隱私要求的提高,聯(lián)邦學(xué)習(xí)可在保護(hù)各方數(shù)據(jù)的安全性與隱私性的前提下,將城市里各方的數(shù)據(jù)進(jìn)行安全整合,為市民提供更便捷的城市服務(wù)。
智慧政務(wù) 政務(wù)數(shù)據(jù)屬于政府層面的隱私數(shù)據(jù),導(dǎo)致政務(wù)數(shù)據(jù)庫不能隨意為第三方提供數(shù)據(jù)服務(wù),限制了人工智能算法的性能提升,如貸款人風(fēng)險(xiǎn)評估等,無法融合公安部門的數(shù)據(jù)、征信部門的征信記錄等數(shù)據(jù)特征,限制了評估算法的性能。聯(lián)邦學(xué)習(xí)的出現(xiàn),為數(shù)據(jù)孤島問題提供了一種安全的解決方案。
智慧醫(yī)療 醫(yī)療領(lǐng)域更注重個人數(shù)據(jù)的隱私性[113]。比如,多個醫(yī)院需要協(xié)同合作,對患者進(jìn)行DNA 測序,以告知患者所患疾病。聯(lián)邦學(xué)習(xí)就可以聯(lián)合多個醫(yī)院的不同數(shù)據(jù)集進(jìn)行學(xué)習(xí),訓(xùn)練出一個蘊(yùn)含多個醫(yī)院的不同知識的聯(lián)邦模型,為患者DNA 序列工作提供聯(lián)邦預(yù)測的能力。如此,各醫(yī)院的DNA 庫以及患者的DNA 序列均互不可知,保證了多方的數(shù)據(jù)安全和隱私安全。
金融保險(xiǎn) 在金融保險(xiǎn)行業(yè),橫向聯(lián)邦學(xué)習(xí)可以為具有相同數(shù)據(jù)特征的金融機(jī)構(gòu),如多家銀行,訓(xùn)練橫向聯(lián)邦模型。也可為具備不同數(shù)據(jù)特征的金融機(jī)構(gòu),如證券公司與信貸公司,訓(xùn)練縱向聯(lián)邦模型。有效保護(hù)了金融數(shù)據(jù)的安全性,提高金融評估模型的性能。
物聯(lián)網(wǎng) 在當(dāng)今萬物互聯(lián)的物聯(lián)網(wǎng)時代的發(fā)展趨勢下,聯(lián)邦學(xué)習(xí)也為萬物數(shù)據(jù)安全互聯(lián)互通提供了可能性。比如谷歌輸入法的Gboard 系統(tǒng),把多個裝有Gboard 的設(shè)備組成聯(lián)邦,融合多方數(shù)據(jù)構(gòu)建聯(lián)邦學(xué)習(xí),有效提高了輸入法對不同行業(yè)以及輸入習(xí)慣的用戶的輸入詞預(yù)測任務(wù)的準(zhǔn)確率。因此聯(lián)邦學(xué)習(xí)隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展以及隱私保護(hù)觀念的深入,愈發(fā)具有巨大的潛力和潛在價值[114]。
跨域推薦 聯(lián)邦學(xué)習(xí)在跨領(lǐng)域推薦也展現(xiàn)出了巨大的前景。比如視頻網(wǎng)站和廣告商的跨領(lǐng)域合作,提高雙方的營收和用戶活躍度;又比如網(wǎng)購平臺與社交平臺的合作,社交平臺提供用戶社交活動中出現(xiàn)的商品類別和社交圈特征等,網(wǎng)購平臺提供商品信息和用戶購買記錄等,雙方合作可以同時提高網(wǎng)購平臺和社交平臺針對用戶的商品及服務(wù)的推薦準(zhǔn)確度。
多方推理 傳統(tǒng)的機(jī)器學(xué)習(xí)算法的推理過程是基于一個集中式模型進(jìn)行的,聯(lián)邦學(xué)習(xí)的出現(xiàn)使得多方推理成為可能。多方推理是指各方不需要進(jìn)行數(shù)據(jù)以及學(xué)習(xí)信息的交換,僅使用多方的本地模型進(jìn)行聯(lián)邦推理。此應(yīng)用場景下,能更進(jìn)一步地保護(hù)各方的數(shù)據(jù)和隱私安全,同時讓推理過程融合更多的知識,提高推理結(jié)果的可靠性。
聯(lián)邦學(xué)習(xí)雖然能有效解決數(shù)據(jù)孤島和隱私保護(hù)的問題,同時也具有巨大的發(fā)展?jié)摿蛻?yīng)用價值,但也面臨著巨大的挑戰(zhàn)。
1)參與方難題。
作為聯(lián)邦學(xué)習(xí)的成員,參與方是聯(lián)邦學(xué)習(xí)的主要成員也是聯(lián)邦學(xué)習(xí)的基礎(chǔ),但聯(lián)邦學(xué)習(xí)在參與方層面存在的難題也不少,目前最主要存在的是參與方激勵以及參與方選擇等難題。
參與方激勵難題指的是如何吸引更多的參與方參與到聯(lián)邦學(xué)習(xí)中,是限制聯(lián)邦學(xué)習(xí)系統(tǒng)中的數(shù)據(jù)規(guī)模和數(shù)據(jù)多樣性的提高以及聯(lián)邦學(xué)習(xí)模型性能提升的關(guān)鍵。因此聯(lián)邦學(xué)習(xí)面臨的挑戰(zhàn)還包括如何建立一個完善的激勵機(jī)制和分配機(jī)制,鼓勵更多參與方的加入[115]。
其次,聯(lián)邦學(xué)習(xí)還存在著如何識別誠實(shí)但好奇的半誠實(shí)參與方以及惡意的參與方,如何選擇合適的參與方等難題。目前的聯(lián)邦學(xué)習(xí)方法中,所有參與方都是無差別地參與到聯(lián)邦學(xué)習(xí)中;但是,對于一個參與方來說,可能并不是所有的其他參與方的模型信息對它都是有幫助的。因此研究一種可行且可信的誠實(shí)參與方識別算法,讓參與方在學(xué)習(xí)過程中可以自主地按需選擇若干個安全的其他參與方的模型信息進(jìn)行本地更新,也是聯(lián)邦學(xué)習(xí)需要解決的問題之一。
2)算力難題。
聯(lián)邦學(xué)習(xí)雖然可以在保護(hù)各方隱私的前提下,將多個設(shè)備聯(lián)合在一起進(jìn)行訓(xùn)練,有效提高了模型性能;然而在當(dāng)今移動設(shè)備的算力下,僅有部分小運(yùn)算量的算法如邏輯回歸等可在設(shè)備端運(yùn)行,限制了主流的包含前后反饋過程的神經(jīng)網(wǎng)絡(luò)的實(shí)施。這也是聯(lián)邦學(xué)習(xí)面臨的巨大挑戰(zhàn)之一[116]。
3)通信難題。
在聯(lián)邦學(xué)習(xí)的過程中,各方之間需要頻繁交換加解密以及模型相關(guān)的數(shù)據(jù),而協(xié)調(diào)方往往需要等待所有參與方的中間數(shù)據(jù)都返回后才能進(jìn)行安全聚合或其他數(shù)據(jù)處理,這對通信提出了較高的要求。如何提高通信信道的質(zhì)量和容量,成為限制聯(lián)邦學(xué)習(xí)發(fā)展的難題之一[117]。
4)聚合難題。
在聯(lián)邦學(xué)習(xí)中,存在一個協(xié)調(diào)方對所有參與方的數(shù)據(jù)進(jìn)行安全聚合和運(yùn)算等。目前的聯(lián)邦學(xué)習(xí)算法的常見聚合方式有FedAvg 平均聚合以及FedProx 異構(gòu)聚合,但事實(shí)證明以上的聚合方法都會使得大部分聯(lián)邦學(xué)習(xí)模型相較于集中式模型是有損的。其次,如何使得主服務(wù)器可異步地聚合各參與方的信息,提高參與方中途退出學(xué)習(xí)的應(yīng)對能力,也是聯(lián)邦學(xué)習(xí)亟須解決的難題之一[118]。隨著技術(shù)的發(fā)展,目前也存在一些無損的聯(lián)邦學(xué)習(xí)模型,如縱向聯(lián)邦樹模型SecureBoost;可惜的是,目前的縱向聯(lián)邦學(xué)習(xí)還存在一個巨大的問題——預(yù)測難題。
5)預(yù)測難題。
在縱向聯(lián)邦學(xué)習(xí)中,只有協(xié)調(diào)方得知的是整個聯(lián)邦的結(jié)構(gòu),而參與方得知的是與其數(shù)據(jù)特征相關(guān)的子模型的結(jié)構(gòu)。因此在聯(lián)邦預(yù)測過程中,需要協(xié)調(diào)方與參與方共同合作才能預(yù)測出新樣本的標(biāo)簽。一旦某個參與方退出聯(lián)邦,該方所掌握的子樹結(jié)構(gòu)也會隨之消失,嚴(yán)重影響聯(lián)邦預(yù)測過程[119]。
6)中心方等待聚合難題。
在目前的聯(lián)邦學(xué)習(xí)方法的學(xué)習(xí)中,中心方需要等待所有的參與方模型信息返回后才會進(jìn)行新一輪的信息聚合。如遇到參與方掉線或通信阻滯等問題,會導(dǎo)致中心方陷入無限的等待過程中,嚴(yán)重影響模型聚合以及聯(lián)邦學(xué)習(xí)的效率。因此,如何提出一種能保證聯(lián)邦學(xué)習(xí)效率和效果的中心方等待聚合的策略,也是聯(lián)邦學(xué)習(xí)面臨的挑戰(zhàn)。
數(shù)據(jù)確權(quán)和隱私保護(hù)降低了數(shù)據(jù)流通性,一定程度導(dǎo)致了數(shù)據(jù)孤島的問題。聯(lián)邦學(xué)習(xí),作為一種能在保護(hù)隱私安全和數(shù)據(jù)安全前提下解決數(shù)據(jù)孤島問題的解決方案愈受關(guān)注?;诖耍U述了機(jī)器學(xué)習(xí)發(fā)展歷程中的三大階段,呈現(xiàn)出聯(lián)邦學(xué)習(xí)出現(xiàn)的歷史必然性。從聯(lián)邦學(xué)習(xí)的定義到分類,再細(xì)化到橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí),總結(jié)了聯(lián)邦學(xué)習(xí)的概念和技術(shù);同時介紹了聯(lián)邦學(xué)習(xí)的安全模型和目前主流的隱私保護(hù)技術(shù)。為了使聯(lián)邦學(xué)習(xí)理論能落地到實(shí)際的開發(fā)與應(yīng)用中,介紹了現(xiàn)有常見的開源框架,并對聯(lián)邦學(xué)習(xí)的巨大潛力和可行的應(yīng)用場景作出了總結(jié)與展望。但聯(lián)邦學(xué)習(xí)同時還面臨著巨大的挑戰(zhàn)——參與方難題、算力難題、通信難題、聚合難題、預(yù)測難題以及中心方等待聚合難題等六大難題。
同時,隨著新技術(shù)的發(fā)展,聯(lián)邦學(xué)習(xí)未來也可融合更多新技術(shù)來解決更多的技術(shù)難題。比如,借鑒安全多方計(jì)算中電子選舉的技術(shù)來實(shí)現(xiàn)聯(lián)邦多方推理。其次,在智能體與環(huán)境交互的領(lǐng)域,強(qiáng)化學(xué)習(xí)占據(jù)著相當(dāng)重要的地位,然而目前聯(lián)邦學(xué)習(xí)的學(xué)習(xí)模式尚未覆蓋強(qiáng)化學(xué)習(xí),因此如何結(jié)合強(qiáng)化學(xué)習(xí)理論和隱私保護(hù)技術(shù)來實(shí)現(xiàn)聯(lián)邦強(qiáng)化學(xué)習(xí),也將成為重要的研究方向之一。另外值得提出的是,聯(lián)邦學(xué)習(xí)理論中的隱私保護(hù)機(jī)制也有一定的研究空間,即如何使用更加安全的隱私保護(hù)技術(shù)(如區(qū)塊鏈技術(shù)、后量子密碼算法等)來保證聯(lián)邦系統(tǒng)的安全性。
總而言之,在如今強(qiáng)調(diào)數(shù)據(jù)確權(quán)和隱私保護(hù)的時代背景下,聯(lián)邦學(xué)習(xí)具有巨大的前景,但同時也存在許多技術(shù)攻關(guān)和技術(shù)融合的突破點(diǎn),望綜述能為聯(lián)邦學(xué)習(xí)領(lǐng)域的研究提供一定的幫助和啟發(fā)。