聯邦學習的下一代技術趨勢:無第三方和組件化
算力智库
2020-09-23 03:05
本文约2602字,阅读全文需要约10分钟
聯邦學習是新興的人工智能基礎技術,在2016 年由谷歌最先提出,是一種在不交換數據樣本的情況下,多個分散的邊緣設備或服務器上訓練算法的技術。聯邦學習作為破解智能時代和隱私保護的

近日,楊強教授在SDBD2020·算力在線論壇中指出聯邦學習不僅僅是技術,更是開源生態的建立。作為打開數據島的橋樑,聯邦學習在滿足數據隱私、安全和監管要求的前提下,讓人工智能係統能夠更加高效、準確的共同使用各自的數據。

二級標題

二級標題

三個問題

1)聯邦學習的第三方協調器難道不是詬病嗎?

2)進銀行這樣的機構,如果是敲命令行的產品,怎麼可能說服領導?

二級標題

二級標題

無第三方才“中立”

目前市場上的隱私計算產品,大多是有第三方存在,或者由其中某一方兼任第三方的。

第三方C在最開始為計算(數據)雙方A和B分配同一份公鑰,第三方C持有對應的私鑰;A方和B方分別就自己的數據作相應的計算,將基於己方數據的中間結果用公鑰加密,並將密文發送給第三方C;第三方C使用私鑰解密來自各方的中間結果密文獲得各方的中間結果明文,並彙總得到完整的中間結果。這一過程會反复迭代,直至滿足結束條件。

從最終結果來看,有第三方C在參與過程之中,獲得了自己本不該獲得的信息。而這些信息是否暴露其他參與方的隱私數據,與運行的算法本身結構有關:例如在邏輯回歸算法中,參與方計算出基於己方數據的內積,並將其加密發送給協調方,協調方得到該內積結果並不能得到原來的數據,這是因為內積數據很好地掩蓋了原有數據。

但是,並不是所有算法的中間結果都能像邏輯回歸問題一樣——不暴露參與方的原始數據。

第三方的協調,確實為協議的設計和實現帶了很大的便利。但是實際上第三方本身的建立是需要較大成本。而所謂的兼任第三方,雖然整個過程中只有兩方參與,但並沒有從實際上解決有第三方的方案中存在的問題——其中一方的信息仍存在暴露的危險。

相比有第三方參與的方案,基於MPC無第三方參與的方案從協議設計之初就摒棄了協調方。

MPC協議在理論上要求參與方除了己方輸入和己方計算結果輸出之外,並不能獲得額外的信息。 MPC只有參與方之間的信息交互,並且協議執行期間的交互過程不會洩漏參與方的隱私數據。這是由協議設計的底層來保證的。例如,在混淆電路中,參與方會將各自的輸入映射成為隨機密鑰,同時用混淆真值表來保持參與方輸入、輸出之間。各方交互的只是關於真值表對應的密文,而不包含任何輸入、輸出數據。

總的來說,基於MPC無第三方參與的方案對於參與方的隱私數據的保護更加徹底,而有第三方參與的方案需要依賴於第三方的可信性或者中間結果的結構才能保證數據的隱私性。也就是說,當雙方無法建立可信第三方時,基於MPC無第三方參與的方案將會是安全的首要選擇。

Dos到Windows的革命:IME

二級標題

Dos到Windows的革命:IME

一直關注國內的競品,目前很多廠商被客戶糾結的一個很重要的原因是產品交互體驗!我相信任何一個銀行級別的客戶在Dos和Windows之間,一定選擇用Windows。 (因為領導肯定喜歡更加看得清楚的東西)。目前能做到的一大批聯邦學習平台,還處於“Dos”水平,稍微好一點的,相當於“Windows 95”。

對於集成環境,我們更喜歡封裝的更組件化的IDE,流程即業務。我想重新定義一個聯邦學習建模平台的概念,集成建模環境IME(Integrated modeling environment)。

組件化是IME的最大特點,我喜歡用幾個詞彙來介紹給客戶:過程透明化、上下低耦合、算法可擴展。聯邦學習平台有非常重要的組件,比如加密組件、解密組件、通信組件、算法組件等等。讓聯邦學習平台客戶專注於算法,可擴展、可編譯。

獨立:我們的項目、應用、產品,其實可以拆分成多個組件,每個組件負責一項功能,每個組件都以獨立的形式存在。

完整:每個組件具備完整的局部功能,組件間互相獨立。

自由組合:通過將組件自由組合,可以構成完整的產品、應用、項目。

在面對內部人員的變更、業務的拓展、用戶需求的變化時,組件化既滿足龐大的開發需求,同時能實現開發人員、用戶、應用組件、信息資源互通,也許,組件化是生產流水線的必經之路。

組件化在一定程度上降低了不具備編程能力的業務建模工程師的門檻。在組件化地基礎上,用戶可在工作台簡單地拖拽各種組件,實現靈活組合和連接,讓個性化建模流程成為可能。

你的答案

你的答案

寫在結尾,回答一下文章開頭的三個問題:

1)聯邦學習的第三方協調器難道不是詬病嗎?

答:銀行這樣的客戶,如果意識到第三方,他一定會說能不能不要第三方。所以,富數Avatar經歷數月攻克,實現了無第三方的聯邦學習。

2)進銀行這樣的機構,如果是敲命令行的產品,怎麼可能說服領導?

答:很難說服,聯邦學習本來就很難說清楚。有圖形,一定是容易說事情。

3)機構採購了建模平台甚至建模方案,是不是意味著自己的工程師成為雞肋?

答:讓合作夥伴真正參與聯邦學習平台建設,更合適的是把和業務更近的算法組件開放出去,你的工程師可以根據協議標準,寫適合自己業務的算法。你能體會其中的道理嗎?

自詡從技術走向業務的小學生。近十年互聯網大數據行業經驗,先後就職於上海大智慧、平安、挖財,任職大數據架構師、資深分析師等職位,對金融科技有深入研究。

目前任職富數科技高級總監,負責隱私計算的解決方案與業務落地。

郭嘉

如果您對數據隱私、數據安全共享技術等領域有獨到觀點分享,歡迎投稿!

投稿郵箱:hehaohua3h@163.com


算力智库
作者文库