
最近、Yang Qiang 教授は、SDBD2020 Computing Power Online Forum で、フェデレーテッド ラーニングは単なるテクノロジーではなく、オープンソース エコシステムの確立でもあると指摘しました。フェデレーテッド ラーニングはオープン データ アイランドへの架け橋として、データ プライバシー、セキュリティ、規制要件を満たしながら、人工知能システムが独自のデータをより効率的かつ正確に使用できるようにします。
単刀直入に言うと、Guo Jia が今号のコンピューティング パワー プライバシー データ セキュリティ コラムに特別に招待され、3 つの大きな質問をし、サードパーティやコンポーネント化のないフェデレーテッド ラーニング テクノロジーの将来を大胆に構想しています。
副題
3つの質問
1) federated learningの第三者コーディネーターは批判されていませんか?
2) 銀行のような機関に入った場合、それが注文された製品の場合、どのようにして指導者を説得できますか?
3) 組織がモデリング プラットフォームやモデリング ソリューションを購入したという事実は、組織内のエンジニアが役に立たないことを意味するのでしょうか?
副題
「中立」の第三者は存在しない
現在市場に出回っているプライバシー コンピューティング製品のほとんどには、サードパーティが存在するか、そのうちの 1 つがサードパーティの役割を果たしています。
第三者 C は最初に同じ公開鍵を計算 (データ) 当事者 A と B に割り当て、第三者 C は対応する秘密鍵を保持し、当事者 A と当事者 B はそれぞれ自分のデータに対して対応する計算を行います。中間結果は公開鍵で暗号化され、その暗号文が第三者 C に送信され、第三者 C は秘密鍵を使用してすべての当事者からの中間結果の暗号文を復号し、各当事者の中間結果の平文を作成し、完全な中間結果を要約します。このプロセスは、終了条件が満たされるまで繰り返し繰り返されます。
最終結果から判断すると、第三者Cは参加手続き中に得るべきではない情報を入手したことになります。この情報が他の参加者の個人データを公開するかどうかは、実行中のアルゴリズム自体の構造に関連しています。たとえば、ロジスティック回帰アルゴリズムでは、参加者は自身のデータに基づいて内積を計算し、それを暗号化してサーバーに送信します。内積データが元のデータを十分にカバーしているため、内積結果は元のデータを取得できません。
ただし、すべてのアルゴリズムが、関係者の元のデータを公開することなく、ロジスティック回帰問題のように動作する中間結果を得るわけではありません。
サードパーティの調整により、プロトコルの設計と実装に確かに大きな利便性がもたらされました。しかし実際には、第三者機関の設立自体に比較的多額の費用がかかります。いわゆる同時第三者機関については、プロセス全体に参加したのは 2 者のみでしたが、実際には第三者との解決において問題が解決されたわけではなく、そのうちの 1 つの情報が依然として漏洩の危険にさらされています。
サードパーティが参加するスキームと比較して、サードパーティが参加しない MPC に基づくスキームは、プロトコル設計の最初からコーディネーターを放棄します。
理論上、MPC プロトコルでは、参加者は自身の計算結果の入力と出力以外に追加情報を取得できないことが要求されます。 MPC は参加者間の情報のやり取りのみを行い、プロトコル実行中の対話プロセスによって参加者の個人データが漏洩することはありません。これは、基礎となるプロトコル設計によって保証されています。たとえば、難読化された回路では、参加者はそれぞれの入力をランダム キーにマッピングし、難読化された真理値表を使用して参加者の入力と出力の間の関係を維持します。すべての関係者は、入出力データを使用せずに、真理値表に対応する暗号文のみを操作します。
一般に、サードパーティの参加がない MPC に基づくスキームは、参加者のプライバシー データの保護においてより徹底していますが、サードパーティの参加があるスキームは、サードパーティの信頼性や中間結果の構造に依存する必要があります。データプライバシーのセックスを確保します。つまり、両者が信頼できる第三者を確立できない場合、第三者の参加のない MPC に基づくスキームがセキュリティの第一の選択肢となります。
Fushu の今後の Avatar 2.0 メジャー バージョンは、MPC の核となるアイデアに基づいており、基礎となる基本的な演算子と単純な関数の計算から始まり、最終的にサードパーティなしで製品のアップグレードを完了します。
副題
Dos から Windows への革命: IME
私は国内の競合製品に注目してきましたが、現在、多くのメーカーが顧客を巻き込んでいる非常に重要な理由は、製品のインタラクション体験です。私は、銀行レベルの顧客は、Dos と Windows の間で Windows を使用することを選択する必要があると考えています。 (リーダーは間違いなく、より明確に見えるものを好むため)。現時点で実現できるフェデレーテッド ラーニング プラットフォームの多くはまだ「Dos」レベルであり、少し優れたものでは「Windows 95」に相当します。
統合環境の場合は、プロセスがビジネスとなる、カプセル化され、よりコンポーネント化された IDE を好みます。フェデレーションラーニングモデリングプラットフォーム、統合モデリング環境IME(Integrated Modeling Environmental)の概念を再定義したいと考えています。
コンポーネント化は IME の最大の特徴であり、私はこれをお客様に紹介する際に、透過的なプロセス、上位レベルと下位レベル間の結合の低さ、およびスケーラブルなアルゴリズムという言葉を使いたいと思います。連合学習プラットフォームには、暗号化コンポーネント、復号化コンポーネント、通信コンポーネント、アルゴリズム コンポーネントなどの非常に重要なコンポーネントがあります。フェデレーテッド ラーニング プラットフォームの顧客は、スケーラブルでコンパイル可能なアルゴリズムに集中できます。
独立性: 私たちのプロジェクト、アプリケーション、製品は実際には複数のコンポーネントに分割でき、各コンポーネントは機能を担当し、各コンポーネントは独立した形式で存在します。
完全: 各コンポーネントには完全なローカル機能があり、コンポーネントは互いに独立しています。
自由な組み合わせ: コンポーネントを自由に組み合わせることで、完成した製品、アプリケーション、プロジェクトを形成できます。
社内人材の変化、事業の拡大、ユーザーニーズの変化に直面して、コンポーネント化は膨大な開発ニーズに応えるだけでなく、開発者、ユーザー、アプリケーションコンポーネント、情報リソース間の相互コミュニケーションも実現します。生産ラインの鍵、それが唯一の方法です。
コンポーネント化により、ある程度プログラミングスキルを持たないビジネスモデリングエンジニアの敷居が下がります。コンポーネント化に基づいて、ユーザーはワークベンチ上でさまざまなコンポーネントをドラッグ アンド ドロップするだけで柔軟な組み合わせや接続を実現し、パーソナライズされたモデリング プロセスを可能にします。
さまざまなユーザーのニーズに直面すると、単一のコンポーネントまたは部分的なコンポーネントのアーキテクチャは役に立たず、問題の核心を実際に解決できないことがよくあります。そのため、標準と仕様を組み合わせて製品全体を構築し、最終的に大規模なソリューションを提示する方法は次のとおりです。ユーザーとそれぞれの基本モジュールの数 独立した完全な自由に組み合わせ可能なモジュールを備えた製品は、コンポーネント開発の重要な核心です。
あなたの答え
記事の最後に書かれているので、記事の冒頭にある 3 つの質問に答えてください。
1) federated learningの第三者コーディネーターは批判されていませんか?
回答: 銀行などの顧客が第三者を認識している場合、第三者を回避できるかどうかを必ず尋ねます。そこで、風習アバターでは数カ月をかけて克服し、第三者抜きの連合学習を実現しました。
2) 銀行のような機関に入った場合、それが注文された製品の場合、どのようにして指導者を説得できますか?
回答: 説得するのは難しいです。フェデレーション ラーニングは本質的に明確に説明するのが困難です。グラフィックがあると、物事を言いやすくなるはずです。
3) 組織がモデリング プラットフォームやモデリング ソリューションを購入したという事実は、組織内のエンジニアが役に立たないことを意味するのでしょうか?
回答: フェデレーテッド ラーニング プラットフォームの構築にパートナーが実際に参加できるようにします。ビジネスに近いアルゴリズム コンポーネントをオープンにすることがより適切です。エンジニアはプロトコル標準に従って、自分のビジネスに適したアルゴリズムを作成できます。真実を理解できますか?
テクノロジーからビジネスへの転身が得意な小学生。インターネットビッグデータ業界で 10 年近くの経験があり、上海大直志、平安、迪蔡でビッグデータアーキテクトおよびシニアアナリストとして勤務し、金融テクノロジーに関する深い研究を行っています。
現在は、Fushu Technology のシニア ディレクターとして、プライバシー コンピューティング ソリューションとビジネスの実装を担当しています。
郭佳
データ プライバシー、データ セキュリティ共有テクノロジー、その他の分野に関して独自の見解をお持ちの場合は、ぜひご貢献ください。
提出メールアドレス: hehaohua3h@163.com