SDBD2020 は成功裡に開催され、コンピューティングパワーのシンクタンクが世界の業界リーダーと協力してインテリジェントなデータエンパワーメントを解釈しました
算力智库
2020-08-27 03:02
本文约2903字,阅读全文需要约12分钟
8月25日、第2回SIGKDD・SDBD2020のスマートデータとブロックチェーン応用に関する国際シンポジウムがオンラインで開催され、データエコノミーを背景としたデータガバナンスと共有のあり方

ACM SIGKDD2020 (Knowledge Discovery and Data Mining Conference) は、毎年世界トップ、最高レベル、最も影響力のあるデータサイエンスイベントであり、この SDBD 国際セミナーは、KDD カンファレンスのスマートデータやブロックチェーンなどの新興テクノロジーに焦点を当てています。 -シンガポール管理大学とハッシュパワーシンクタンクが主催。

ハッシュパワー・シンクタンクの創設者ヤン・リー氏は、「今年、国はデータを生産要素のレベルまで引き上げ、この産業の到来を示した。ハッシュパワー・シンクタンクは、スマートデータ、プライベートコンピューティング、そして世界の優良企業を追跡してきた」と語った。ブロックチェーントラック。直接のオリジナルの詳細なレポートと調査レポートを通じて産業とエコロジーの発展を促進することを期待するアプリケーション。」

副題

データガバナンスはデジタルエコノミーの前提です

人工知能やブロックチェーンなどのテクノロジーはデータをスマートデータにしますが、いわゆるデータエコノミーはスマートデータを超えています。シンガポール管理大学の教授、Zhu Feida 氏は、テクノロジーによってデータがどのように「計算可能」になるかについて語る前に、データは資産であり、データは管理される必要があるという前提を認識する必要があると考えています。

しかし、そのような大前提さえ、人類が気づくまでには長い時間がかかりました。 Zhu Feida教授は、データエコノミーは3つの段階を経たと述べた。第 1 段階では、データは商業活動の副産物にすぎず、人々は過去を理解するためにデータをさらに活用します。第 2 段階はビッグデータとデータエコノミーの台頭であり、この段階ではデータは少数の企業によって独占され、利益を得ています。第 3 段階はデータ主導型経済であり、データがすべての組織を推進する共有資産になります。

BaseBit.ai の CEO、Luo Zhen 氏は、情報時代からスマート時代にかけて、機械やコンピューティング プログラムによるデータの利用が増え、機械がよりインテリジェントになると考えています。情報化時代の名残として、データには仮想的な再利用性、高い固定費、低い変動費などの独特の経済的特徴があり、プライバシー、コンプライアンス、機密性、セキュリティなどの非経済的側面にも現れます。 。

実際、人々はこれらのデータの特性を理解する過程で代償を払っており、ガバナンスのないデータ侵害事件は多大な損失を引き起こしています。

シンガポール国立大学のヘ・ビンシェン准教授は、データ漏洩はもはや孤立した事件ではなく、さまざまな業界で関連事件が起きていると述べた。教育、医療、エネルギー、健康などの分野では、各データ侵害によって生じる平均損失は少なくとも 500 万ドルに上ります。

こうしたマイナスのケースは、多大な経済的損失をもたらすだけでなく、データ共有に対する社会全体の意欲と信頼を奪い、ただでさえ基盤が弱いデータ共有をさらに困難なものにします。

Luo Zhen氏は、データは本質的に安全に共有できないが、データ価値の共有はデータ自体を共有することなく実現されるべきだと指摘した。

もちろん、これはさらに難しく、最も有名な障害はデータ アイランドです。 He Bingsheng教授は病院のデータを例に挙げ、病院が違えば患者も異なるが、実際には症例には多くの類似点があると述べた。病院、銀行、電子商取引企業のそれぞれのデータは、実際には同じ集団のさまざまな側面を把握しています。

Zhu Feida 教授の研究により、データ エコシステムには 2 つのボトルネックがあることが判明しました。最初の大きなボトルネックは、個人、企業、政府などのさまざまな役割の間に存在します。 2 番目に大きなボトルネックは、データ、モデル、アプリケーションの間に存在します。

個人と企業の間では、データ貢献者としてのユーザーは価値の分配から排除されるだけでなく、自分のデータに対する認識と管理が非常に限られており、プライバシー漏洩のリスクにさらされます。個人と政府の間にはプライバシーとデータ漏洩の懸念があります。制度上の理由から政府部門間には「データの高い壁」があり、企業間ではデータアイランドが一般的であり、企業と政府の間でデータを共有するインセンティブが不足しています。

さらに、データ側では、データの出所が不明で品質が低い、モデル側では、モデルの設計やトレーニング用に実際のユーザーデータを取得することが困難、アプリケーション側では、高度なモデルが不足しているという結果が発生します。低レベルのデータインテリジェンスで。

副題

データ共有: テクノロジーとシステムの二足歩行

あらゆる分野の専門家が到達した一般的なコンセンサスは、データの安全なフローと共有は、テクノロジーとシステムの 2 つのレベルで連携して行う必要があるということです。

技術レベルでは、あらゆる種類の最先端テクノロジーが開花しており、プライバシーとセキュリティ コンピューティングがデータ セキュリティの共有を可能にする総合的なソリューションであることがわかります。

Luo Zhen 氏は、現在普及しているプラ​​イバシーおよびセキュリティ コンピューティング テクノロジを、マルチパーティ セキュア コンピューティング MPC/準同型暗号化、フェデレーテッド ラーニング、セキュア サンドボックス コンピューティング/TEE の 3 つの主要なパスに分けています。彼はさらに、これら 3 つのパスの違いを要約しました。信頼の仮定が増加すると、計算の複雑さは減少します。さらに、プライバシーおよびセキュリティ コンピューティング テクノロジには、差分プライバシー、クラウド コンピューティング、ブロックチェーン、アンチニューラル ネットワークなどのテクノロジも含まれます。

WeBankの最高人工知能責任者であり、香港科技大学コンピューター工学部の主任教授であるYang Qiang氏は、羊の放牧を例に挙げてフェデレーテッド・ラーニングについて説明した。従来の方法では羊に餌を与えるためにさまざまな場所から草を集めてきましたが、これは準拠しておらず、プライバシーとデータセキュリティ保護の要件によりデータの取得が障害になっています。そして、連合学習は新しいアイデアを提供します。群れを動き回らせますが、草はその地域から出てこないので、飼い主はどの草を食べたかを知ることができません。

Tongdun Technology のパートナーであり、人工知能研究所の所長である Li Xiaolin 氏は、Tongdun Technology のナレッジ フェデレーションを紹介しました。このナレッジ フェデレーションは、階層フレームワーク システムを使用して、さまざまな安全なマルチパーティ アプリケーションをサポートし、データ セキュリティ交換プロトコルを通じて複数の参加者を効果的に活用します。データ、知識の共同創造、共有と推論、データの利用可能と不可視化。

参加した専門家は、データセキュリティ共有におけるブロックチェーンテクノロジーの価値にも焦点を当てました。

Qulian Technologyの副社長であるZhang Shuai氏は、データの権利確認と価値移転のための保証技術としてのブロックチェーンの最大の価値は、データの安全な共有を確保するためのデータ登録と交換プロセスの記録にあると述べた。アクセス権、アクセスロジック、支払う価格をブロックチェーン上に登録でき、スマートコントラクトにより完全自動化を実現します。

他のテクノロジーとの統合に関して、Zhang Shuai 氏は、ブロックチェーン自体はデータ共有を解決するものではありませんが、複数のテクノロジーの接着剤にはなり得ると考えています。モノのインターネットなどの他の垂直テクノロジーはデータに関連しており、ブロックチェーンはそれらを水平に結合できます。

Shanghai Wanxiang Blockchain Co., Ltd.の副総経理であり、Wanxiang Blockchain Laboratoryの所長であるDu Yu氏も同様の見解を表明した。同氏は、実際には企業や金融機関が取引記録や企業秘密を公開することはないと考えているが、どの企業も大量のデータを保有しており、データアイランドが存在するという。多くの共同作業の要件に直面する場合、ブロックチェーンは水平方向のデータ共有を支援し、孤立した島を結び付けることができます。

Treemap ブロックチェーン Conflux の共同創設者、Wu Ming 氏は、分散型台帳としてのブロックチェーン自体が、金融信用データなどの最も価値のあるデータを運ぶことができる信頼できるデータ キャリアであると信じており、したがって、ブロックチェーンとデータは切り離せないものであると考えています。伝送されるデータも認証できます。

Phala Network の CEO、Tong Lin 氏は、現在のチェーン上のデータの種類と量はオフチェーンのデータよりもはるかに少ないと指摘しました。チェーン上のデータの特徴は、可視の場合は利用可能で、不可視(暗号化データ)の場合は利用できないことですが、プライバシーとセキュリティのコンピューティングを使用することで、チェーン上のデータを利用可能および不可視にすることができます。 。

現在、さまざまな技術が初期着地を果たしています。

WeBankを例に挙げると、Tencent Tianyan Labと提携してTencent Medical Health-WeBank Joint Laboratoryを設立し、フェデレーテッドラーニングに基づいて開発された「脳卒中リスク予測モデル」の精度は80%を超え、予測指標は小規模病院モデル 10 ~ 20% 増加。

Yifang Jianshu 氏は、中国の健康および医療ビッグデータのパイロット都市の最初のバッチであるアモイのために、プライバシーおよびセキュリティ コンピューティング技術に基づくビッグ データ アプリケーションとオープン プラットフォームを構築し、医療ビッグデータ ガバナンスと階層型診断と治療のモデルを作成しました。

システムレベルでは、あらゆる分野の専門家が満場一致で法律、規制、基準の重要性を強調しました。

Nuowei Technology の創設者である Wang Shuang 氏は、データ共有にはテクノロジーに加えて法律と標準の推進が必要であり、データ生産要素の循環を共同で促進するためのデータの策定が必要であると述べました。

iFLYTEKビッグデータ研究所のエグゼクティブディレクターであるタン・チャン氏は、法規制の改善がまだ必要であり、データ生成要素の価格設定などの問題もまだ整備されていないこともあり、企業間での大規模なデータ共有は現実には稀であると率直に語った。問題は解決されており、データ市場が不足している。取引メカニズム、つまり関連インフラの改善が急務である。

「データの価値を解放せよ、ブロックチェーンの素晴らしい使い方とは」をテーマにしたラウンドテーブルディスカッションでは、KILTプロトコルの創始者であるインゴ・ルーベ氏がブロックチェーンのデータセキュリティについて法的な観点から考えた――何が安全なのか? 2012 年の GDPR 制定時にはブロックチェーンは考慮されていませんでしたが、ブロックチェーン上のデータ暗号化は最終的には解決可能な数学的問題であるため、依然として立法問題が最初に焦点を当てられるべきです。

算力智库
作者文库