
マルチパーティのセキュア コンピューティング テクノロジーが定量的な投資研究に遭遇したとき、投資研究機関はデータの価値をどのように最大限に活用するのでしょうか? Guo Jia は、ビッグデータの定量的モデリングと、マルチパーティのセキュア コンピューティング テクノロジと定量的投資調査研究の組み合わせを探求するために、コンピューティング パワー プライバシー データ セキュリティに関するコラムに特別に招待されています。
副題
ビッグデータの定量的ロジック
投資調査情報は、データの公開度に応じて、公開データ、準公開データ、非公開データの 3 つのカテゴリに単純に分類できます。
周知のとおり、公開データとは、株価や K 線グラフなど、いつでも閲覧できるデータです。
準公開データとは、当社が取得できるものの包括的ではないデータを指し、例えば、リアルタイムの資金の流れはいつでも取得できますが、Web サイトでは以前のデータは公開されません。
非公開データ、つまり市場の株式に関連する他社や証券取引所の内部データは外部に提供できません。
定量的投資の概念を導入する 定量的投資とは、単にデータ内のパターンを見つけることです。ビッグデータはクオンツ投資に新たな扉を開きました。クオンツ取引におけるビッグデータ技術の導入により、金融経済活動を予測するために膨大なデータに隠されたすべての情報を完全にマイニングすることができます。取引戦略を動的に更新して最良の予測効果を得ることができます。
価格や財務データに基づくものであっても、あらゆる種類の従来の定量的指標には一定の遅れがあり、業界と市場を理解するためにこれ以上の有力な手段を使用することは不可能です。ビッグデータ技術を活用した業界や個別銘柄の判断は、この状況をある程度改善できる可能性がある。検索要素を活用して投資家心理を把握したり、ECデータを活用してさまざまな業界の基本的な動向をリアルタイムに把握したり、ビッグVデータを活用して衆知を集めたりするなど、理論的には将来の市況を予測することが可能です。インターネット金融のビッグデータを銘柄選択要素としてモデルに導入することは、運用機関がインデックス投資における銘柄選択ロジックを再構築することを意味します。
副題
マルチパーティセキュアコンピューティングの定量的な利点
実際、貴重なデータは他人の腕の中に眠っていることが多く、「物理的な接触」を行わずに「精神的な共有」のみを行う方法が、データ アプリケーションのセキュリティに関する現在のコンプライアンス要件です。プライバシー コンピューティング テクノロジは、数字をうまく利用するというこの問題を解決します。自身のプライベートデータを保有する複数の参加者が共同で計算ロジック(最大値の計算など)を実行して計算結果を取得する技術であり、各当事者が送信するメッセージから各当事者が保有するプライベートデータの情報を推測することはできません。各参加者のアイデンティティとステータスは同じであり、共有データ戦略を確立できます。データは転送されないため、データのプライバシーを保護し、法的およびコンプライアンスの要件を満たすために、ユーザーのプライバシーが漏洩したり、データの仕様に影響を与えたりすることはありません。専門用語では、マルチパーティ セキュア コンピューティングと呼ばれます。
副題
アバターのオープニングセレモニー
「この訴訟は、サードパーティデータがどれほど優れているかを証明するものではなく、投資調査のデータセキュリティモデリングスキームを実証するものです。」
調査対象:2019年8月5日から2020年8月4日までのGEM全銘柄
研究目的: この戦略の目標は、履歴データを使用して、各銘柄がその日に 8% を超える増加があるかどうか、つまり、サンプル濃度 y の日に 8% を超える株式の増加があるかどうかを予測することです。値は 1、それ以外の場合は y 値は 0 です。
研究変数
フェデレーテッド ラーニングのノード A データ: 株式履歴データ (公開データ)、その日の週、過去 3 日間の平均収益率、過去 7 日間の平均収益率、絶対収益率を通じて過去 3 日間、過去 7 日間の絶対収益率、および過去 3 日間の平均収益率を作成しました。標準偏差、過去 7 日間の標準偏差、過去 3 日間の平均回転率、過去 7 日間の平均出来高、過去 3 日間の平均取引高、過去 7 日間の平均取引高、過去 3 日間の上昇日、過去 7 日間の上昇日、過去 3 日間の上昇日株価が5%以上上昇した回数、過去7日間で株価が5%以上上昇した回数、指数が5%以上下落した回数など17の指標があります。過去 3 日間で株価が % 下落した回数、および過去 7 日間で株価が 5% を超えて下落した回数。
フェデレーテッド ラーニングのノード B データ: Baidu 検索でのキーワード「GEM」による検索数に基づいて、その日の GEM 検索インデックス、過去 1 日の GEM 検索インデックス、過去 3 日間の GEM 検索インデックス、指数、過去 3 日間で GEM 指数が上昇した日数、過去 7 日間で GEM 指数が上昇した日数、および過去 7 日間の GEM 検索指数を構築しました。 GEM 検索インデックス、合計 7 つの指標、外部の非公開データ ソースをシミュレートします。
要約すると、この戦略は、モメンタム戦略とリバーサル戦略の原則を組み合わせた上記 24 の指標を通じて構築され、Baidu の検索数を外部データとして市場センチメントを反映する変数として使用し、それに基づいて入力変数をフィルタリングします。 IV およびその他の指標を使用して、その日の株価が 8% 以上上昇したかどうかを予測する論理回帰モデルを構築します。 Baidu Index の役割を検証するために、戦略では比較として次の 4 つのモデルを策定しました。
サンプル セットはすべて株式であり、モデルの構築には Baidu インデックスは使用されません。
サンプル セットはすべて株式であり、モデルの構築には Baidu インデックスが使用されます (他の入力変数はコントロール グループ 1 と一致します)。
サンプル セットは Huaxing Yuanchuang であり、Baidu インデックスはモデルの構築に使用されません。
サンプル セットは Huaxing Yuanchuang で、モデルの構築には Baidu Index が使用されます。
(注、Baidu の検索データはクローラーから保護されているため、すべての情報をクロールすることはできません。そのため、完全な株式データをモデル化するプロセスでは、「GEM」の検索数のみが使用され、各株式の対応する株式は使用されません)名前の検索回数を使用。サンプル セットが華星元荘の場合のみ、キーワードとしての華星元荘の検索数が使用されます。)
モデルの結論
1) IV 値から、Baidu インデックス データが y 値を予測する上でより重要な役割を果たしていると推測できます。その中で、ChiNext 検索の成長と衰退、および過去 3 回の ChiNext 検索の平均値モデル係数は ChiNext 検索の上昇と下降を知るために使用できます 過去 3 日間の平均検索値および GEM の y 値と正の相関関係があり、値が大きいほど、8%以上増加することが容易になります。 (具体的な情報については、下の図を参照してください)
2) サンプル セットはすべて株式であり、Baidu インデックスを使用してモデルを構築し、AUC は 0.76 で、Baidu インデックスはモデルの構築に使用されません (他の入力変数はコントロール グループ 1 と一致します)、およびAUC は 0.72 で、Baidu インデックスの予測効果が大幅に改善されたことを示しています。 (具体的な情報については、下の図を参照してください)
3) サンプル セットは Huaxing Yuanchuang で、Baidu インデックスを使用してモデルを構築し、AUC は 0.74 です。Baidu インデックスはモデルの構築に使用されません (他の入力変数はコントロール グループ 1 と一致します)。 AUC は 0.73 で、Baidu インデックスの予測の効果が向上していることを示しています。 (具体的な情報については、下の図を参照してください)
上記の事例から、外部の非公開情報を追加することで株価予測能力が確かに向上することがわかりました。
クオンツ投資の場合、従来のクオンツ投資のほとんどの時間はデータのクリーニングとデータの並べ替えに無駄に費やされており、外部ソースから取得したデータは、データソースが不明確なため、データ品質とデータセキュリティに大きな潜在的な危険が潜んでいます。データの品質(データの更新がタイムリーではない、データの取得方法が違法)によるものであり、悪影響(個人のプライバシーの侵害、データの欠落により定量的戦略が堅牢ではない)があります。
見通し
見通し
著者
著者
現在は、Fushu Technology のシニア ディレクターとして、プライバシー コンピューティング ソリューションとビジネスの実装を担当しています。
テクノロジーからビジネスへの転身が得意な小学生。インターネットビッグデータ業界で 10 年近くの経験があり、上海大直志、平安、迪蔡でビッグデータアーキテクトおよびシニアアナリストとして勤務し、金融テクノロジーに関する深い研究を行っています。
現在は、Fushu Technology のシニア ディレクターとして、プライバシー コンピューティング ソリューションとビジネスの実装を担当しています。