다자간 보안컴퓨팅이 퀀트 투자 리서치를 만나면 시장을 정확히 예측할 수 있을까?
算力智库
2020-08-14 04:23
本文约3017字,阅读全文需要约12分钟
양적 투자는 초과 수익을 가져올 수 있는 다양한 "높은 확률" 전략을 찾기 위해 양적 모델과 데이터에 의존합니다.

다자간 보안 컴퓨팅 기술이 양적 투자 연구를 만났을 때 투자 연구 기관은 어떻게 데이터의 가치를 충분히 활용할까요? Guo Jia는 빅 데이터의 양적 모델링과 다자간 보안 컴퓨팅 기술과 양적 투자 연구 작업의 결합을 탐구하기 위해 컴퓨팅 파워 개인 정보 데이터 보안 칼럼에 특별히 초대되었습니다.

보조 제목

빅데이터의 양적 논리

투자 리서치 정보는 데이터 개방 정도에 따라 공개 데이터, 준공개 데이터, 비공개 데이터의 세 가지 범주로 간단하게 나눌 수 있습니다.

  • 잘 알려진 공공 데이터는 주가, K-라인 차트 등과 같이 언제든지 볼 수 있는 데이터입니다.

  • 준공개 데이터는 우리가 얻을 수 있는 데이터를 말하지만 포괄적이지는 않습니다.예를 들어 실시간 자본 흐름을 언제든지 얻을 수 있지만 웹 사이트는 이전 데이터를 공개하지 않습니다.

  • 비공개 데이터, 즉 다른 회사의 내부 데이터 및 시장의 주식과 관련된 증권 거래소는 외부에 제공될 수 없습니다.

정량적 투자 개념을 도입하다 정량적 투자는 단순히 데이터에서 패턴을 찾는 것입니다. 빅 데이터는 양적 투자의 새로운 문을 열었습니다.양적 거래에 빅 데이터 기술을 도입하면 방대한 데이터에 숨겨진 모든 정보를 완전히 마이닝하여 금융 및 경제 활동을 예측할 수 있습니다.거래 전략을 동적으로 업데이트하여 최상의 예측 효과를 얻을 수 있습니다.

가격 또는 재무 데이터를 기반으로 하는 모든 종류의 전통적인 양적 지표는 특정 시차가 있을 것이며 산업과 시장을 이해하기 위해 더 많은 선도적인 수단을 사용하는 것은 불가능합니다. 빅데이터 기술을 활용한 업계와 개인의 주식 판단은 이런 상황을 어느 정도 개선할 수 있다. 검색 요인을 활용해 투자자 심리를 파악하고, 전자상거래 데이터를 활용해 다양한 산업의 펀더멘탈 트렌드를 실시간으로 파악하고, 빅브이 데이터를 활용해 집단적 지혜를 모으는 등 이론적으로 미래 시장 상황을 예측하는 빅데이터로 활용할 수 있다. 인터넷 금융의 빅데이터를 종목선정 요인으로 모델에 도입하는 것은 자산운용기관이 지수투자에서 종목선정 논리를 재구성하는 것을 대표한다.

보조 제목

다자간 보안 컴퓨팅의 정량적 이점

사실 귀중한 데이터는 타인의 품에 안겨 있는 경우가 많은데, '신체적 접촉' 없이 '영적 공유'만 수행하는 방법은 데이터 애플리케이션 보안을 위한 현재 규정 준수 요구 사항입니다. 프라이버시 컴퓨팅 기술은 숫자를 잘 사용하는 이 문제를 해결합니다. 자신의 프라이빗 데이터를 보유한 다수의 참여자가 공동으로 계산 로직(예: 최대값 계산)을 실행하고 계산 결과를 얻음 각 당사자가 보유한 프라이빗 데이터 정보는 각 당사자가 보낸 메시지에서 유추할 수 없습니다. 각 참가자의 신원과 상태가 동일하며 공유 데이터 전략을 수립할 수 있습니다. 데이터는 전송되지 않기 때문에 데이터 개인 정보를 보호하고 법률 및 규정 준수 요구 사항을 충족하기 위해 사용자 개인 정보를 유출하거나 데이터 사양에 영향을 미치지 않습니다. 기술 용어를 다자간 보안 컴퓨팅이라고 합니다.

보조 제목

아바타 개막식

"이 사례는 타사 데이터가 얼마나 좋은지 증명하기 위한 것이 아니라 투자 연구의 데이터 보안 모델링 체계를 입증하기 위한 것입니다."

  • 리서치 대상 : 2019년 8월 5일 ~ 2020년 8월 4일 GEM 전종목

  • 연구 목표: 이 전략의 목표는 과거 데이터를 사용하여 각 주식이 해당일에 8% 이상 증가했는지, 즉 샘플 집중일에 8% 이상 주식이 증가했는지, y를 예측하는 것입니다. 값은 1이고 그렇지 않으면 y 값은 0입니다.

  • 연구 변수

  • 연합학습에서의 Node A 데이터 : 주식 이력 데이터(공개 데이터)를 통해, 요일별, 최근 3일 평균 수익률, 최근 7일 평균 수익률, 절대 수익률 최근 3일, 최근 7일 절대수익률, 최근 3일 평균수익률로 구성하였으며, 표준편차, 최근 7일 표준편차, 최근 3일 평균 이직률, 최근 7일 평균 회전율, 최근 3일 평균 거래량, 최근 7일 평균 거래량, 최근 3일 상승 일수, 최근 7일 상승 일수, 최근 3일 상승 일수 주가가 5% 이상 상승한 횟수, 최근 7일 동안 주가가 5% 이상 상승한 횟수, 지수가 5 이상 하락한 횟수 등 17개 지표가 있다. 지난 3일 동안 %, 그리고 지난 7일 동안 주식이 5% 이상 하락한 횟수입니다.

  • 연합학습에서의 Node B 데이터 : Baidu 검색에서 "GEM"이라는 키워드로 검색된 횟수, 오늘의 GEM 검색지수, 지난날의 GEM 검색지수, 최근 3일간의 GEM 검색지수, 지수는 최근 3일간 GEM 지수가 상승한 일수, 최근 7일간 GEM 지수가 상승한 일수, 외부 비공개 데이터 소스를 시뮬레이션하는 총 7개의 지표인 GEM 검색 인덱스.

요약하면 위의 24개 지표를 통해 전략을 구성하고, 모멘텀 전략과 반전 전략의 원리를 결합하여 Baidu 검색 횟수를 외부 데이터로, 시장 심리를 반영하는 변수로 사용하고, 이를 기반으로 입력 변수를 필터링한다. IV 및 기타 지표를 사용하여 하루 동안 주가가 8% 이상 상승했는지 예측하는 논리 회귀 모델을 구축합니다. Baidu Index의 역할을 확인하기 위해 전략은 다음과 같이 4가지 비교 모델을 공식화했습니다.

  • 샘플 세트는 모두 주식이며 Baidu 지수는 모델을 구축하는 데 사용되지 않습니다.

  • 샘플 세트는 모두 주식이며 Baidu 지수는 모델을 구축하는 데 사용됩니다(다른 입력 변수는 컨트롤 그룹 1과 일치함).

  • 샘플 세트는 Huaxing Yuanchuang이며 Baidu 지수는 모델 구축에 사용되지 않습니다.

  • 샘플 세트는 Huaxing Yuanchuang이며, Baidu 지수는 모델 구축에 사용됩니다.

(참고로, 바이두의 검색데이터는 크롤러로부터 보호되기 때문에 모든 정보를 크롤링할 수 없기 때문에 전체 주식데이터를 모델링하는 과정에서 "GEM"에 대한 검색횟수만 사용하고, 각 주식의 해당 주식은 사용하지 않습니다. 사용된 이름 검색 횟수; 샘플 집합이 Huaxing Yuanchuang인 경우에만 키워드로 Huaxing Yuanchuang을 검색한 횟수를 사용합니다.

  • 모델 결론

1) IV값에서 y값을 예측하는데 바이두지수 데이터가 더 중요한 역할을 했음을 유추할 수 있다. 모델계수는 차이넥스트 검색의 흥망성쇠를 알 수 있습니다 지난 3일 동안 GEM의 평균 검색값과 y 값과 양의 상관관계가 있습니다. , 8% 이상 증가하기가 더 쉽습니다. (구체적인 정보는 아래 그림 참조)

2) 샘플셋은 모두 주식이고 Baidu 지수를 이용하여 모델을 구축하였으며, AUC는 0.76, Baidu 지수를 이용하여 모델을 구축하지 않았으며(기타 입력 변수는 대조군 1과 일치함), AUC는 0.72로 Baidu 지수의 예측 효과가 크게 향상되었음을 나타냅니다. (구체적인 정보는 아래 그림 참조)

3) 샘플셋은 Huaxing Yuanchuang으로 Baidu 지수를 이용하여 모델을 구축하였으며, AUC는 0.74, Baidu 지수는 모델 구축에 사용하지 않았으며(기타 입력 변수는 대조군 1과 일치함), AUC는 0.73으로 Baidu 지수의 예측 효과가 향상되었음을 나타냅니다. (구체적인 정보는 아래 그림 참조)

위의 사례에 따르면 외부 비공개 정보를 추가하면 실제로 주식 예측 능력이 향상될 수 있음을 발견했습니다.

양적 투자의 경우 기존 양적 투자의 대부분의 시간이 데이터 정리 및 데이터 정렬에 낭비되고 외부 소스에서 얻은 데이터는 데이터 소스가 명확하지 않아 데이터 품질 및 데이터 보안에 큰 위험이 숨겨져 있습니다. 데이터 품질(데이터 업데이트가 시기 적절하지 않음, 데이터 수집 방법이 불법)으로 인해 부정적인 영향(개인 프라이버시 침해, 누락된 데이터로 인해 양적 전략이 견고하지 않음)이 있습니다.

시야

시야

작가

작가

현재 개인 정보 컴퓨팅 솔루션 및 비즈니스 구현을 담당하는 Fushu Technology의 선임 이사로 일하고 있습니다.

기술에서 비즈니스로의 전환을 자랑스럽게 생각하는 초등학생. 인터넷 빅 데이터 산업에서 거의 10년의 경험을 가지고 있으며, 그는 빅 데이터 설계자 및 선임 분석가로서 Shanghai Dazhizhi, Ping An 및 Micai에서 연속적으로 근무했으며 금융 기술에 대한 심층적인 연구를 수행했습니다.

현재 개인 정보 컴퓨팅 솔루션 및 비즈니스 구현을 담당하는 Fushu Technology의 선임 이사로 일하고 있습니다.

算力智库
作者文库