Khi máy tính bảo mật đa bên đáp ứng nghiên cứu đầu tư định lượng, nó có thể dự đoán chính xác thị trường không?
算力智库
2020-08-14 04:23
本文约3017字,阅读全文需要约12分钟
Đầu tư định lượng dựa vào các mô hình và dữ liệu định lượng để tìm ra nhiều chiến lược "xác suất cao" có thể mang lại lợi nhuận vượt trội.

Khi công nghệ điện toán an toàn của nhiều bên gặp phải nghiên cứu đầu tư định lượng, các tổ chức nghiên cứu đầu tư sẽ khai thác đầy đủ giá trị của dữ liệu như thế nào? Guo Jia được mời đặc biệt cho chuyên mục bảo mật dữ liệu quyền riêng tư của sức mạnh điện toán để khám phá mô hình định lượng của dữ liệu lớn và sự kết hợp giữa công nghệ điện toán an toàn của nhiều bên và công việc nghiên cứu đầu tư định lượng.

tiêu đề phụ

Logic định lượng của dữ liệu lớn

Chúng ta có thể đơn giản chia thông tin nghiên cứu đầu tư thành ba loại theo mức độ mở của dữ liệu: dữ liệu công khai, dữ liệu bán công khai và dữ liệu không công khai.

  • Dữ liệu công khai, hiểu một cách nôm na, là dữ liệu có thể xem bất cứ lúc nào, chẳng hạn như giá cổ phiếu, biểu đồ đường K, v.v.;

  • Dữ liệu bán công khai đề cập đến dữ liệu mà chúng tôi có thể thu được nhưng không toàn diện, chẳng hạn như chúng tôi có thể thu được dòng vốn theo thời gian thực bất cứ lúc nào nhưng trang web sẽ không tiết lộ dữ liệu trước đó;

  • Dữ liệu không công khai, nghĩa là dữ liệu nội bộ của các công ty và sàn giao dịch chứng khoán khác liên quan đến cổ phiếu trên thị trường, không thể được cung cấp ra bên ngoài.

Giới thiệu một khái niệm đầu tư định lượng Đầu tư định lượng chỉ đơn giản là tìm các mẫu trong dữ liệu. Dữ liệu lớn đã mở ra một cánh cửa mới cho đầu tư định lượng. Sự ra đời của công nghệ dữ liệu lớn trong giao dịch định lượng có thể khai thác triệt để tất cả thông tin ẩn trong dữ liệu lớn để dự đoán các hoạt động kinh tế tài chính. Tự động cập nhật chiến lược giao dịch để đạt được hiệu quả dự báo tốt nhất.

Tất cả các loại chỉ số định lượng truyền thống, cho dù dựa trên giá cả hay dữ liệu tài chính, sẽ có độ trễ nhất định và không thể sử dụng các phương tiện hàng đầu hơn để hiểu ngành và thị trường. Các đánh giá cổ phiếu của ngành và cá nhân sử dụng công nghệ dữ liệu lớn có thể cải thiện tình trạng này ở một mức độ nhất định. Sử dụng các yếu tố tìm kiếm để nắm bắt tâm lý nhà đầu tư, sử dụng dữ liệu thương mại điện tử để biết xu hướng cơ bản của các ngành khác nhau trong thời gian thực và sử dụng dữ liệu V lớn để thu thập trí tuệ tập thể. Những loại dữ liệu lớn này về mặt lý thuyết có thể được sử dụng để dự đoán các điều kiện thị trường trong tương lai. Việc đưa dữ liệu lớn của tài chính Internet vào mô hình như một yếu tố lựa chọn cổ phiếu đại diện cho các tổ chức quản lý tài sản tái cấu trúc logic lựa chọn cổ phiếu trong đầu tư chỉ số.

tiêu đề phụ

Lợi thế định lượng của điện toán an toàn đa bên

Trên thực tế, dữ liệu quý giá thường nằm trong vòng tay của người khác, làm thế nào để chỉ thực hiện “chia sẻ tinh thần” mà không “tiếp xúc vật lý” là yêu cầu tuân thủ hiện nay đối với bảo mật ứng dụng dữ liệu. Công nghệ điện toán bảo mật giải quyết tốt vấn đề sử dụng số này. Nhiều người tham gia giữ dữ liệu riêng tư của riêng họ cùng thực hiện logic tính toán (chẳng hạn như tính toán giá trị lớn nhất) và thu được kết quả tính toán. Thông tin dữ liệu riêng tư do mỗi bên nắm giữ không thể được suy ra từ các tin nhắn được gửi bởi mỗi bên. Theo công nghệ này, danh tính và trạng thái của mỗi người tham gia là như nhau và có thể thiết lập chiến lược dữ liệu được chia sẻ. Vì dữ liệu không được truyền nên nó sẽ không làm rò rỉ quyền riêng tư của người dùng hoặc ảnh hưởng đến thông số kỹ thuật của dữ liệu, nhằm bảo vệ quyền riêng tư của dữ liệu cũng như đáp ứng các yêu cầu pháp lý và tuân thủ. Thuật ngữ kỹ thuật được gọi là điện toán an toàn đa bên.

tiêu đề phụ

Lễ ra mắt Avatar

"Trường hợp này không phải để chứng minh dữ liệu của bên thứ ba tốt như thế nào, mà để chứng minh sơ đồ mô hình hóa bảo mật dữ liệu của nghiên cứu đầu tư."

  • Đối tượng nghiên cứu: Tất cả các cổ phiếu trong GEM từ 05/08/2019 đến 04/08/2020

  • Mục tiêu nghiên cứu: Mục tiêu của chiến lược này là sử dụng dữ liệu lịch sử để dự đoán xem mỗi cổ phiếu có tăng hơn 8% trong ngày hay không, tức là cổ phiếu tăng hơn 8% vào ngày tập trung mẫu, y giá trị là 1, nếu không giá trị y là 0.

  • biến nghiên cứu

  • Dữ liệu nút A trong học tập liên kết: Thông qua dữ liệu lịch sử chứng khoán (dữ liệu công khai), tuần trong ngày, tỷ lệ hoàn vốn trung bình trong ba ngày qua, tỷ lệ hoàn vốn trung bình trong bảy ngày qua, tỷ lệ hoàn vốn tuyệt đối trong ba ngày qua, tỷ lệ hoàn vốn tuyệt đối trong bảy ngày qua và tỷ lệ hoàn vốn trong ba ngày qua được xây dựng. Độ lệch chuẩn, độ lệch chuẩn của bảy ngày qua, tỷ lệ doanh thu trung bình của ba ngày qua, trung bình tỷ lệ doanh thu trong bảy ngày qua, khối lượng giao dịch trung bình trong ba ngày qua, khối lượng giao dịch trung bình trong bảy ngày qua, số ngày tăng trong ba ngày qua, số ngày tăng trong bảy ngày qua, số ngày tăng trong ba ngày qua Có là 17 chỉ số bao gồm số lần cổ phiếu tăng hơn 5%, số lần cổ phiếu tăng hơn 5% trong bảy ngày qua, số lần chỉ số giảm hơn 5% trong ba ngày qua và số lần cổ phiếu giảm hơn 5% trong bảy ngày qua.

  • Dữ liệu nút B trong học tập liên kết: Dựa trên số lượng tìm kiếm với từ khóa "ĐÁ QUÝ" trong tìm kiếm Baidu, chỉ mục tìm kiếm GEM trong ngày, chỉ mục tìm kiếm GEM của ngày trước, chỉ mục tìm kiếm GEM của ba ngày qua, và chỉ số tìm kiếm GEM trong bảy ngày qua đã được xây dựng. Chỉ số, số ngày mà chỉ số GEM tăng trong ba ngày qua, số ngày mà chỉ số GEM tăng trong bảy ngày qua và mức tăng trong Chỉ số tìm kiếm GEM, tổng cộng có 7 chỉ số, mô phỏng các nguồn dữ liệu không công khai bên ngoài.

Tóm lại, chiến lược được xây dựng thông qua 24 chỉ số trên, kết hợp với nguyên tắc của chiến lược xung lượng và chiến lược đảo chiều, đồng thời sử dụng số lượng tìm kiếm Baidu làm dữ liệu bên ngoài, làm biến phản ánh tâm lý thị trường, sau đó lọc các biến đầu vào dựa trên IV và các chỉ báo khác để xây dựng mô hình Hồi quy logic dự đoán liệu cổ phiếu có tăng hơn 8% trong ngày hay không. Để xác minh vai trò của Baidu Index, chiến lược đã xây dựng bốn mô hình để so sánh, như sau:

  • Bộ mẫu là tất cả các cổ phiếu và chỉ số Baidu không được sử dụng để xây dựng mô hình

  • Bộ mẫu là tất cả các cổ phiếu và chỉ số Baidu được sử dụng để xây dựng mô hình (các biến đầu vào khác phù hợp với nhóm kiểm soát 1)

  • Bộ mẫu là Huaxing Yuanchuang và chỉ số Baidu không được sử dụng để xây dựng mô hình

  • Bộ mẫu là Huaxing Yuanchuang và Chỉ số Baidu được sử dụng để xây dựng mô hình

(Lưu ý, vì dữ liệu tìm kiếm của Baidu được bảo vệ chống lại trình thu thập thông tin nên không thể thu thập thông tin tất cả thông tin, do đó, trong quá trình mô hình hóa toàn bộ dữ liệu chứng khoán, chỉ số lượng tìm kiếm cho "ĐÁ QUÝ" được sử dụng và lượng hàng tương ứng của từng cổ phiếu không được sử dụng số lần tìm kiếm Tên được sử dụng; chỉ trong trường hợp tập hợp mẫu là Huaxing Yuanchuang, số lượt tìm kiếm Huaxing Yuanchuang làm từ khóa mới được sử dụng.)

  • kết luận mô hình

1) Từ giá trị IV, có thể suy ra rằng dữ liệu chỉ mục của Baidu có vai trò quan trọng hơn trong việc dự đoán giá trị y. Trong số đó, sự tăng trưởng và suy giảm của tìm kiếm ChiNext và giá trị trung bình của tìm kiếm ChiNext trong ba năm qua ngày có ý nghĩa hơn Hệ số mô hình có thể được sử dụng để biết sự tăng giảm của tìm kiếm ChiNext Nó có mối tương quan thuận với giá trị tìm kiếm trung bình và giá trị y của GEM trong ba ngày qua, nghĩa là giá trị càng cao , càng dễ tăng hơn 8%. (Xem hình bên dưới để biết thông tin cụ thể)

2) Bộ mẫu là tất cả các cổ phiếu, chỉ số Baidu được sử dụng để xây dựng mô hình và AUC là 0,76 và chỉ số Baidu không được sử dụng để xây dựng mô hình (các biến đầu vào khác phù hợp với nhóm kiểm soát 1) và AUC là 0,72, cho thấy dự đoán về chỉ số Baidu đã được cải thiện đáng kể. (Xem hình bên dưới để biết thông tin cụ thể)

3) Bộ mẫu là Huaxing Yuanchuang, sử dụng chỉ số Baidu để xây dựng mô hình và AUC là 0,74. Chỉ số Baidu không được sử dụng để xây dựng mô hình (các biến đầu vào khác phù hợp với nhóm kiểm soát 1) và AUC là 0,73, cho thấy dự đoán về chỉ số Baidu đã được cải thiện Hiệu ứng. (Xem hình bên dưới để biết thông tin cụ thể)

Theo các trường hợp trên, chúng tôi thấy rằng việc thêm thông tin không công khai bên ngoài thực sự có thể cải thiện khả năng dự báo chứng khoán.

Đối với đầu tư định lượng, phần lớn thời gian của đầu tư định lượng truyền thống bị lãng phí vào việc làm sạch dữ liệu và sắp xếp dữ liệu, và dữ liệu thu được từ các nguồn bên ngoài, do nguồn dữ liệu không rõ ràng, tiềm ẩn những nguy cơ tiềm ẩn lớn về chất lượng dữ liệu và bảo mật dữ liệu. do Chất lượng dữ liệu (cập nhật dữ liệu không kịp thời, phương pháp thu thập dữ liệu là bất hợp pháp) và có tác động tiêu cực (vi phạm quyền riêng tư cá nhân, chiến lược định lượng không mạnh mẽ do thiếu dữ liệu).

quan điểm

quan điểm

tác giả

tác giả

Hiện đang làm giám đốc cấp cao của Fushu Technology, chịu trách nhiệm về các giải pháp điện toán bảo mật và triển khai kinh doanh.

Một học sinh tiểu học tự hào về việc chuyển từ công nghệ sang kinh doanh. Với gần mười năm kinh nghiệm trong ngành dữ liệu lớn trên Internet, ông đã liên tục làm việc tại Shanghai Dazhizhi, Ping An và Micai, với tư cách là kiến ​​trúc sư dữ liệu lớn và nhà phân tích cấp cao, đồng thời có nghiên cứu chuyên sâu về công nghệ tài chính.

Hiện đang làm giám đốc cấp cao của Fushu Technology, chịu trách nhiệm về các giải pháp điện toán bảo mật và triển khai kinh doanh.

算力智库
作者文库