SDBD2020 đã được tổ chức thành công và nhóm chuyên gia tư duy sức mạnh điện toán đã bắt tay với các nhà lãnh đạo ngành toàn cầu để diễn giải việc trao quyền dữ liệu thông minh
算力智库
2020-08-27 03:02
本文约2903字,阅读全文需要约12分钟
Vào ngày 25 tháng 8, SIGKDD·SDBD2020 Hội nghị chuyên đề quốc tế lần thứ 2 về Dữ liệu thông minh và Ứng dụng chuỗi khối đã được tổ chức trực tuyến, thảo luận về cách quản trị và chia sẻ dữ

ACM SIGKDD2020 (Hội nghị khám phá tri thức và khai thác dữ liệu) là sự kiện khoa học dữ liệu hàng đầu, cấp cao nhất và có ảnh hưởng nhất thế giới hàng năm. Hội thảo quốc tế SDBD này tập trung vào các công nghệ mới nổi như dữ liệu thông minh và chuỗi khối trong hội nghị KDD Hội thảo đặc biệt là đồng -do Đại học Quản lý Singapore và Hashpower Think Tank tổ chức.

Yan Li, người sáng lập Hashpower Think Tank, cho biết: "Năm nay, đất nước nâng dữ liệu lên mức các yếu tố sản xuất, đánh dấu sự xuất hiện của ngành. Hashpower Think Tank đã theo dõi dữ liệu thông minh, máy tính tư nhân và các công ty tốt trong theo dõi blockchain.Ứng dụng, hy vọng sẽ thúc đẩy sự phát triển của ngành công nghiệp và hệ sinh thái thông qua các báo cáo nghiên cứu và báo cáo chuyên sâu ban đầu.”

tiêu đề phụ

Quản trị dữ liệu là tiền đề của kinh tế số

Các công nghệ như trí tuệ nhân tạo và chuỗi khối làm cho dữ liệu trở thành dữ liệu thông minh, nhưng cái gọi là nền kinh tế dữ liệu vượt xa dữ liệu thông minh. Zhu Feida, giáo sư tại Đại học Quản lý Singapore, tin rằng trước khi nói về cách công nghệ có thể làm cho dữ liệu trở nên "tính toán được", người ta cũng phải nhận ra một tiền đề—dữ liệu là tài sản và dữ liệu cần được quản lý.

Tuy nhiên, ngay cả một tiền đề lớn như vậy cũng phải mất một thời gian dài con người mới nhận ra. Giáo sư Zhu Feida cho biết nền kinh tế dữ liệu đã trải qua ba giai đoạn. Trong giai đoạn đầu, dữ liệu chỉ là sản phẩm phụ của các hoạt động thương mại và mọi người sử dụng dữ liệu nhiều hơn để hiểu về quá khứ. Giai đoạn thứ hai là sự trỗi dậy của dữ liệu lớn và nền kinh tế dữ liệu, ở giai đoạn này, dữ liệu được độc quyền bởi một số ít công ty để hưởng lợi. Giai đoạn thứ ba là nền kinh tế dựa trên dữ liệu, nơi dữ liệu trở thành tài sản chung thúc đẩy tất cả các tổ chức.

Luo Zhen, Giám đốc điều hành của BaseBit.ai, tin rằng từ thời đại thông tin sang thời đại thông minh, dữ liệu đang được máy móc và các chương trình máy tính sử dụng nhiều hơn, giúp máy móc trở nên thông minh hơn. Là di tích của thời đại thông tin, dữ liệu có các đặc điểm kinh tế độc đáo, chẳng hạn như khả năng tái sử dụng ảo, chi phí cố định cao và chi phí biến đổi thấp, đồng thời dữ liệu cũng thể hiện ở các khía cạnh phi kinh tế như quyền riêng tư, tuân thủ, bảo mật và bảo mật. .

Trên thực tế, mọi người đã phải trả giá trong quá trình tìm hiểu các đặc điểm dữ liệu này và các trường hợp vi phạm dữ liệu mà không có sự quản lý đã gây ra tổn thất lớn.

He Bingsheng, phó giáo sư tại Đại học Quốc gia Singapore, cho biết rò rỉ dữ liệu không còn là sự cố riêng lẻ và có những sự cố liên quan trong nhiều ngành khác nhau. Trong các lĩnh vực như giáo dục, y học, năng lượng và sức khỏe, tổn thất trung bình do mỗi lần vi phạm dữ liệu gây ra ít nhất là 5 triệu USD.

Những vụ việc tiêu cực này không chỉ gây thiệt hại lớn về kinh tế mà còn tiêu tốn thiện chí và niềm tin của toàn xã hội đối với việc chia sẻ dữ liệu, khiến việc chia sẻ dữ liệu vốn đã yếu về nền tảng càng khó khăn hơn.

Luo Zhen đã chỉ ra rằng dữ liệu không thể được chia sẻ một cách an toàn về bản chất, nhưng việc chia sẻ giá trị dữ liệu nên được thực hiện mà không cần chia sẻ chính dữ liệu đó.

Tất nhiên, điều này thậm chí còn khó khăn hơn, trở ngại nổi tiếng nhất là đảo dữ liệu. Giáo sư He Bingsheng lấy dữ liệu của bệnh viện làm ví dụ và nói rằng các bệnh viện khác nhau có những bệnh nhân khác nhau, nhưng trên thực tế các ca bệnh lại có nhiều điểm giống nhau. Các bệnh viện, ngân hàng và công ty thương mại điện tử, dữ liệu tương ứng của họ thực sự nắm bắt các khía cạnh khác nhau của cùng một dân số.

Nghiên cứu của Giáo sư Zhu Feida cho thấy có hai điểm nghẽn trong hệ sinh thái dữ liệu. Nút cổ chai lớn đầu tiên tồn tại giữa các vai trò khác nhau như cá nhân, doanh nghiệp và chính phủ. Nút cổ chai lớn thứ hai tồn tại giữa dữ liệu, mô hình và ứng dụng.

Giữa các cá nhân và doanh nghiệp, người dùng, với tư cách là người đóng góp dữ liệu, không chỉ bị loại khỏi phân phối giá trị mà còn có nhận thức và quyền kiểm soát rất hạn chế đối với dữ liệu của chính họ và có nguy cơ bị rò rỉ quyền riêng tư. Có những lo ngại về quyền riêng tư và rò rỉ dữ liệu giữa các cá nhân và chính phủ. Có "những bức tường cao về dữ liệu" giữa các cơ quan chính phủ vì lý do thể chế, các đảo dữ liệu phổ biến giữa các doanh nghiệp và thiếu động lực chia sẻ dữ liệu giữa doanh nghiệp và chính phủ.

Ngoài ra, về phía dữ liệu, nguồn dữ liệu không xác định và chất lượng kém; về phía mô hình, rất khó để có được dữ liệu người dùng thực cho thiết kế và đào tạo mô hình; về phía ứng dụng, việc thiếu các mô hình nâng cao dẫn đến kết quả trong trí thông minh dữ liệu cấp thấp.

tiêu đề phụ

Chia sẻ dữ liệu: Công nghệ và hệ thống đi bằng hai chân

Sự đồng thuận chung mà các chuyên gia từ mọi tầng lớp xã hội đạt được là luồng an toàn và chia sẻ dữ liệu cần song hành ở hai cấp độ công nghệ và hệ thống.

Ở cấp độ công nghệ, có thể thấy rằng tất cả các loại công nghệ tiên tiến đang nở rộ và điện toán bảo mật và quyền riêng tư là giải pháp tổng thể để cho phép chia sẻ bảo mật dữ liệu.

Luo Zhen chia các công nghệ điện toán bảo mật và quyền riêng tư phổ biến hiện nay thành ba con đường chính: điện toán bảo mật đa bên MPC/mã hóa đồng cấu, học liên kết và điện toán hộp cát an toàn/TEE. Ông đã tóm tắt thêm về sự khác biệt giữa ba con đường này - khi giả định về độ tin cậy lần lượt tăng lên, thì độ phức tạp tính toán sẽ giảm đi. Ngoài ra, công nghệ điện toán bảo mật và quyền riêng tư cũng liên quan đến các công nghệ như quyền riêng tư khác biệt, điện toán đám mây, chuỗi khối và mạng chống thần kinh.

Yang Qiang, giám đốc trí tuệ nhân tạo của WeBank và là giáo sư chủ tịch Khoa Máy tính và Kỹ thuật tại Đại học Khoa học và Công nghệ Hồng Kông, đã giải thích việc học liên kết bằng cách lấy cừu chăn thả làm ví dụ. Phương pháp truyền thống là thu thập cỏ từ nhiều nơi khác nhau để cho cừu ăn, nhưng điều này không tuân thủ và các yêu cầu về bảo vệ quyền riêng tư và bảo mật dữ liệu khiến việc lấy dữ liệu trở thành một trở ngại. Và học tập liên kết cung cấp một ý tưởng mới: để đàn di chuyển xung quanh, nhưng cỏ không ra khỏi khu vực địa phương và chủ sở hữu không thể biết nó đã ăn loại cỏ nào.

Li Xiaolin, đối tác của Tongdun Technology và là chủ tịch của Viện nghiên cứu trí tuệ nhân tạo, đã giới thiệu liên kết tri thức của Tongdun Technology, sử dụng hệ thống khung phân cấp để hỗ trợ các ứng dụng đa bên an toàn khác nhau và sử dụng hiệu quả nhiều người tham gia thông qua các giao thức trao đổi bảo mật dữ liệu. Dữ liệu, kiến ​​thức đồng sáng tạo, chia sẻ và lập luận, làm cho dữ liệu có sẵn và vô hình.

Các chuyên gia tham gia cũng tập trung vào giá trị của công nghệ blockchain trong việc chia sẻ bảo mật dữ liệu.

Zhang Shuai, phó chủ tịch của Qulian Technology, cho biết với tư cách là một công nghệ đảm bảo xác nhận quyền dữ liệu và chuyển giá trị, giá trị lớn nhất của chuỗi khối nằm ở hồ sơ đăng ký dữ liệu và quy trình trao đổi để đảm bảo chia sẻ dữ liệu an toàn. Quyền truy cập, logic truy cập và giá phải trả có thể được đăng ký trên chuỗi khối, trong khi các hợp đồng thông minh thực hiện một quy trình hoàn toàn tự động.

Về việc tích hợp với các công nghệ khác, Zhang Shuai tin rằng mặc dù bản thân blockchain không giải quyết được việc chia sẻ dữ liệu, nhưng nó có thể trở thành chất kết dính của nhiều công nghệ. Các công nghệ dọc khác như Internet vạn vật có liên quan đến dữ liệu và chuỗi khối có thể liên kết chúng theo chiều ngang.

Du Yu, phó tổng giám đốc của Shanghai Wanxiang Blockchain Co., Ltd. và là người đứng đầu Phòng thí nghiệm chuỗi khối Wanxiang, cũng bày tỏ quan điểm tương tự. Ông tin rằng trên thực tế, các công ty và tổ chức tài chính sẽ không tiết lộ hồ sơ giao dịch và bí mật kinh doanh, nhưng mọi công ty đều có rất nhiều dữ liệu và có các đảo dữ liệu. Đối mặt với nhiều yêu cầu hợp tác, chuỗi khối có thể hỗ trợ chia sẻ dữ liệu theo chiều ngang và kết nối các đảo bị cô lập.

Wu Ming, đồng sáng lập của Treemap blockchain Conflux, tin rằng bản thân blockchain, với tư cách là một sổ cái phân tán, là một phương tiện mang dữ liệu đáng tin cậy có thể mang dữ liệu có giá trị lớn nhất, chẳng hạn như dữ liệu tín dụng tài chính. dữ liệu mang theo cũng có thể được chứng nhận.

Tong Lin, Giám đốc điều hành của Phala Network, đã chỉ ra rằng loại và số lượng dữ liệu trên chuỗi hiện tại nhỏ hơn nhiều so với dữ liệu ngoài chuỗi. Đặc điểm của dữ liệu trên chuỗi là nó có sẵn khi nó hiển thị và không có sẵn nếu nó không nhìn thấy được (dữ liệu được mã hóa), nhưng việc sử dụng tính toán bảo mật và quyền riêng tư có thể làm cho dữ liệu trên chuỗi trở nên khả dụng và vô hình .

Hiện tại, các công nghệ khác nhau đã đạt được mục tiêu ban đầu.

Lấy WeBank làm ví dụ, nó đã bắt tay với Tencent Tianyan Lab để thành lập Phòng thí nghiệm chung Tencent Medical Health-WeBank, "mô hình dự đoán rủi ro đột quỵ" được phát triển dựa trên học tập liên kết có tỷ lệ chính xác trên 80% và chỉ số dự đoán của mô hình bệnh viện nhỏ Tăng 10-20%.

Yifang Jianshu đã xây dựng một ứng dụng dữ liệu lớn và nền tảng mở dựa trên công nghệ điện toán bảo mật và quyền riêng tư cho Hạ Môn, loạt thành phố thí điểm đầu tiên về dữ liệu lớn y tế và sức khỏe của Trung Quốc, đồng thời tạo ra một mô hình quản trị dữ liệu lớn y tế cũng như chẩn đoán và điều trị theo cấp bậc.

Ở cấp độ hệ thống, các chuyên gia từ mọi tầng lớp nhất trí nhấn mạnh tầm quan trọng của luật pháp, quy định và tiêu chuẩn.

Wang Shuang, người sáng lập Nuowei Technology, cho biết việc chia sẻ dữ liệu cần thúc đẩy luật pháp và tiêu chuẩn bên cạnh công nghệ, việc xây dựng dữ liệu để cùng thúc đẩy lưu thông các yếu tố sản xuất dữ liệu.

Tan Chang, giám đốc điều hành Viện nghiên cứu dữ liệu lớn iFLYTEK, thẳng thắn cho rằng việc chia sẻ dữ liệu quy mô lớn giữa các doanh nghiệp trên thực tế là rất hiếm, một phần do luật pháp và các quy định vẫn cần được cải thiện, các vấn đề như định giá các yếu tố sản xuất dữ liệu vẫn chưa được thực hiện. đã được giải quyết và thiếu thị trường dữ liệu Cơ chế giao dịch, tức là cơ sở hạ tầng liên quan cần được cải thiện khẩn cấp.

Trong cuộc thảo luận bàn tròn về "Giải phóng giá trị của dữ liệu, công dụng tuyệt vời của chuỗi khối là gì", Ingo Rübe, người sáng lập Giao thức KILT, đã nghĩ về bảo mật dữ liệu của chuỗi khối từ quan điểm pháp lý - thế nào là an toàn? Blockchain không được xem xét khi GDPR được ban hành vào năm 2012, nhưng mã hóa dữ liệu trên blockchain suy cho cùng vẫn là một bài toán có thể giải được nên vấn đề lập pháp vẫn nên được chú trọng hàng đầu.

算力智库
作者文库