SDBD2020은 성공적으로 개최되었으며 컴퓨팅 파워 싱크 탱크는 지능형 데이터 권한 부여를 해석하기 위해 글로벌 업계 리더와 손을 잡았습니다.
算力智库
2020-08-27 03:02
本文约2903字,阅读全文需要约12分钟
8월 25일, 제2회 SIGKDD·SDBD2020의 스마트 데이터 및 블록체인 적용에 관한 국제 심포지엄이 온라인으로 개최되어 데이터 경제를 배경으로 데이터 거버넌스와 공유 방식에 대해 논의했습니다.

ACM SIGKDD2020(Knowledge Discovery and Data Mining Conference)은 매년 세계 최고, 최고 수준, 가장 영향력 있는 데이터 과학 행사로, 이번 SDBD 국제 세미나는 KDD 컨퍼런스에서 스마트 데이터, 블록체인 등 신기술에 초점을 맞춘 특별 워크숍이다. -Singapore Management University와 Hashpower Think Tank 주최.

Hashpower Think Tank의 창립자 Yan Li는 "올해 국가는 데이터를 생산 요소 수준으로 끌어올려 산업의 도래를 알렸습니다. Hashpower Think Tank는 스마트 데이터, 개인 컴퓨팅 및 우수한 기업을 추적해 왔습니다. 직접 작성한 심층 보고서 및 연구 보고서를 통해 산업 및 생태 발전을 촉진하기를 희망하는 응용 프로그램입니다.”

보조 제목

데이터 거버넌스는 디지털 경제의 전제입니다.

인공지능, 블록체인 등의 기술이 데이터를 스마트 데이터로 만들지만, 이른바 데이터 경제는 스마트 데이터를 넘어섭니다. 싱가포르 경영 대학의 교수인 Zhu Feida는 기술이 데이터를 "계산 가능"하게 만드는 방법에 대해 이야기하기 전에 데이터가 자산이며 데이터를 관리해야 한다는 전제도 인식해야 한다고 생각합니다.

그러나 그러한 주요 전제조차도 인간이 깨닫기까지는 오랜 시간이 걸렸습니다. Zhu Feida 교수는 데이터 경제가 세 단계를 거쳤다고 말했습니다. 첫 번째 단계에서 데이터는 상업 활동의 부산물일 뿐이며 사람들은 과거를 이해하기 위해 데이터를 더 많이 사용합니다. 두 번째 단계는 빅데이터와 데이터 경제의 부상으로 소수의 기업이 데이터를 독점하여 이익을 얻는 단계입니다. 세 번째 단계는 데이터가 모든 조직을 움직이는 공유 자산이 되는 데이터 기반 경제입니다.

BaseBit.ai의 CEO인 Luo Zhen은 정보화 시대부터 스마트 시대에 이르기까지 기계와 컴퓨팅 프로그램에서 데이터를 더 많이 사용하여 기계를 더 지능적으로 만든다고 믿습니다. 데이터는 정보화 시대의 유물로서 가상의 재사용성, 높은 고정 비용, 낮은 가변 비용 등 고유한 경제적 특성을 가지고 있으며 개인 정보 보호, 규정 준수, 기밀 유지, 보안과 같은 비경제적 차원에서도 나타납니다. .

실제로 사람들은 이러한 데이터 특성을 이해하는 과정에서 대가를 치렀고 거버넌스가 없는 데이터 유출 사례는 막대한 손실을 초래했습니다.

싱가포르 국립대학교 부교수 He Bingsheng은 데이터 유출은 더 이상 고립된 사건이 ​​아니며 다양한 산업 분야에서 관련 사건이 발생하고 있다고 말했습니다. 교육, 의학, 에너지 및 건강과 같은 분야에서 각 데이터 유출로 인한 평균 손실은 최소 500만 달러입니다.

이러한 부정적인 사례는 막대한 경제적 손실을 가져올 뿐만 아니라 데이터 공유에 대한 사회 전체의 의지와 신뢰를 소모하여 이미 취약한 데이터 공유를 더욱 어렵게 만듭니다.

Luo Zhen은 데이터는 본질적으로 안전하게 공유할 수 없지만 데이터 자체를 공유하지 않고 데이터 가치 공유를 실현해야 한다고 지적했습니다.

물론 이것은 훨씬 더 어려운데, 가장 유명한 장애물은 데이터 아일랜드입니다. He Bingsheng 교수는 병원 데이터를 예로 들어 병원마다 환자가 다르지만 실제로 사례는 많은 유사점을 가지고 있다고 말했습니다. 병원, 은행 및 전자 상거래 회사의 각각의 데이터는 실제로 동일한 인구의 다른 측면을 파악합니다.

Zhu Feida 교수의 연구에 따르면 데이터 생태계에는 두 가지 병목 현상이 있습니다. 첫 번째 주요 병목 현상은 개인, 기업 및 정부와 같은 다양한 역할 간에 존재합니다. 두 번째로 큰 병목 현상은 데이터, 모델 및 애플리케이션 간에 존재합니다.

개인과 기업 사이에서 사용자는 데이터 기여자로서 가치 분배에서 제외될 뿐만 아니라 자신의 데이터에 대한 인식과 통제가 매우 제한적이며 개인 정보 유출 위험에 노출됩니다. 개인과 정부 사이에는 개인 정보 보호 및 데이터 유출 문제가 있습니다. 제도적 이유로 인해 정부 부처 간에는 "데이터 높은 벽"이 있고, 기업 간에는 데이터 섬이 일반적이며, 기업과 정부 간의 데이터 공유에 대한 인센티브가 부족합니다.

또한 데이터 측면에서는 데이터의 출처를 알 수 없고 품질이 좋지 않으며, 모델 측면에서는 모델 설계 및 훈련을 위한 실제 사용자 데이터를 얻기가 어렵고, 응용 측면에서는 고급 모델 결과가 부족합니다. 낮은 수준의 데이터 인텔리전스에서.

보조 제목

데이터 공유: 기술과 시스템이 두 발로 걷다

각계 각층의 전문가들이 도달한 일반적인 합의는 데이터의 안전한 흐름과 공유가 기술과 시스템의 두 가지 수준에서 함께 진행되어야 한다는 것입니다.

기술적인 차원에서는 온갖 첨단 기술이 꽃피고 있는 것을 볼 수 있으며 개인 정보 보호 및 보안 컴퓨팅은 데이터 보안 공유를 가능하게 하는 종합적인 솔루션입니다.

Luo Zhen은 현재 널리 사용되는 개인 정보 보호 및 보안 컴퓨팅 기술을 다자간 보안 컴퓨팅 MPC/동형 암호화, 연합 학습 및 보안 샌드박스 컴퓨팅/TEE의 세 가지 주요 경로로 나눕니다. 그는 이 세 가지 경로의 차이점을 요약했습니다. 신뢰 가정이 증가함에 따라 계산 복잡성이 감소합니다. 또한 프라이버시 및 보안 컴퓨팅 기술에는 차등 프라이버시, 클라우드 컴퓨팅, 블록체인 및 반신경망과 같은 기술도 포함됩니다.

WeBank의 최고 인공 지능 책임자이자 홍콩 과학 기술 대학 컴퓨터 공학과 석좌 교수인 Yang Qiang은 양 방목을 예로 들어 연합 학습을 설명했습니다. 전통적인 방법은 양을 먹이기 위해 여러 곳에서 풀을 모으는 것이지만 이것은 규정을 준수하지 않으며 개인 정보 보호 및 데이터 보안 보호 요구 사항으로 인해 데이터를 얻는 데 장애가 됩니다. 그리고 연합 학습은 새로운 아이디어를 제공합니다. 양 떼가 돌아다니게 하되 풀은 지역 밖으로 나오지 않고 주인은 어떤 풀을 먹었는지 알 수 없습니다.

Tongdun Technology의 파트너이자 인공 지능 연구소 회장인 Li Xiaolin은 계층적 프레임워크 시스템을 사용하여 다양한 보안 다자간 애플리케이션을 지원하고 데이터 보안 교환 프로토콜을 통해 여러 참가자를 효과적으로 활용하는 Tongdun Technology의 지식 연합을 소개했습니다. 데이터, 지식 공동 생성, 공유 및 추론, 데이터를 사용 가능하고 보이지 않게 합니다.

참여 전문가들도 데이터 보안 공유에서 블록체인 기술의 가치에 주목했다.

Qulian Technology의 Zhang Shuai 부사장은 데이터 권리 확인 및 가치 이전을 위한 보증 기술로서 블록체인의 가장 큰 가치는 데이터의 안전한 공유를 보장하기 위한 데이터 등록 및 교환 프로세스의 기록에 있다고 말했습니다. 액세스 권한, 액세스 논리 및 지불할 가격을 블록체인에 등록할 수 있으며 스마트 계약은 완전히 자동화된 프로세스를 구현합니다.

다른 기술과의 통합과 관련하여 Zhang Shuai는 블록체인 자체가 데이터 공유를 해결하지는 않지만 여러 기술의 접착제가 될 수 있다고 믿습니다. 사물 인터넷과 같은 다른 수직적 기술은 데이터와 관련이 있으며 블록체인은 이를 수평적으로 결합할 수 있습니다.

Shanghai Wanxiang Blockchain Co., Ltd.의 차장이자 Wanxiang Blockchain Laboratory의 책임자인 Du Yu도 비슷한 견해를 밝혔습니다. 그는 현실적으로 기업과 금융기관은 거래기록과 영업비밀을 노출하지 않겠지만 모든 기업에는 많은 데이터가 있고 데이터 섬이 있다고 믿는다. 많은 협업 요구 사항에 직면한 블록체인은 수평적 데이터 공유를 지원하고 고립된 섬을 연결할 수 있습니다.

Treemap blockchain Conflux의 공동 설립자 Wu Ming은 블록체인 자체가 분산 원장으로서 금융 신용 데이터와 같은 가장 큰 가치의 데이터를 운반할 수 있는 신뢰할 수 있는 데이터 캐리어이므로 블록체인과 데이터는 불가분의 관계라고 믿습니다. 휴대한 데이터도 인증될 수 있습니다.

Phala Network의 CEO인 Tong Lin은 현재 체인의 데이터 유형과 양이 오프체인 데이터보다 훨씬 적다고 지적했습니다. 체인에 있는 데이터의 특징은 보이는 경우에는 사용 가능하고 보이지 않는 경우에는 사용할 수 없다는 것입니다(암호화 데이터). 그러나 프라이버시 및 보안 컴퓨팅을 사용하면 체인의 데이터를 사용 가능하고 보이지 않게 할 수 있습니다 .

현재 다양한 기술이 초도착을 달성했다.

WeBank를 예로 들어 Tencent Tianyan Lab과 손을 잡고 Tencent Medical Health-WeBank 공동 연구소를 설립했습니다.연합 학습을 기반으로 개발된 "뇌졸중 위험 예측 모델"은 정확도가 80% 이상이며 예측 지수는 소규모 병원 모델 10~20% 증가.

Yifang Jianshu는 중국 보건 및 의료 빅데이터의 첫 번째 파일럿 도시인 샤먼을 위해 프라이버시 및 보안 컴퓨팅 기술을 기반으로 빅데이터 애플리케이션 및 개방형 플랫폼을 구축하고 의료 빅데이터 거버넌스와 계층적 진단 및 치료를 위한 모델을 만들었습니다.

시스템 차원에서 각계 각층의 전문가들은 만장일치로 법률, 규정 및 표준의 중요성을 강조했습니다.

Nuowei Technology의 창립자 Wang Shuang은 데이터 공유는 기술 외에도 법률 및 표준의 추진이 필요하다고 말했습니다.데이터의 공식화는 데이터 생산 요소의 순환을 공동으로 촉진합니다.

HKUST의 iFLYTEK 빅 데이터 연구소 소장 Tan Chang은 솔직히 기업 간 대규모 데이터 공유는 현실적으로 드물며, 부분적으로는 법률과 규정을 개선해야 하고 데이터 생산 요소의 가격 책정과 같은 문제가 있기 때문이라고 말했습니다. 아직 해결되지 않았고, 데이터 시장이 부족하다. 거래 메커니즘, 즉 관련 인프라 개선이 시급하다.

KILT Protocol의 창시자인 Ingo Rübe는 "데이터의 가치를 공개하다, 블록체인의 멋진 용도는 무엇인가"에 대한 원탁 토론에서 법적인 관점에서 블록체인의 데이터 보안에 대해 생각했습니다. 2012년 GDPR이 제정될 당시 블록체인은 고려되지 않았지만, 블록체인 상의 데이터 암호화는 결국 풀 수 있는 수학적 문제이기 때문에 여전히 입법적 문제가 우선시 되어야 한다.

算力智库
作者文库