
원저자: Mohamed Baioumy Alex Cheema
원곡: BeWater
전체 보고서의 길이로 인해 출판을 위해 두 부분으로 나누었습니다. 이번 글은 AI x Crypto의 핵심 프레임워크, 구체적인 예시, 빌더를 위한 기회 등을 주로 설명하는 첫 번째 글입니다. 번역 전문을 보시려면 여기를 클릭하세요링크。
1. 소개
인공지능(AI)은 전례 없는 사회 변화를 촉발할 것이다.
AI가 빠르게 발전하고 사회 전반에 걸쳐 새로운 가능성을 창출함에 따라 필연적으로 광범위한 경제적 혼란을 촉발할 것입니다. 암호화폐 산업도 예외는 아닙니다. 우리는 2024년 첫 주에 3건의 주요 DeFi 공격을 목격했으며, 이로 인해 DeFi 프로토콜에서 760억 달러가 위험에 처해 있습니다. AI를 활용하면 스마트 계약의 보안 취약성을 확인하고 AI 기반 보안 계층을 블록체인에 통합할 수 있습니다.
AI의 한계는 악의적인 딥페이크의 확산에서 알 수 있듯이 악의적인 행위자가 강력한 모델을 남용할 수 있다는 것입니다. 다행히도 암호화의 다양한 발전으로 AI 모델에 새로운 기능이 도입되어 AI 산업이 크게 풍요로워지는 동시에 몇 가지 심각한 단점을 해결하게 될 것입니다.
AI와 암호화폐(Crypto)의 융합은 주목할만한 수많은 프로젝트를 탄생시킬 것입니다. 이러한 프로젝트 중 일부는 위의 문제에 대한 솔루션을 제공하는 반면 다른 프로젝트는 AI와 암호화폐를 피상적인 방식으로 결합하지만 실질적인 이점은 없습니다.
본 보고서에서는 이 분야의 과거, 현재, 미래를 이해하는 데 도움이 되는 개념적 프레임워크, 구체적인 사례 및 통찰력을 소개합니다.
2. AI x Crypto의 핵심 프레임워크
이 섹션에서는 AI x Crypto 프로젝트를 보다 자세히 분석하는 데 도움이 되는 몇 가지 실용적인 도구를 소개합니다.
2.1 AI(인공지능기술)×Crypto(암호화기술) 프로젝트란?
암호화폐와 AI를 모두 사용하는 프로젝트의 몇 가지 예를 검토한 다음, 이것이 진정한 AI x 암호화폐 프로젝트인지 논의해 보겠습니다.
이 사례는 암호화 방법을 사용하여 AI 교육 방식을 변경함으로써 암호화가 AI 제품을 어떻게 돕고 개선할 수 있는지 보여줍니다. 이로 인해 AI 기술만으로는 달성할 수 없는 제품, 즉 암호화 지침을 수용할 수 있는 모델이 탄생했습니다.
그림 1: 암호화를 사용하여 AI 스택의 내부 변경을 수행하면 새로운 기능이 생성될 수 있습니다. 예를 들어 FHE를 사용하면 암호화 지침을 사용할 수 있습니다.
이 경우 AI 기술은 암호화폐 제품을 개선하는 데 사용됩니다. 이는 앞서 논의한 것과 반대입니다. Dorsa는 안전한 스마트 계약 생성 프로세스를 더 빠르고 저렴하게 만드는 AI 모델을 제공합니다. 비록 오프체인이지만 AI 모델의 사용은 여전히 암호화폐 프로젝트에 도움이 됩니다. 스마트 계약은 암호화폐 프로젝트 솔루션의 핵심인 경우가 많습니다.
Dorsa의 AI 기능은 인간이 확인하지 못하는 취약점을 발견하여 향후 해킹을 예방할 수 있습니다. 그러나 이 특별한 예는 AI를 활용하여 암호화폐 제품에 이전에 할 수 없었던 작업, 즉 안전한 스마트 계약 작성 기능을 제공하지 않습니다. Dorsa의 AI는 프로세스를 더 좋고 빠르게 만듭니다. 그러나 이는 암호화폐 제품(스마트 계약)을 개선하는 AI 기술(모델)의 예입니다.
LoverGPT는 Crypto x AI의 예가 아닙니다. 우리는 AI가 암호화폐 스택을 개선하는 데 도움이 될 수 있으며 그 반대의 경우도 마찬가지라는 사실을 확인했습니다. 이는 Privasea 및 Dorsa의 사례에서 설명됩니다. 하지만 LoverGPT의 경우 암호화 부분과 AI 부분이 상호작용하지 않고 제품 내에서만 공존할 뿐입니다. 프로젝트가 AI x Crypto 프로젝트로 간주되려면 AI와 Crypto가 동일한 제품이나 솔루션에 기여하는 것만으로는 충분하지 않습니다. 솔루션을 생성하려면 이러한 기술이 서로 얽혀야 합니다.
암호화폐와 AI는 직접 결합하여 더 나은 솔루션을 생성할 수 있는 기술입니다. 이들을 함께 사용하면 전체 프로젝트에서 서로의 작업이 더 잘 수행될 수 있습니다. 이러한 기술 간의 시너지 효과가 포함된 프로젝트만 AI X Crypto 프로젝트로 분류됩니다.
2.2 AI와 암호화폐가 어떻게 서로를 홍보하는가
그림 2: AI와 암호화폐가 3가지 다른 제품에 결합되는 방식
이전 사례 연구를 검토해 보겠습니다. Privasea에서는 FHE 또는 암호화를 사용하여 암호화된 입력을 허용할 수 있는 AI 모델을 생성합니다. 그래서 우리는 AI의 훈련 과정을 개선하기 위해 Crypto 솔루션을 사용하고 있으므로 Crypto는 AI를 돕고 있습니다. Dorsa에서는 AI 모델을 사용하여 스마트 계약 보안을 검토합니다. AI 솔루션은 암호화폐 제품을 개선하는 데 사용되므로 AI가 암호화폐를 돕고 있습니다. 이는 AI에서 프로젝트를 평가할 때 중요한 차원을 제공합니다.
이 간단한 질문은 현재 사용 사례의 중요한 측면, 즉 해결해야 할 핵심 문제가 무엇인지 발견하는 데 도움이 될 수 있습니다. Dorsa의 경우 원하는 결과는 안전한 스마트 계약입니다. 이는 숙련된 개발자가 수행할 수 있으며 Dorsa는 AI를 활용하여 이 프로세스를 보다 효율적으로 만듭니다. 그러나 기본적으로 우리는 스마트 계약의 보안에만 관심을 두고 있습니다. 핵심 질문이 명확해지면 AI가 암호화폐에 도움이 되는지, 암호화폐가 AI에 도움이 되는지 판단할 수 있습니다. 어떤 경우에는 둘 사이에 의미 있는 상호 작용이 없습니다(예: LoverGPT).
아래 표에는 각 카테고리의 몇 가지 예가 나와 있습니다.
표 1: 암호화폐와 AI가 결합되는 방식
부록에서 150개 이상의 AI x Crypto 프로젝트 디렉토리를 찾을 수 있습니다. 혹시 누락된 내용이 있거나 피드백이 있으시면 알려주시기 바랍니다.연결하다우리를!
2.2.1 요약
AI와 Crypto는 모두 목표를 달성하기 위해 다른 기술을 지원할 수 있는 능력을 가지고 있습니다. 프로젝트를 평가할 때 핵심은 그것이 핵심적으로 AI 제품인지 암호화폐 제품인지 이해하는 것입니다.
그림 3: 차이점 설명
2.3 내부 및 외부 지원
AI를 돕는 암호화폐의 예를 들어보겠습니다. AI를 구성하는 특정 기술 세트가 변경되면 AI 솔루션 전체의 기능도 변경됩니다. 이러한 기술 모음을 스택이라고 합니다. AI 스택에는 AI의 모든 측면을 구성하는 수학적 아이디어와 알고리즘이 포함됩니다. 훈련 데이터 처리, 모델 훈련, 모델 추론에 사용되는 특정 기술은 모두 스택의 일부입니다.
스택에는 다양한 부분 사이에 깊은 연결이 있습니다. 특정 기술이 결합되는 방식에 따라 스택의 기능이 결정됩니다. 따라서 스택을 변경하는 것은 전체 기술이 달성할 수 있는 것을 변경하는 것과 같습니다. 스택에 새로운 기술을 도입하면 새로운 기술적 가능성이 창출될 수 있습니다. Ethereum은 암호화폐 스택에 새로운 기술을 추가하여 스마트 계약을 가능하게 했습니다. 마찬가지로, 스택을 변경하면 개발자는 이전에 기술에 내재된 것으로 생각되었던 문제를 우회할 수 있습니다. Polygon이 이더리움 암호화 스택에 적용한 변경을 통해 이전에는 불가능하다고 생각했던 수준으로 거래 수수료를 줄일 수 있었습니다.
내부 지원:암호동물학은 모델이 훈련되는 기술적 수단을 변경하는 등 AI 스택의 내부 변경을 수행하는 데 사용될 수 있습니다. FHE 기술을 인공지능 스택에 도입할 수 있는데, Privasea가 그 예인데, AI 스택에 암호화 부분이 직접 내장되어 변형된 AI 스택을 형성합니다.
외부 지원:암호화폐는 AI 스택을 수정할 필요 없이 AI 기반 기능을 지원하는 데 사용됩니다.Bittensor사용자가 데이터(AI 모델을 훈련하는 데 사용할 수 있는 데이터)를 기여하도록 장려하는 것이 한 예입니다. 이 경우 모델이 훈련되거나 사용되는 방식에는 아무런 변화가 없으며 AI 스택에도 변화가 없습니다. 그러나 Bittensor 네트워크에서는 경제적 인센티브를 사용하면 AI 스택이 그 목적을 더 잘 달성하는 데 도움이 됩니다.
그림 4: 이전 토론의 그림
마찬가지로 AI는 암호화폐에 내부 또는 외부 도움을 제공할 수도 있습니다.
내부 지원:AI 기술은 암호화폐 스택 내부에서 사용됩니다. AI는 온체인에 있으며 암호화폐 스택의 일부에 직접 연결됩니다. 예를 들어 체인의 AI 에이전트는 DAO를 관리합니다. 이 AI는 단지 암호화폐 스택을 지원하는 것이 아닙니다. 이는 기술 스택의 필수적인 부분이며 DAO가 제대로 작동할 수 있도록 기술 스택에 깊숙이 내장되어 있습니다.
외부 지원:AI는 암호화 스택에 대한 외부 지원을 제공합니다. AI는 내부 변경 없이 암호화폐 스택을 지원하는 데 사용됩니다. Dorsa와 같은 플랫폼은 AI 모델을 사용하여 스마트 계약을 보호합니다. AI는 오프체인이며 안전한 스마트 계약 작성 프로세스를 더 빠르고 저렴하게 만드는 데 사용되는 외부 도구입니다.
그림 5: 내부 지원과 외부 지원의 차이를 포함한 업그레이드된 모델입니다.
AI x Crypto 프로젝트를 분석하는 첫 번째 단계는 해당 프로젝트가 어떤 카테고리에 속하는지 결정하는 것입니다.
2.4 병목 현상 식별
외부 지원에 비해 심층적인 기술 통합을 특징으로 하는 내부 지원은 기술적인 어려움이 더 많은 경우가 많습니다. 예를 들어 FHE나 영지식증명(ZKP)을 도입해 AI 스택을 수정하려면 암호화와 AI 모두에 상당한 전문성을 갖춘 기술 인력이 필요하다. 그러나 이 교차로에 빠지는 사람은 거의 없습니다. 이러한 회사에는 다음이 포함됩니다.Modulus、EZKL、Zama그리고Privasea。
결과적으로 이들 회사는 솔루션을 발전시키기 위해 상당한 자본과 부족한 인재가 필요합니다. 사용자가 인공 지능을 스마트 계약에 통합할 수 있도록 하려면 심층적인 지식이 필요합니다.Ritual그리고Ora이러한 기업은 복잡한 엔지니어링 문제를 해결해야 합니다.
반대로, 외부 지원에도 병목 현상이 있지만 일반적으로 기술적 복잡성이 덜합니다. 예를 들어, AI 에이전트에 암호화폐 결제 기능을 추가하면 모델을 많이 수정할 필요가 없습니다. 구현하기가 비교적 쉽습니다. AI 엔지니어에게는DeFi LLama에서 ChatGPT를 만드는 ChatGPT 플러그인웹페이지에서통계 얻기기술적으로 복잡하지는 않지만 암호화폐 커뮤니티의 구성원인 AI 엔지니어는 거의 없습니다. 작업이 기술적으로 복잡하지는 않지만 이러한 도구에 액세스할 수 있는 AI 엔지니어는 거의 없으며 많은 사람들이 가능성을 인식하지 못합니다.
2.5 측정 유틸리티
네 가지 범주 모두에서 좋은 프로젝트가 있을 것입니다.
AI가 암호화폐 스택에 통합되면 스마트 계약 개발자는 온체인 AI 모델에 액세스할 수 있어 가능성이 늘어나고 잠재적으로 광범위한 혁신으로 이어질 수 있습니다. 암호화폐를 AI 스택에 통합하는 경우에도 마찬가지입니다. 심층적인 기술 융합이 새로운 가능성을 창출할 것입니다.
그림 6: 암호화폐 스택에 인공 지능을 추가하면 개발자에게 새로운 기능이 제공됩니다.
AI가 암호화폐에 외부적 도움을 제공하는 만큼, AI 통합은 기존 제품을 개선하는 동시에 혁신을 일으키고 가능성을 더 적게 만들 가능성이 높습니다. 예를 들어, 인공지능 모델을 사용하여 스마트 계약을 작성하는 것은 이전보다 더 빠르고 저렴할 수 있으며 보안도 향상될 수 있지만 이전에는 불가능했던 스마트 계약을 생성할 가능성은 낮습니다. 외부에서 AI를 돕는 암호화폐에도 동일하게 적용됩니다. 토큰 인센티브는 AI 스택에 사용될 수 있지만 그 자체로는 AI 모델 훈련 방법을 재정의할 가능성이 없습니다.
요약하자면, 한 기술을 다른 기술 스택에 통합하면 새로운 기능이 탄생할 수 있는 반면, 기술 스택 외부의 기술을 사용하면 유용성과 효율성이 향상될 수 있습니다.
2.6 평가 프로젝트
기술 간의 내부 지원이 더 큰 수익을 가져올 수 있기 때문에 특정 프로젝트가 속하는 사분면을 기반으로 특정 프로젝트의 이점 중 일부를 추정할 수 있지만, 프로젝트의 총 위험 조정 이익을 추정하려면 더 많은 요소와 위험을 고려해야 합니다.
고려해야 할 한 가지 요소는 고려 중인 프로젝트가 Web2, Web3 또는 둘 다의 맥락에서 유용한지 여부입니다. FHE 기능이 있는 AI 모델은 FHE 기능이 없는 AI 모델을 대체하는 데 사용될 수 있습니다. FHE 기능을 도입하는 것은 두 분야 모두에 유용하며 개인 정보 보호는 어떤 경우에도 중요합니다. 그러나 인공지능 모델을 스마트 계약에 통합하는 것은 Web3 환경에서만 사용할 수 있습니다.
앞서 언급했듯이 인공지능과 암호화 분야의 기술 통합이 내부에서 수행되는지 외부에서 수행되는지 여부도 프로젝트의 긍정적인 잠재력을 결정합니다. 내부 지원이 포함된 프로젝트는 새로운 기능을 생성하고 효율성이 더 크게 향상되는 경향이 있지만 이것이 더 가치가 있습니다.
또한 우리는 이 기술이 성숙해지는 기간을 고려해야 하며, 이에 따라 사람들이 보상을 받기 위해 기다려야 하는 시간이 결정됩니다.
프로젝트에 대한 투자. 이는 현재 진행 상황을 분석하고 프로젝트 관련 병목 현상을 식별함으로써 수행할 수 있습니다(섹션 2.4 참조).
그림 7: 기간에 따른 잠재적 상승 여력을 보여주는 가상의 예
2.7 복잡한 제품 이해
일부 프로젝트에는 하나가 아닌 우리가 설명한 네 가지 범주의 조합이 포함됩니다. 이 경우 프로젝트와 관련된 위험과 이점이 배가되고 프로젝트 구현 기간이 길어지는 경향이 있습니다.
또한 프로젝트 전체가 부분의 합보다 나은지 고려해야 합니다. 모든 것이 조금씩 포함된 프로젝트는 최종 사용자의 요구 사항을 충족하기에 충분하지 않은 경우가 많습니다. 집중적인 접근 방식은 종종 훌륭한 제품을 만들어냅니다.
2.7.1 예 1: Flock.io
Flock.io여러 서버 간 허용"분할"모델을 훈련하기 위해 어떤 당사자도 모든 훈련 데이터에 액세스할 수 없습니다. 모델 학습에 직접 참여할 수 있기 때문에 데이터 유출 없이 자신의 데이터를 활용하여 모델에 기여할 수 있습니다. 이는 사용자 개인 정보를 보호하는 데 도움이 됩니다. AI 스택(모델 훈련)이 변경됨에 따라 AI 내부를 돕는 암호화가 포함됩니다.
또한 모델 훈련에 참여하는 사람들에게 보상을 제공하기 위해 암호화 토큰을 사용하고, 훈련 과정을 방해하는 사람들에게 재정적 처벌을 가하기 위해 스마트 계약을 사용합니다. 이는 모델 훈련과 관련된 프로세스를 변경하지 않으며, 기본 기술은 변경되지 않지만 모든 당사자는 온체인 슬래싱 메커니즘을 따라야 합니다. 외부에서 AI를 돕는 암호화의 예입니다.
가장 중요한 것은 암호화가 AI가 내부적으로 새로운 기능을 도입하는 데 도움이 된다는 것입니다. 즉, 데이터를 비공개로 유지하면서 분산형 네트워크를 통해 모델을 훈련할 수 있습니다. 그러나 외부에서 AI를 지원하는 암호화폐는 새로운 기능을 도입하지 않습니다. 토큰은 단순히 사용자가 네트워크에 기여하도록 장려하는 데 사용되기 때문입니다. 사용자는 명목 화폐로 보상을 받을 수 있으며 암호화폐 인센티브를 사용하는 것이 시스템 효율성을 향상시킬 수 있는 더 나은 솔루션이지만 새로운 기능을 도입하지는 않습니다.
그림 8:Flock.io스택의 개략도와 스택의 변경 사항(색상 변경은 내부적으로 변경되었음을 의미함)
2.7.2 예 2: 록펠러 로봇
록펠러 로봇체인 위에서 운영되는 트레이딩 로봇입니다. AI를 사용하여 어떤 거래를 할지 결정하지만 AI 모델 자체는 스마트 계약에 따라 실행되지 않기 때문에 서비스 제공업체에 의존하여 모델을 실행한 다음 스마트 계약에 AI의 결정을 전달하고 증명합니다. 스마트 계약을 통해 거짓말을 하지 마세요. 스마트 계약이 서비스 제공자가 거짓말을 하는지 여부를 확인하지 않으면 서비스 제공자는 우리를 대신하여 유해한 거래를 수행할 수 있습니다. Rockefeller Bot을 사용하면 ZK 증명을 사용하여 서비스 제공업체가 거짓말을 하지 않는다는 것을 스마트 계약에 증명할 수 있습니다. 여기서 ZK는 AI 스택을 변경하는 데 사용됩니다. AI 스택은 ZK 기술을 채택해야 합니다. 그렇지 않으면 ZK를 사용하여 스마트 계약에 대한 모델 결정을 증명할 수 없습니다.
ZK 기술 덕분에 결과 AI 모델 출력은 검증 가능하고 블록체인에서 쿼리할 수 있습니다. 즉, AI 모델이 암호화폐 스택 내부에서 사용됩니다. 이 경우, 우리는 스마트 계약에 인공지능 모델을 사용하여 거래와 가격을 공정하게 결정합니다. 이는 인공지능이 없었다면 불가능했을 것이다.
그림 9: 록펠러 로봇 및 스택 변경의 개략도. 색상 변경은 스택(내부적으로 지원됨)이 변경되었음을 의미합니다.
3. 추가 조사가 필요한 질문
3.1 암호화 분야와 딥페이크 대재앙
1월 23일, 하나AI가 생성한 음성 메시지, 자신이 바이든 대통령이라고 허위 주장, 민주당이 2024년 예비선거에서 투표하는 것을 방해했습니다. 일주일도 채 지나지 않아,금융 종사자동료의 딥페이크 화상 통화를 모방한 것입니다.2500만 달러 손실. 한편 X(구 트위터)에서는 AI가 테일러 스위프트의 노골적인 사진을 위조했다.조회수 4,500만 회 기록, 광범위한 분노를 불러 일으켰습니다. 모두 2024년 첫 두 달 동안 발생한 이 사건들은 딥페이크가 정치, 금융, 소셜 미디어에 미치는 다양한 피해 효과를 보여주는 단편일 뿐입니다.
3.1.1 어떻게 문제가 되었나요?
가짜 이미지는 새로운 것이 아닙니다. 1917년에 The Strand 잡지는 요정처럼 보이도록 디자인된 복잡한 종이 컷아웃 사진을 게재했는데, 많은 사람들은 이 사진을 초자연적 힘의 존재에 대한 증거로 여겼습니다.
그림 10: Cottingley의 요정 사진 중 하나. 셜록 홈즈의 창작자 아서 코난 도일 경은 위조된 이미지를 초자연적 현상의 증거로 인용했습니다.
시간이 지남에 따라 위조가 더 쉽고 저렴해지면서 잘못된 정보가 퍼지는 속도가 크게 빨라졌습니다. 예를 들어, 2004년 미국 대통령 선거 당시 민주당 후보인 존 케리(John Kerry)가 A 논란의 여지가 있는 미국 운동가인 제인 폰다(Jane Fonda)와 함께 시위에 참석하는 모습을 조작한 사진이 허위로 찍혔습니다. Cottingley 요정은 동화책에서 추적한 이미지를 판지로 잘라낸 것을 사용하여 정교한 배열이 필요했지만 이 위조는 Photoshop을 사용하여 수행한 간단한 작업이었습니다.
그림 11:이 하나사진은 존 케리(John Kerry)가 베트남 전쟁 반대 집회에서 제인 폰다(Jane Fonda)와 함께 무대를 공유하는 모습입니다. 이후 기존 이미지 2장을 포토샵을 이용해 합성해 만든 가짜 사진인 것으로 밝혀졌다.
그러나 편집 흔적을 찾아내는 방법을 알게 되면서 가짜 사진으로 인한 위험은 줄어들었습니다. 존재하다관광 소년 이 경우 아마추어들은 장면 내 서로 다른 물체 사이의 화이트 밸런스 불일치를 관찰하여 이미지가 편집되었는지 여부를 식별할 수 있었습니다. 이는 허위 정보에 대한 대중의 인식이 높아진 산물입니다. 사람들은 이미지 편집의 징후를 알아차리는 법을 배웠습니다. Photoshoped”라는 단어는 일반적인 용어가 되었습니다. 이미지가 변조되었다는 징후가 보편적으로 인식되었으며, 사진 증거는 더 이상 오류가 없는 것으로 간주되지 않습니다.
3.1.1.1 심층 위조는 위조를 더 쉽고, 저렴하고, 현실적으로 만듭니다.
과거에는 위조 문서를 육안으로 쉽게 식별할 수 있었지만, 딥페이크 기술을 통해 실제 사진과 사실상 구별할 수 없는 이미지를 쉽고 저렴하게 만들 수 있게 되었습니다. 예를 들어, OnlyFake 웹사이트는 딥페이크 기술을 사용하여 단 15달러에 몇 분 만에 사실적인 가짜 신분증 사진을 생성합니다. 해당 사진은 암호화폐 거래소의 사기 방지 보호 장치인 OKX를 우회하는 데 사용되었습니다."(KYC). OKX의 경우 이러한 딥페이크 ID는 조작된 이미지와 딥페이크를 식별하도록 훈련받은 직원들을 속였습니다. 이는 전문가라도 딥페이크 기반 사기를 더 이상 육안으로 탐지할 수 없다는 점을 강조합니다.
이미지가 딥페이크되면서 비디오 증거에 대한 의존도가 높아졌지만, 딥페이크는 곧 비디오 증거를 심각하게 약화시킬 것입니다. 텍사스 대학교 달라스 연구원은 무료 딥페이크 얼굴 교환 도구를 사용합니다., 성공적으로 우회됨KYC 제공업체가 구현한 신원 확인 기능입니다. 이는 엄청난 개선입니다. 과거에는 고품질 비디오를 생성하는 데 비용과 시간이 많이 걸렸습니다.
2019년에는 2주와 552달러가 소요되었습니다.Mark Zuckerberg의 38초 딥페이크 동영상을 만들기 위해, 비디오에는 명백한 시각적 결함도 있을 것입니다. 요즘에는 몇 분 만에 무료로 사실적인 딥페이크 동영상을 만들 수 있습니다.
그림 12: OnlyFake 패널은 몇 분 안에 가짜 ID 카드를 생성할 수 있습니다.
3.1.1.2 비디오가 중요한 이유
딥페이크 기술이 등장하기 전,비디오는 믿을만한 증거였습니다. 위조가 쉬운 이미지와 달리 영상은 역사적으로 위조가 어려워 법정에서 믿을 만한 증거로 인정받고 있다. 이는 비디오 딥페이크를 특히 위험하게 만듭니다.
동시에 딥페이크의 출현은 실제 영상의 거부로 이어질 수도 있으며, 미국에서는바이든 대통령의단락동영상이 딥페이크라고 잘못 불림. 비평가들은 바이든의 깜박이지 않는 눈과 조명의 차이를 증거로 지적했고, 그러한 주장은 반증되었습니다. 이는 문제를 야기합니다. 심층 위조는 가짜를 실제처럼 보이게 할 뿐만 아니라 실제를 가짜로 만들어 현실과 허구의 경계를 더욱 모호하게 만들고 책임을 더욱 어렵게 만드는 것입니다.
딥페이크는 대규모 타겟 광고를 가능하게 합니다. 말하는 내용, 누가 말하는지, 어디서 말하는지 청중에게 개인화되는 또 다른 YouTube를 곧 보게 될 것입니다. 초기 예는 다음과 같습니다.Zomato의 현지화된 광고, 광고에는 배우 Hrithik Roshan이 시청자가 있는 도시의 인기 레스토랑에서 음식을 주문하는 모습이 나옵니다. Zomato는 시청자의 다양한 GPS 위치를 기반으로 다양한 딥페이크 광고를 생성하여 시청자 위치에 있는 레스토랑에 대한 콘텐츠를 소개했습니다.
3.1.2 현재 솔루션의 단점은 무엇입니까?
3.1.2.1 의식
오늘날의 딥페이크는 숙련된 전문가조차 속일 수 있을 만큼 발전했습니다. 이를 통해 해커는 신원 확인(KYC/AML) 절차는 물론 사람의 검토까지 우회할 수 있습니다. 이는 우리의 눈으로 딥페이크와 실제 이미지를 구별할 수 없다는 것을 보여줍니다. 단순히 이미지에 회의적이라고 해서 딥페이크로부터 보호할 수는 없습니다. 딥페이크 확산에 맞서기 위해서는 더 많은 도구가 필요합니다.
3.1.2.2 플랫폼
소셜 미디어 플랫폼은 강력한 사회적 압력 없이 딥페이크를 효과적으로 억제하려고 하지 않습니다. 예를 들어 Meta는 가짜 오디오가 포함된 가짜 비디오를 금지하지만 순전히 조작된 비디오 콘텐츠 금지는 거부합니다. 그들은 자체 감독 위원회의 조언에 어긋나고 한 단락도 삭제하지 않았습니다.바이든 대통령, 손녀를 애무하는 모습딥페이크 동영상, 순전히 조작된 콘텐츠。
3.1.2.3 정책
사람들을 속이려고 하지 않는 예술이나 교육과 같이 문제가 덜한 용도를 제한하지 않고 딥페이크의 새로운 위험을 효과적으로 해결하는 법률이 필요합니다. Taylor Swift 딥페이크 이미지의 합의되지 않은 배포와 같은 사건으로 인해 국회의원들은 이러한 딥페이크에 맞서기 위해 더욱 엄격한 법률을 통과시켰습니다. 이러한 경우에 대응하여 법적으로 강화된 온라인 조정 절차가 필요할 수 있지만, AI로 생성된 모든 콘텐츠를 금지하겠다는 제안은 자신의 작업이 부당하게 제한될 것을 두려워하는 영화 제작자와 디지털 아티스트를 놀라게 했습니다. 올바른 균형을 찾는 것이 중요합니다. 그렇지 않으면 합법적인 창의적 응용 프로그램이 억제될 것입니다.
강력한 모델을 훈련하기 위한 진입 장벽을 높이도록 국회의원들에게 압력을 가함으로써 Big Tech는 AI 독점을 확보할 수 있었습니다. 이로 인해 일부 기업의 손에 돌이킬 수 없는 권력 집중이 발생할 수 있습니다. 예를 들어 인공 지능의 경우행정명령 14110컴퓨팅 파워가 큰 기업에는 엄격한 요구사항을 적용하는 것이 좋습니다.
그림 13: 카말라 해리스(Kamala Harris) 미국 부통령은 조 바이든(Joe Biden) 미국 대통령이 인공 지능에 관한 최초의 미국 행정 명령에 서명했을 때 박수를 보내고 있습니다.
3.1.2.4 기술
남용을 방지하기 위해 AI 모델에 직접 가드레일을 구축하는 것이 첫 번째 방어선이지만 이러한 가드레일은끊임없이 파괴되고 있다. 기존의 하위 수준 도구를 사용하여 고차원 동작을 수정하는 방법을 모르기 때문에 AI 모델을 검토하기가 어렵습니다. 또한 AI 모델을 훈련하는 회사는 구현 가드레일을 핑계로 삼아 모델에 원치 않는 조사와 편견을 도입할 수 있습니다. 이는 대형 기술 AI 회사가 대중의 의지에 책임을 지지 않기 때문에 문제가 됩니다. 회사는 사용자에게 해를 끼치는 방향으로 모델에 자유롭게 영향을 미칠 수 있습니다.
강력한 AI의 생성이 부정직한 기업의 손에 집중되지 않더라도 보호되고 편견이 없는 AI를 구축하는 것은 여전히 불가능할 수 있습니다. 연구자들이 판단하기는 어렵습니다.학대란 무엇인가,따라서 남용을 방지하면서 중립적이고 균형 잡힌 방식으로 사용자 요청을 처리하는 것은 어렵습니다. 학대를 정의할 수 없다면 예방 조치의 엄격함을 줄여 잠재적으로 학대가 다시 발생할 수 있도록 하는 것이 필요해 보입니다. 따라서 인공지능 모델의 오용을 완전히 금지하는 것은 불가능하다.
한 가지 해결책은 악성 딥페이크가 생성되는 것을 방지하는 것이 아니라 나타나는 즉시 이를 탐지하는 것입니다. 그러나 OpenAI가 배포한 것과 같은 딥페이크 탐지 AI 모델은부정확함으로 인해, 되고있다시대에 뒤쳐진. 딥페이크 탐지 방법이 점점 정교해지는 반면, 딥페이크를 만드는 데 사용되는 기술은 훨씬 더 빠른 속도로 더욱 정교해지고 있습니다. 딥페이크 탐지기는 기술 군비 경쟁에서 밀리고 있습니다. 이로 인해 언론만으로는 딥페이크 뉴스를 식별하기가 어렵습니다. 인공지능은 AI가 정확성을 판단할 수 없을 정도로 사실적인 가짜 영상을 만들 정도로 발전했다.
워터마킹 기술은 딥페이크를 은밀하게 표시하므로 딥페이크가 어디에 나타나든 식별할 수 있습니다. 그러나 딥페이크에는 항상 워터마크가 있는 것은 아닙니다. 워터마크는 의도적으로 추가해야 하기 때문입니다. OpenAI와 같이 가짜 이미지에 라벨을 붙여 자발적으로 차별화하는 기업의 경우 워터마킹이 효과적인 방법입니다. 하지만 워터마크는 뭐 괜찮아요사용하기 쉬운 도구로 제거하거나 위조하세요, 이를 통해 워터마크 기반 딥페이크 방지 솔루션을 우회합니다. 대부분의 소셜 미디어 플랫폼처럼 워터마크가 실수로 제거될 수도 있습니다.자동으로 삭제양수표.
가장 널리 사용되는 딥페이크 워터마킹 기술은C 2 PA(Content Provenance and Authenticity Alliance에서 제안). 미디어 소스를 추적하고 이 정보를 미디어 메타데이터에 저장하여 잘못된 정보를 방지하도록 설계되었습니다. 이 기술은 Microsoft, Google, Adobe 등의 지원을 받고 있으므로 C 2 PA는 콘텐츠 공급망 전반에 걸쳐 출시되어 다른 유사한 기술보다 더 널리 보급될 가능성이 높습니다.
불행하게도 C 2 PA에는 고유한 약점이 있습니다. C 2 PA는 이미지의 전체 편집 내역을 저장하고 C 2 PA 호환 편집 소프트웨어가 제어하는 암호화 키를 사용하여 각 편집 내용을 확인하므로 이러한 편집 소프트웨어를 신뢰해야 합니다. 그러나 사람들은 유효한 C 2 PA 메타데이터 때문에 편집 체인의 각 당사자를 신뢰할지 여부를 고려하지 않고 편집된 이미지를 단순히 받아들일 가능성이 높습니다. 따라서 편집 소프트웨어가 손상되었거나 악의적인 편집이 가능한 경우다른 사람들이 가짜 또는 악의적으로 편집한 이미지가 진짜라고 믿게 만들 수 있습니다.。
그림 14: C2PA 표준 메타데이터를 준수하는 일련의 편집 내용이 포함된 이미지의 예입니다. 각 편집 내용은 신뢰할 수 있는 다른 당사자의 서명을 받지만 최종 편집된 이미지만 공개됩니다. 출처: 실제 사진 및 AI 생성 예술품: 새로운 표준(C 2 PA)은 PKI를 활용하여 이미지 기록을 표시합니다.
또한 C 2 PA 워터마크에 포함된 암호화 서명 및 메타데이터는특정 사용자 또는 장치와 연결될 수 있음. 경우에 따라 C 2 PA 메타데이터는 카메라로 촬영한 모든 이미지를 서로 연결할 수 있습니다. 특정 이미지가 다른 사람의 카메라에서 나온 것을 알면 해당 카메라의 다른 모든 이미지를 식별할 수 있습니다. 이는 기자가 사진을 게시할 때 익명을 유지하는 데 도움이 됩니다.
모든 잠재적 솔루션은 고유한 과제에 직면하게 됩니다. 이러한 과제는 사회적 인식의 한계, 거대 기술 기업의 단점, 규제 정책 구현의 어려움, 기술의 한계 등 매우 다양합니다.
3.1.3 암호화 분야가 이 문제를 해결할 수 있습니까?
오픈소스 딥페이크 모델이 유통되기 시작했습니다. 따라서 누군가는 딥페이크를 사용하여 다른 사람의 초상을 오용하는 방법이 항상 있다고 주장할 수 있으며, 이러한 행위가 범죄로 규정되더라도 누군가는 여전히 비윤리적인 딥페이크 콘텐츠를 생성하기로 선택할 것입니다. 그러나 우리는 악성 딥페이크를 주류에서 제거함으로써 이 문제를 해결할 수 있습니다. 우리는 사람들이 딥페이크 이미지가 진짜라고 생각하는 것을 방지하고 딥페이크 콘텐츠를 제한하는 플랫폼을 만들 수 있습니다. 이번 섹션에서는 악성 딥페이크의 전파로 인해 발생하는 잘못된 방향의 문제에 대한 다양한 암호화 기반 솔루션을 소개하고, 각 접근 방식의 한계를 조명합니다.
3.1.3.1 하드웨어 인증
하드웨어 인증 카메라에는 촬영된 각 사진에 고유한 인증서가 내장되어 해당 카메라로 사진을 촬영했음을 증명합니다. 이 인증서는 카메라 고유의 복제 불가능한 변조 방지 칩에 의해 생성되어 이미지의 신뢰성을 보장합니다. 오디오와 비디오에도 유사한 프로그램을 사용할 수 있습니다.
인증은 해당 이미지가 실제 카메라로 촬영되었음을 알려주므로 일반적으로 해당 이미지가 실제 물체의 사진임을 신뢰할 수 있습니다. 그러한 증거 없이 이미지에 라벨을 붙일 수 있습니다. 하지만 카메라가 실제처럼 보이도록 설계된 가짜 장면을 캡처하는 경우 이 방법은 작동하지 않습니다. 카메라를 가짜 이미지로 향하게 하면 됩니다. 현재는 캡처된 이미지가 왜곡되었는지 확인하여 사진이 디지털 화면에서 촬영되었는지 여부를 알 수 있지만, 사기꾼은 이러한 결함을 숨기는 방법(예: 더 나은 화면을 사용하거나 렌즈 플레어를 제한하는 방법)을 찾습니다. 결국엔 심지어인공지능 도구사기꾼은 이러한 모든 왜곡을 피할 수 있는 방법을 찾을 수 있으므로 이러한 사기를 탐지하는 것도 불가능합니다.
하드웨어 인증은 가짜 이미지를 신뢰하는 경우의 수를 줄여주지만, 드문 경우지만 카메라가 손상되거나 오용되는 경우 딥페이크 이미지의 확산을 방지하기 위한 추가 도구가 여전히 필요합니다. 이전에 논의한 것처럼 하드웨어 검증 카메라를 사용하면 카메라가 해킹되었거나 카메라가 컴퓨터 화면에서 딥페이크 장면을 캡처하는 데 사용되는 경우와 같이 딥페이크 콘텐츠가 실제 이미지라는 잘못된 인상을 줄 수 있습니다. 이 문제를 해결하려면 카메라 블랙리스트와 같은 다른 도구가 필요합니다.
카메라 블랙리스트를 사용하면 해당 카메라가 과거에 오해의 소지가 있는 이미지를 생성한 것으로 알려져 있기 때문에 소셜 미디어 플랫폼과 앱에서 특정 카메라의 이미지에 플래그를 지정할 수 있습니다. 블랙리스트를 사용하면 카메라 ID 등 카메라 추적에 사용할 수 있는 정보를 공개할 필요가 없습니다.
그러나 카메라 블랙리스트를 누가 관리하는지는 불분명하며,아니요사람들이 내부 고발자의 카메라를 블랙리스트에 올리기 위해 뇌물을 받는 것을 방지하는 방법을 알아 두십시오.
3.1.3.2 블록체인 기반 이미지 연대기
블록체인은 불변적이므로 이미지가 인터넷에 나타나면 추가 메타데이터와 함께 타임스탬프가 있는 연대기에 추가되어 타임스탬프와 메타데이터가 변조될 수 없습니다. 편집되지 않은 원본 이미지는 악의적인 편집이 확산되기 전에 정직한 당사자에 의해 블록체인에 불변적으로 저장될 수 있으므로 이러한 기록에 액세스하면 악의적인 편집을 식별하고 원본 소스를 확인할 수 있습니다. 이 기술은 Fox News와 협력하여 개발된 사실 확인 도구로 Polygon 블록체인 네트워크에서 구현되었습니다.Verify의 일부.
그림 15: Fox의 블록체인 기반 도구인 확인(Verify)의 사용자 인터페이스. 작품은 URL로 찾아보실 수 있습니다. Polygon 블록체인에서 출처, 거래 해시, 서명, 타임스탬프 및 기타 메타데이터를 가져오고 표시합니다.
3.1.3.3 디지털 아이덴티티
딥페이크가 확인되지 않은 이미지와 비디오에 대한 우리의 신뢰를 훼손한다면, 신뢰할 수 있는 출처가 허위 정보를 피할 수 있는 유일한 방법이 될 수 있습니다. 우리는 정보의 정확성과 신뢰성을 보장하기 위해 저널리즘 표준, 사실 확인 절차 및 편집 감독을 사용하기 때문에 신뢰할 수 있는 미디어 소스에 의존하여 정보를 확인했습니다.
하지만 우리가 온라인에서 보는 콘텐츠가 우리가 신뢰하는 출처에서 나온 것인지 확인할 수 있는 방법이 필요합니다. 암호화로 서명된 데이터가 들어오는 곳은 바로 여기입니다. 이는 무언가의 작성자를 수학적으로 증명할 수 있습니다.
서명은 디지털 키를 이용하여 생성되며, 키는 지갑에서 생성 및 생성되기 때문에 해당 암호화폐 지갑을 소유한 사람만이 알 수 있습니다. 이러한 방식으로 우리는 서명이 개인 암호화폐 지갑에 있는 고유한 키와 일치하는지 확인함으로써 데이터 작성자가 누구인지 알 수 있습니다.
우리는 암호화폐 지갑을 활용하여 원활하고 사용자 친화적인 방식으로 게시물에 서명을 첨부할 수 있습니다. 암호화폐 지갑을 사용하여 소셜 미디어 플랫폼에 로그인하는 경우 지갑 기능을 활용하여 소셜 미디어에서 서명을 생성하고 확인할 수 있습니다. 따라서 플랫폼은 게시물이 의심스러운 출처에서 온 경우 우리에게 경고할 수 있습니다. 자동 서명 확인을 사용하여 잘못된 정보를 표시합니다.
또한 지갑과 연동된zk-KYC인프라는 사용자 개인 정보 보호 및 익명성을 손상시키지 않으면서 알 수 없는 지갑을 KYC 프로세스를 통해 확인된 신원에 연결할 수 있습니다. 그러나 딥페이크가 더욱 정교해짐에 따라 KYC 프로세스를 우회하여 악의적인 행위자가 허위 익명 신원을 생성할 수 있습니다. 이 질문에 대한 답변은 Worldcoin에서 확인할 수 있습니다.개인 신원 증명"(PoP)해결책이 나올 때까지 기다리십시오.
개인 식별은 WorldCoin이 지갑이 실제 사람의 것인지 확인하기 위해 사용하는 메커니즘이며, 한 사람당 하나의 지갑만 허용됩니다. 이를 위해 생체인식(홍채) 이미징 장치를 사용합니다.Orb지갑을 확인하기 위해. 생체인식 데이터는 아직 위조될 수 없기 때문에 소셜 미디어 계정을 고유한 WorldCoin 지갑에 연결하도록 요구하는 것은 악의적인 행위자가 부도덕한 온라인 행동을 숨기기 위해 여러 개의 익명 신원을 만드는 것을 방지할 수 있는 실행 가능한 방법입니다. 적어도 해커로부터 방법을 찾을 때까지 말이죠. 스푸핑 생체 인식 장치를 사용하면 딥페이크 KYC 문제를 해결할 수 있습니다.
3.1.3.4 경제적 인센티브
작성자는 잘못된 정보로 인해 처벌을 받을 수 있으며, 사용자는 잘못된 정보를 식별한 경우 보상을 받을 수 있습니다. 예를 들어,"진품채권"(진실성 채권)을 통해 미디어 조직은 출판물의 정확성을 걸고 잘못된 정보에 대해 재정적 처벌을 받을 수 있습니다. 이는 이러한 미디어 회사에 정보의 신뢰성을 보장할 재정적 이유를 제공합니다.
진위보증서는 다음과 같습니다."진실 시장"이 시장의 필수적인 부분인 다양한 시스템은 가장 효율적이고 강력한 방법으로 콘텐츠의 진위 여부를 확인하여 사용자 신뢰를 놓고 경쟁합니다. 이는 다음과 같은 증명 시장과 유사합니다.Succinct Network그리고=nil Proof Market, 그러나 진위 확인이라는 더 어려운 문제에 대한 것입니다.
암호화만으로는 충분하지 않습니다. 스마트 계약은 이러한 진실 시장이 기능하도록 하는 데 필요한 경제적 인센티브를 시행하는 수단으로 사용될 수 있으므로 블록체인 기술은 허위 정보에 맞서 싸우는 데 핵심적인 역할을 할 수 있습니다.
3.1.3.5 평판 점수
우리는 신뢰도를 표현하기 위해 평판을 사용할 수 있습니다. 예를 들어, 한 사람의 트위터 팔로어 수를 보면 그 사람이 말하는 것을 믿어야 할지 판단할 수 있습니다. 그러나 평판 시스템은 작가의 인기뿐만 아니라 각 작가의 실적을 고려해야 합니다. 우리는 신뢰성과 인기를 혼동하고 싶지 않습니다.
우리는 사람들이 무제한의 익명 신원을 생성하도록 허용할 수 없습니다. 그렇지 않으면 평판이 손상되었을 때 사회적 신용을 재설정하기 위해 신원을 포기할 수 있습니다. 이를 위해서는 이전 섹션에서 설명한 대로 복사할 수 없는 디지털 ID를 사용해야 합니다.
우리는 또한 사용할 수 있습니다"진실 시장"그리고"하드웨어 인증"이는 개인의 실제 기록을 추적하는 신뢰할 수 있는 방법이기 때문에 개인의 평판을 결정하는 증거입니다. 평판 시스템은 지금까지 논의된 다른 모든 솔루션의 정점이므로 가장 강력하고 포괄적인 접근 방식 제품군입니다.
그림 16: 머스크는 저널 기사, 편집자 및 출판물에 대한 신뢰성 점수를 제공할 웹사이트를 2018년에 만들겠다고 암시했습니다.
3.1.4 암호화 솔루션은 확장 가능합니까?
위에서 설명한 블록체인 솔루션에는 빠르고 대용량의 블록체인이 필요합니다. 그렇지 않으면 모든 이미지를 온체인에서 검증 가능한 시간 기록에 통합할 수 없습니다. 매일 온라인에 게시되는 데이터의 양이 기하급수적으로 증가함에 따라 이는 더욱 중요해지고 있습니다. 그러나 일부알고리즘은 다음을 수행할 수 있습니다.아직 검증 가능한 방식으로데이터를 압축합니다.
또한 하드웨어 인증을 통해 생성된 서명은 편집된 이미지 버전에서는 작동하지 않습니다. 편집 증명은 zk-SNARK를 사용하여 생성해야 합니다.ZK Microphone오디오에 대한 편집자 방지 구현입니다. 4
3.1.5 딥페이크는 본질적으로 나쁘지 않습니다.
모든 딥페이크가 해로운 것은 아니라는 점을 인정하는 것이 중요합니다. 이 기술은 또한 이와 같이 무고한 용도로 사용됩니다.Taylor Swift가 수학을 가르치는 AI 생성 비디오. 딥페이크의 저렴한 비용과 접근성으로 인해 개인화된 경험이 만들어집니다. 예를 들어,HeyGen사용자 허용자신과 꼭 닮은 AI 생성 얼굴로 개인 메시지 보내기. 심층 시뮬레이션은 더빙을 통해서도 번역됩니다.언어 격차 해소.
3.1.5.1 딥페이크를 통제하고 수익화하는 방법
딥페이크 기술을 기반으로 한 AI 대응 서비스는 높은 수수료를 부과하고 책임과 감독이 부족합니다. OnlyFans의 최고 영향력자인 Amouranth는 팬들이 그녀와 비공개로 채팅할 수 있도록 자신의 디지털 아바타를 게시했습니다. 이러한 스타트업은 액세스를 제한하거나 심지어 닫을 수도 있습니다.소울메이트(Soulmate)라는 AI 동반 서비스。
AI 모델을 체인에 호스팅함으로써 스마트 계약을 사용하여 투명한 방식으로 모델에 자금을 지원하고 제어할 수 있습니다. 이를 통해 사용자는 자신의 모델에 대한 액세스 권한을 잃지 않고 모델 작성자가 기여자와 투자자에게 이익을 분배하는 데 도움이 됩니다. 그러나 기술적인 어려움이 있습니다. 온체인 모델을 구현하는 데 가장 널리 사용되는 기술인 zkML(Giza, Modulus Labs 및 EZKL에서 사용)이 모델을 실행하게 됩니다.1000배 느림. 그럼에도 불구하고 이 하위 분야에 대한 연구는 계속되고 있으며 기술은 계속해서 개선되고 있습니다. 예를 들어,HyperOracle사용하려고opML,Aizel솔루션은 MPC(다자간 컴퓨팅) 및 TEE(신뢰할 수 있는 실행 환경)를 기반으로 구축되고 있습니다.
3.1.6 장 요약
정교한 딥페이크는 정치, 금융, 소셜 미디어에 대한 신뢰를 침식하고 있습니다."검증 가능한 네트워크"진실의 필요성과 민주적 완전성을 보존합니다.
딥페이크는 한때 비용이 많이 들고 기술 집약적인 노력이었지만 인공 지능의 발전으로 딥페이크를 쉽게 만들 수 있게 되면서 허위 정보 환경이 바뀌었습니다.
4 이 문제에 관심이 있으시면 연락주십시오.알비온.
역사는 미디어를 조작하는 것이 새로운 도전이 아니라는 것을 말해줍니다. 그러나 인공지능 덕분에 설득력 있는 가짜 뉴스를 만드는 것이 더 쉽고 저렴해졌으므로 새로운 솔루션이 필요합니다.
비디오 사기는 이전에 신뢰할 수 있다고 여겨졌던 증거를 손상시키고 사회를 실제 행동이 가짜로 전달될 수 있는 딜레마에 빠뜨리기 때문에 독특한 위험을 초래합니다.
기존 대응책은 인식, 플랫폼, 정책, 기술 접근 방식으로 구분되며, 각 접근 방식은 딥페이크에 효과적으로 대처하는 데 어려움을 겪고 있습니다.
하드웨어 증명과 블록체인은 각 이미지의 출처를 증명하고 투명하고 불변의 편집 기록을 생성함으로써 유망한 솔루션을 제공합니다.
암호화폐 지갑과 zk-KYC는 온라인 콘텐츠의 검증과 인증을 강화하는 동시에 온체인 평판 시스템과 경제적 인센티브를 제공합니다."진품채권")는 진실을 위한 시장을 제공합니다.
Crypto는 딥페이크의 긍정적인 사용을 인정하는 동시에 유익한 딥페이크를 화이트리스트에 추가하여 혁신과 무결성 사이의 균형을 맞추는 방법도 제안합니다.
3.2 쓰라린 교훈
이 진술은 직관에 어긋나지만 사실입니다. AI 커뮤니티는 맞춤형 접근 방식이 덜 효과적이라는 개념을 거부하지만,"쓰라린 교훈"여전히 적용됩니다. 가장 많은 컴퓨팅 성능을 사용하면 항상 최상의 결과가 생성됩니다.
우리는 더 많은 GPU, 더 많은 데이터 센터, 더 많은 교육 데이터를 확장해야 합니다.
컴퓨터 체스 연구자들은 최고의 인간 선수들의 경험을 활용하여 체스 엔진을 구축하려고 노력해 왔는데, 이는 연구자들이 틀렸음을 보여주는 예입니다. 최초의 체스 프로그램은 인간의 오프닝 전략을 모방했습니다."책을 여는 중"). 연구원들은 체스 엔진이 처음부터 최선의 수를 계산하지 않고도 강력한 위치에서 시작할 수 있기를 바라고 있습니다. 그들은 또한 많은 것을 포함하고 있습니다"전술적 휴리스틱"- 포크 등 인간 체스 선수가 사용하는 전술. 간단히 말해서, 체스 프로그램은 일반적인 계산 방법보다는 체스를 성공적으로 플레이하는 방법에 대한 인간의 통찰력을 기반으로 구축되었습니다.
그림 18: 포크 - 퀸이 두 기물을 공격합니다.
그림 19: 체스 오프닝 시퀀스의 예
1997년 IBM의 DeepBlue는 엄청난 컴퓨팅 성능과 검색 기반 기술을 결합하여 세계 체스 챔피언을 이겼습니다. DeepBlue가 모든 것을 능가하지만"인간의 디자인"체스 엔진이지만 체스 연구자들은 그것을 피합니다. 그들은 DeepBlue의 성공이 체스 전략(그들의 견해로는 조잡한 해결책)을 사용하지 않았기 때문에 오래 가지 못했다고 주장했습니다. 그들은 틀렸습니다. 장기적으로 볼 때 일반적인 문제에 많은 양의 계산을 적용하는 솔루션은 맞춤형 솔루션보다 더 나은 결과를 생성하는 경향이 있습니다. 이 높은 컴퓨팅 이데올로기는
성공적으로 생성됨바둑 엔진(AlphaGo), 향상된 음성 인식 기술, 더욱 안정적인 컴퓨터 비전 기술.
고도로 계산된 AI 방법의 최신 성과는 OpenAI의 ChatGPT입니다. 이전 시도와 달리 OpenAI는 언어가 소프트웨어에 어떻게 작동하는지에 대한 인간의 이해를 인코딩하려고 시도하지 않습니다. 대신, 그들의 모델은 인터넷의 방대한 양의 데이터와 대규모 컴퓨팅을 결합합니다. 다른 연구자와 달리 그들은 소프트웨어에 개입하거나 편견을 삽입하지 않았습니다. 장기적으로 가장 성능이 좋은 접근 방식은 항상 많은 양의 계산을 활용하는 범용 방법을 기반으로 합니다. 이것은 역사적 사실이며, 사실 우리는 이것이 영원히 사실이라는 것을 증명할 수 있는 충분한 증거를 가지고 있을 것입니다.
거대한 컴퓨팅 성능과 엄청난 양의 데이터를 결합하는 것이 장기적으로 가장 좋은 접근 방식이며, 그 이유는 무어의 법칙입니다. 컴퓨팅 비용은 시간이 지남에 따라 기하급수적으로 감소합니다. 단기적으로는 컴퓨팅 대역폭이 크게 증가할지 확신할 수 없으며, 이로 인해 연구자들은 인간의 지식과 알고리즘을 소프트웨어에 수동으로 삽입하여 기술을 개선하려고 할 수 있습니다. 이 접근 방식은 한동안 효과가 있을 수 있지만 장기적으로는 성공하지 못할 것입니다. 인간의 지식을 기본 소프트웨어에 내장하면 소프트웨어가 더 복잡해지고 추가 컴퓨팅 성능으로 모델을 개선할 수 없게 됩니다. 이는 인위적인 접근 방식을 근시안적으로 만들기 때문에 Sutton은 인위적인 기술을 무시하고 일반적인 컴퓨팅 기술에 더 많은 컴퓨팅 성능을 적용하는 데 집중할 것을 권장합니다.
씁쓸한 교훈은 분산형 인공 지능을 구축하는 방법에 대해 큰 의미를 갖습니다.
대규모 네트워크 구축: 위에서 배운 교훈은 대규모 AI 모델을 개발하고 이를 교육하기 위해 대규모 컴퓨팅 리소스를 모으는 것이 시급하다는 점을 강조합니다. 이는 인공 지능의 새로운 영역으로 진입하는 데 중요한 단계입니다.Akash、GPUNet그리고IoNetAlibaba Cloud와 같은 회사는 확장 가능한 인프라 제공을 목표로 합니다.
그림 20: Amazon AWS 등 다른 제공업체와 Akash 가격 비교
하드웨어 혁신: ZKML 방법은 비ZKML 방법보다 1000배 느리게 실행된다는 이유로 비판을 받아왔습니다. 이는 신경망이 직면한 비판을 반영합니다. 1990년대에는 신경망이 큰 가능성을 보였습니다. 작은 신경망인 Yann LeCun의 CNN 모델은 손으로 쓴 숫자 이미지를 성공적으로 분류할 수 있었습니다(아래 이미지 참조). 1998년에는 미국 은행의 10% 이상이 수표를 읽는 데 이 기술을 사용했습니다. 그러나 이러한 CNN 모델은 확장되지 않았기 때문에 이러한 신경망에 대한 관심이 급감했고 컴퓨터 비전 연구자들은 더 나은 시스템을 만들기 위해 인간의 지식을 활용하는 방향으로 전환했습니다. 2012년에 연구자들은 컴퓨터 그래픽(게임, CGI 등)을 생성하는 데 일반적으로 사용되는 인기 있는 하드웨어인 GPU의 계산 효율성을 활용하여 새로운 CNN을 개발했습니다. AlexNet이라고 불리는 이 네트워크는 딥러닝 혁명을 촉발시켰습니다.
그림 22: 1990년대의 신경망은 저해상도 디지털 이미지만 처리할 수 있었습니다.
그림 23: AlexNet(2012)은 복잡한 이미지를 처리할 수 있으며 모든 대체 방법을 능가합니다.
컴퓨팅 비용은 항상 낮아지고 있기 때문에 인공 지능 기술의 업그레이드는 불가피합니다. ZK 및 FHE와 같은 기술을 위한 맞춤형 하드웨어는 발전을 가속화할 것입니다.Ingonyama기업과 학계가 그 길을 닦고 있습니다. 장기적으로는 더 큰 컴퓨팅 성능을 적용하고 효율성을 향상시켜 대규모 ZKML을 달성할 것입니다. 유일한 질문은 이러한 기술을 어떻게 활용할 것인가입니다.
그림 24: ZK 증명자 하드웨어 발전의 예(원천)
데이터 확장: AI 모델의 크기와 복잡성이 증가함에 따라 그에 따라 데이터 세트를 확장해야 합니다. 일반적으로 과적합을 방지하고 안정적인 성능을 보장하려면 모델 크기에 따라 데이터 세트의 크기가 기하급수적으로 증가해야 합니다. 수십억 개의 매개변수가 있는 모델의 경우 이는 수십억 개의 토큰이나 예시가 포함된 데이터 세트를 선별하는 것을 의미하는 경우가 많습니다. 예를 들어 Google의 BERT 모델은 25억 개가 넘는 단어가 포함된 전체 영어 Wikipedia와 약 8억 단어가 포함된 BooksCorpus에 대해 학습되었습니다. Meta의 LLama는 1조 4천억 개의 단어 라이브러리에서 훈련되었습니다. 이 숫자는 우리에게 필요한 데이터 세트의 크기를 강조하며, 모델이 수조 개의 매개변수를 향해 이동함에 따라 데이터 세트는 더욱 커져야 합니다. 이러한 확장을 통해 모델은 인간 언어의 뉘앙스와 다양성을 포착할 수 있으므로 대규모 고품질 데이터 세트를 개발하는 것은 모델 자체의 아키텍처 혁신만큼 중요합니다. Giza, Bittensor, Bagel 및 FractionAI와 같은 회사는 이 분야의 특정 요구 사항을 해결하고 있습니다(모델 붕괴, 적대적 공격, 품질 보증 문제와 같은 데이터 도메인 문제에 대한 자세한 내용은 5장 참조).
일반적인 접근 방식 개발: 분산형 AI 분야에서 ZKP 및 FHE와 같은 기술은 즉각적인 효율성을 추구하기 위해 애플리케이션별 접근 방식을 채택합니다. 특정 아키텍처에 맞게 솔루션을 조정하면 성능이 향상될 수 있지만 장기적인 유연성과 확장성을 희생하면서 광범위한 시스템 발전이 제한될 수 있습니다. 대신, 일반적인 접근 방식에 초점을 맞추면 초기 비효율성에도 불구하고 확장 가능하고 다양한 애플리케이션과 향후 개발에 적응할 수 있는 기반이 제공됩니다. 무어의 법칙과 같은 추세에 따라 컴퓨팅 성능이 향상되고 비용이 감소함에 따라 이러한 방법이 인기를 끌게 되었습니다. 단기적인 효율성과 장기적인 적응성 중에서 선택하는 것이 중요합니다. 공통 접근 방식을 강조하면 지속적인 성공과 관련성을 보장하기 위해 컴퓨팅 기술의 발전을 최대한 활용하는 강력하고 유연한 시스템으로서 분산형 AI의 미래를 준비할 수 있습니다.
3.2.1 결론
제품 개발 초기 단계에서는규모에 제한을 받지 않는 접근 방식을 선택하세요.결정적일 수 있습니다. 이는 기업과 연구자 모두 사용 사례와 아이디어를 평가하는 데 중요합니다. 그러나 힘든 교훈을 통해 우리는 장기적으로 일반적이고 확장 가능한 접근 방식을 선호한다는 사실을 항상 염두에 두어야 한다는 사실을 배웠습니다.
다음은 자동 범용 미분으로 대체되는 수동 방법의 예입니다. TensorFlow 및 PyTorch와 같은 자동 미분(autodiff) 라이브러리를 사용하기 전에 기울기는 일반적으로 수동 또는 수치 미분으로 계산되었습니다. 이는 비효율적이고 오류가 발생하기 쉬운 방법입니다. 자동 미분과 달리 문제를 일으키고 연구자의 시간을 낭비할 수 있습니다. Autodiff 라이브러리는 실험 속도를 높이고 모델 개발을 단순화하므로 Autodiff는 오늘날 없어서는 안 될 도구가 되었습니다. 따라서 일반적인 솔루션이 승리합니다. 그러나 autodiff가 성숙하고 사용 가능한 솔루션이 될 때까지 ML 연구를 수행하려면 기존 수동 접근 방식이 필요합니다.
어쨌든 리치 서튼의"쓰라린 교훈"인공지능이 인간이 아는 방법을 흉내내려고 하기보다 인공지능의 컴퓨팅 파워를 극대화할 수 있다면 인공지능은 더 빨리 발전할 것이라고 말해주세요. 우리는 기존 컴퓨팅 성능을 확장하고, 데이터를 확장하고, 하드웨어를 혁신하고, 보편적인 방법을 개발해야 합니다. 이러한 접근 방식을 채택하는 것은 분산형 AI 분야에 많은 영향을 미칠 것입니다. 하지만"쓰라린 교훈"연구 초기 단계에는 적용할 수 없지만 장기적으로는 항상 사실일 수 있습니다.
3.3 AI Agent(인공지능 에이전트)는 Google과 Amazon을 전복시킬 것입니다.
3.3.1 구글의 독점 문제
온라인 콘텐츠 제작자는 콘텐츠 게시를 위해 Google에 의존하는 경우가 많습니다. 결과적으로 Google이 자신의 작업을 색인화하고 표시하도록 허용하면 꾸준한 관심과 광고 수익을 얻을 수 있습니다. 그러나 그 관계는 고르지 않습니다. Google은 독점(검색 엔진 트래픽의 80% 이상)을 보유하고 있으며 콘텐츠 제작자가 따라올 수 없는 시장 점유율을 갖고 있습니다. 결과적으로 콘텐츠 제작자는 수익을 얻기 위해 Google 및 기타 거대 기술 기업에 크게 의존하고 있습니다. Google의 한 가지 결정으로 인해 개인의 비즈니스가 종료될 수도 있습니다.
원래 웹사이트를 클릭하지 않고도 사용자 쿼리에 대한 답변을 표시하는 Google의 추천 스니펫 기능이 출시되면서 이제 검색 엔진을 떠나지 않고도 정보를 얻을 수 있게 되면서 문제가 더욱 부각되었습니다. 이는 콘텐츠 제작자가 성장하는 규칙을 방해합니다. 콘텐츠 제작자는 Google에서 자신의 콘텐츠를 색인화하는 대가로 자신의 웹사이트가 추천 트래픽과 눈길을 끌기를 바랍니다. 대신 추천 스니펫 기능을 사용하면 Google이 트래픽에서 제작자를 제외하면서 콘텐츠를 요약할 수 있습니다. 콘텐츠 제작자의 분산된 특성으로 인해 Google의 결정에 대해 집단적 조치를 취할 수 있는 힘이 거의 없습니다. 통일된 목소리가 없으면 개별 사이트는 협상력이 부족합니다.
그림 25: Featured Snippet 기능의 예
Google은 사용자 쿼리에 대한 답변 소스 목록을 제공하여 추가 실험을 했습니다.아래 예The New York Times, Wikipedia, MLB.com 등의 출처가 포함되어 있습니다. Google이 직접 답변을 제공하므로 이러한 사이트에는 많은 트래픽이 발생하지 않습니다.
그림 26:"웹에서"기능예
3.3.2 OpenAI의 독점 문제
Google의 추천 스니펫 기능은 우려스러운 점을 나타냅니다.