Web3 분산 스토리지의 생태적 환경에 대한 개요

BTC0.0₂₀

ETH0.0₂₀

HTX0.0₂₀

SOL0.0₂₀

BNB0.0₂₀

BTC0.0₂₀

ETH0.0₂₀

HTX0.0₂₀

SOL0.0₂₀

BNB0.0₂₀

Web3 분산 스토리지의 생태적 환경에 대한 개요

Foresight News

2022-06-23 10:30

本文约8243字，阅读全文需要约33分钟

Filecoin, Arweave, Storj, Crust Network, Sia, Swarm 중 최고의 탈중앙화 스토리지 솔루션은?

원래 번역: 티아

이미지 설명

그림 1: 각 Web3 기둥에 대한 예제 프로젝트

두 번째 기둥인 스토리지는 빠르게 성숙하고 있으며 다양한 스토리지 솔루션이 사용 시나리오에 적용되었습니다. 이 기사에서는 분산형 스토리지의 기둥에 대해 자세히 살펴보겠습니다.

그리고Arweave그리고Crust Network다운로드.

분산형 스토리지의 필요성

블록체인 관점

블록체인의 관점에서 우리는 블록체인 자체가 많은 양의 데이터를 저장하도록 설계되지 않았기 때문에 분산형 스토리지가 필요합니다. 블록 합의를 얻기 위한 메커니즘은 소량의 데이터(트랜잭션)에 의존하며, 이는 블록(컬렉션 트랜잭션)에 배치되고 노드 검증을 위해 네트워크에 빠르게 공유됩니다.

이미지 설명

그림 2: 활성 메인넷이 있는 프로젝트. 영속성에 대한 Arweave의 정의를 충족시키기 위해 200년의 저장 기간이 선택되었습니다. 출처: 웹 문서, Arweave 스토리지 계산기

둘째, 이러한 블록에 많은 양의 차익거래 데이터를 저장하고자 하면 네트워크 정체가 심해져 네트워크 사용 시 가스 전쟁이 발생하고 가격이 상승하게 됩니다. 이것은 블록의 암시적 시간 가치의 결과입니다. 사용자가 특정 시간에 네트워크에 트랜잭션을 제출해야 하는 경우 트랜잭션의 우선 순위를 지정하기 위해 추가 가스 요금을 지불해야 합니다.

따라서 NFT 메타데이터 및 이미지 데이터, dApp 오프체인의 프런트 엔드를 저장하는 것이 좋습니다.

중앙 집중식 네트워크의 관점

데이터를 온체인에 저장하는 것이 너무 비싸다면 중앙 집중식 네트워크에 오프체인으로 저장하는 것은 어떨까요?

중앙 집중식 네트워크는 검열과 가변성이 발생하기 쉽습니다. 이를 위해서는 사용자가 데이터의 보안을 유지하기 위해 데이터 공급자를 신뢰해야 합니다. 중앙 집중식 네트워크의 운영자가 사용자의 신뢰에 진정으로 부응할 것이라는 보장은 없습니다. 데이터는 의도적으로 또는 우발적으로 지워질 수 있습니다. 예를 들어 데이터 공급자 정책 변경, 하드웨어 오류 또는 제3자의 공격 때문일 수 있습니다.

NFTs

이미지 설명

그림 3: 마지막 판매를 기반으로 한 Crypto Punk 예비 가격(작성 당시 예비 가격 없음) Crypto Punks V2 체인의 바이트 문자열 바이트 길이를 기반으로 한 Crypto Punk 이미지 크기. 2022년 5월 10일 기준 데이터. 출처: OpenSea, 온체인 데이터, IPFS 메타데이터

이미지 설명

그림 4: 블록체인, 블록, NFT 및 오프체인 메타데이터의 단순화된 그림

틀림없이 NFT의 가치는 주로 그들이 참조하는 메타데이터 및 이미지 데이터에 의해 결정되는 것이 아니라 컬렉션을 주도하는 움직임과 생태계 커뮤니티에 의해 결정됩니다. 이것이 사실일 수도 있지만 NFT는 기본 데이터 없이는 의미가 없으며 의미 없는 커뮤니티는 형성될 수 없습니다.

프로필 사진과 예술품 수집품 외에도 NFT는 부동산이나 금융 상품과 같은 실제 자산의 소유권을 나타낼 수도 있습니다. 이러한 데이터의 외부 실제 값 외에도 해당 값이 NFT로 표시되기 때문에 NFT에 저장된 데이터의 각 바이트 값은 체인의 NFT 값보다 낮지 않습니다.

dApps

이미지 설명

그림 5: 블록체인과 상호 작용하는 dApp의 단순화된 그림

이미지 설명

그림 6: 2022년 5월 11일 현재 DappRadar에서 보고한 USD 거래량 기준 가장 인기 있는 dApp

이미지 설명

그림 7: Aave 설립자 Stani Kulechov는 Aave dApp 프런트 엔드가 2022년 1월 20일에 오프라인 상태가 되지만 IPFS에서 호스팅하는 웹 사이트 사본을 통해 계속 액세스할 수 있다고 트윗했습니다.

분산형 스토리지는 서버 오류, DNS 해킹 및 dApp 프런트엔드에 대한 액세스를 제거하는 중앙 집중식 엔터티를 줄입니다. dApp 개발이 중단되더라도 프론트엔드를 통해 스마트 컨트랙트에 계속 액세스할 수 있습니다.

분산형 스토리지 환경

이미지 설명

그림 8: 임의로 선택한 일부 분산 스토리지 프로토콜의 개요(일부)

많은 차이점에도 불구하고 위의 모든 프로젝트에는 한 가지 공통점이 있습니다. 이러한 네트워크 중 어느 것도 모든 노드의 모든 데이터를 복제하지 않는다는 것입니다. 이는 비트코인 및 이더리움 블록체인의 경우입니다. 분산형 스토리지 네트워크에서 저장된 데이터의 불변성과 가용성은 비트코인과 이더리움의 경우처럼 연속적으로 연결된 데이터를 저장하고 검증하는 대부분의 네트워크에 의해 달성되지 않습니다. 앞에서 언급했듯이 많은 네트워크는 블록체인을 사용하여 스토리지 주문을 추적합니다.

분산형 스토리지 네트워크의 모든 노드가 모든 데이터를 저장하는 것은 지속 불가능합니다. 네트워크를 실행하는 간접 비용으로 인해 사용자의 스토리지 비용이 빠르게 증가하고 결국 네트워크를 감당할 수 있는 소수의 노드로 집중화할 수 있기 때문입니다. 하드웨어 비용 노드 운영자.

따라서 분산형 스토리지 네트워크는 특별한 문제를 극복해야 합니다.

분산 스토리지의 과제

온체인 데이터 저장과 관련하여 앞서 언급한 제한 사항을 검토하면 탈중앙화 저장 네트워크는 네트워크의 가치 전송 메커니즘에 영향을 미치지 않는 방식으로 데이터를 저장하는 동시에 데이터가 지속적이고 변경 불가능하며 액세스 가능한 상태로 유지되어야 한다는 것이 분명합니다. 본질적으로 분산형 스토리지 네트워크는 데이터를 저장하고, 데이터를 검색하고, 데이터를 유지할 수 있어야 하며 네트워크의 모든 참여자가 수행하는 저장 및 검색 작업에 대해 인센티브를 받는 동시에 분산형 시스템 불신을 유지해야 합니다.

이러한 과제는 다음 질문으로 요약할 수 있습니다.

데이터 저장 형식: 전체 파일 또는 파일 조각을 저장합니까?
데이터 복제: 데이터(전체 파일 또는 단편)를 저장할 노드 수는?
스토리지 추적: 네트워크는 파일을 검색할 위치를 어떻게 알 수 있습니까?
저장된 데이터 증명: 노드가 저장하도록 요청받은 데이터를 저장하고 있습니까?
시간 경과에 따른 데이터 가용성: 시간 경과에 따라 데이터가 계속 저장됩니까?
스토리지 가격 발견: 스토리지 비용은 어떻게 결정됩니까?
영구 데이터 중복성: 노드가 네트워크를 떠나는 경우 네트워크는 어떻게 데이터를 계속 사용할 수 있는지 확인합니까?
데이터 전송: 네트워크 대역폭에는 대가가 따릅니다. 요청 시 노드가 데이터를 검색하도록 어떻게 보장합니까?
네트워크 토큰 경제학: 네트워크에서 데이터를 사용할 수 있는지 확인하는 것 외에도 네트워크가 네트워크의 장기적인 존재를 어떻게 보장할 수 있습니까?

이미지 설명

그림 9: 감사된 스토리지 네트워킹에 대한 기술 설계 결정 요약

또는Arweave또는Crust Network전체 연구 기사를 읽으십시오.

이미지 설명

그림 10: 데이터 복제 및 삭제 코딩

이러한 네트워크에는 네트워크에 데이터를 저장하는 데 사용되는 두 가지 주요 방법이 있습니다: 전체 파일 저장 및 삭제 코딩 사용: Arweave 및 Crust Network는 전체 파일을 저장하는 반면 Filecoin, Sia, Storj 및 Swarm은 모두 삭제 코딩을 사용합니다. 삭제 코딩에서 데이터는 고정된 크기의 조각으로 나뉘며 각 조각은 중복 데이터로 확장 및 인코딩됩니다. 각 조각에 저장된 중복 데이터로 인해 조각의 하위 집합만 원본 파일을 재구성해야 합니다.

데이터 복제

이미지 설명

그림 11: 데이터 저장 형식은 검색 및 재구성에 영향을 미칩니다.

데이터를 저장하고 복제하는 데 사용되는 방법은 네트워크가 데이터를 검색하는 방법에 영향을 미칩니다.

스토리지 추적

이미지 설명

그림 12: blockweave의 세 노드 그림

결국 Storj와 Swarm은 완전히 다른 두 가지 접근 방식을 취합니다. Storj에서 위성 노드라고 하는 두 번째 노드 유형은 데이터가 저장된 위치를 관리하고 추적하는 스토리지 노드 그룹의 코디네이터 역할을 합니다. Swarm에서 데이터 주소는 데이터 블록에 직접 포함됩니다. 데이터를 검색할 때 네트워크는 데이터 자체를 기반으로 찾을 위치를 알고 있습니다.

저장된 데이터 증명

각 네트워크는 데이터 저장 방법을 증명할 때 고유한 접근 방식을 사용합니다. Filecoin은 먼저 스토리지 노드에 데이터를 저장한 다음 데이터를 섹터에 봉인하는 독점적인 스토리지 증명 메커니즘인 복제 증명을 사용합니다. 봉인 프로세스를 통해 동일한 데이터의 복제된 두 조각이 서로 고유하다는 것을 증명할 수 있으므로 올바른 수의 복사본이 네트워크에 저장되도록 합니다(따라서 "복제 증명").

Crust는 데이터 조각을 Merkle 트리로 해시되는 많은 작은 조각으로 나눕니다. Crust는 물리적 저장 장치에 저장된 단일 데이터의 해시 결과를 예상되는 Merkle 트리 해시 값과 비교하여 파일이 올바르게 저장되었는지 확인할 수 있습니다. 이것은 Crust가 각 노드에 전체 파일을 저장하는 반면 Sia는 삭제 코딩된 조각을 저장한다는 점을 제외하면 Sia의 접근 방식과 유사합니다. Crust는 단일 노드에 전체 파일을 저장할 수 있으며 하드웨어 소유자도 액세스할 수 없는 봉인된 하드웨어 구성 요소인 노드의 TEE(신뢰할 수 있는 실행 환경)를 사용하여 개인 정보를 보호할 수 있습니다. 크러스트(Crust)는 이 저장 증명 알고리즘을 "의미 있는 작업 증명(meaningful proof-of-work)"이라고 부르며, 의미는 저장된 데이터가 변경될 때만 새로운 해시가 계산되어 무의미한 작업을 줄인다는 것을 의미합니다. Crust와 Sia는 모두 데이터 무결성을 확인하기 위한 진실의 출처로 블록체인에 Merkle 루트 해시를 저장합니다.

Storj는 데이터 감사를 사용하여 데이터가 올바르게 저장되었는지 확인합니다. 데이터 감사는 Crust와 Sia가 Merkle 트리를 사용하여 데이터를 확인하는 방식과 유사합니다. Storj에서 충분한 노드가 감사 결과를 반환하면 네트워크는 블록체인의 진실 소스와 비교하는 대신 다수의 응답을 기반으로 결함이 있는 노드를 결정할 수 있습니다. Storj의 이 메커니즘은 개발자가 블록체인을 통해 네트워크 전반의 조정을 줄이면 속도(합의를 기다릴 필요 없음) 및 대역폭 사용(전체 네트워크가 블록체인과 주기적으로 통신할 필요 없음) 측면에서 성능을 향상시킬 수 있다고 믿기 때문에 의도적입니다. ).

Arweave는 암호화 작업 증명 퍼즐을 사용하여 파일이 저장되었는지 확인합니다. 이 메커니즘에서 노드가 다음 블록을 채굴할 수 있으려면 이전 블록과 네트워크 블록 기록의 다른 임의 블록에 대한 액세스 권한이 있음을 증명해야 합니다. Arweave에 업로드된 데이터는 블록에 직접 저장되기 때문에 스토리지 제공자가 이전 블록에 대한 액세스를 증명하여 파일을 올바르게 저장했음을 입증합니다.

마지막으로, Merkle 트리는 파일 위치를 결정하는 데 사용되지 않고 대신 데이터 블록이 Merkle 트리에 직접 저장된다는 점에서 Swarm에서도 사용됩니다. 스웜에 데이터를 저장할 때 트리의 루트 해시(데이터가 저장되는 주소이기도 함)는 파일이 제대로 청크되어 저장되었음을 증명합니다.

시간 경과에 따른 데이터 가용성

마찬가지로 각 네트워크에는 특정 기간 동안 데이터가 저장되었는지 확인하는 고유한 방법이 있습니다. Filecoin에서 네트워크 대역폭을 줄이기 위해 스토리지 광부는 데이터가 저장되는 기간 동안 지속적으로 복제 증명 알고리즘을 실행해야 합니다. 각 기간의 결과 해시는 특정 기간 동안 올바른 데이터가 저장 공간을 점유했음을 증명하므로 "시간과 공간의 증거"입니다.

Crust, Sia 및 Storj는 주기적으로 임의의 데이터 조각을 검증하고 조정 메커니즘인 Crust 및 Sia의 블록체인과 Storj의 위성 노드에 결과를 보고합니다. Arweave는 액세스 증명 메커니즘을 통해 데이터의 일관된 가용성을 보장합니다. 이를 통해 채굴자는 마지막 블록에 대한 액세스 권한이 있을 뿐만 아니라 임의의 기록 블록에 대한 액세스 권한이 있음을 증명해야 합니다. 더 오래되고 희귀한 블록을 저장하는 것은 채굴자가 특정 블록에 액세스하기 위한 전제 조건인 작업 증명 퍼즐에서 이길 가능성을 높이기 때문에 인센티브입니다.

반면에 Swarm은 시간이 지남에 따라 덜 인기 있는 데이터를 보유하는 노드에 대해 보상하는 정기적인 경품 행사를 실행하는 동시에 노드가 더 오랜 기간 동안 저장하기로 약속한 데이터에 대한 소유권 증명 알고리즘을 실행합니다.

Filecoin, Sia 및 Crust는 노드가 스토리지 노드가 되기 위해 담보를 예치해야 하는 반면 Swarm은 장기 스토리지 요청에만 필요합니다. Storj는 선행 담보를 요구하지 않지만 Storj는 광부로부터 스토리지 수익의 일부를 보류합니다. 마지막으로 모든 네트워크는 데이터를 증명할 수 있는 기간 동안 정기적으로 노드에 비용을 지불합니다.

스토리지 가격 발견

스토리지 가격을 결정하기 위해 Filecoin과 Sia는 스토리지 공급자가 요구 가격을 설정하고 스토리지 사용자가 지불할 가격을 설정하는 스토리지 시장 및 몇 가지 기타 설정을 사용합니다. 그런 다음 스토리지 마켓플레이스는 사용자를 요구 사항을 충족하는 스토리지 공급자와 연결합니다. Storj는 네트워크의 모든 노드를 연결하는 단일 네트워크 전체 시장이 없다는 주요 차이점을 제외하고 유사한 접근 방식을 취합니다. 대신 각 위성에는 상호 작용하는 자체 스토리지 노드 세트가 있습니다.

결국 Crust, Arweave 및 Swarm은 모두 프로토콜이 스토리지 가격을 결정하도록 합니다. Crust 및 Swarm은 사용자의 파일 저장 요구 사항에 따라 특정 방식으로 구성할 수 있으며 Arweave의 파일은 영구적으로 저장됩니다.

지속적인 데이터 중복

시간이 지남에 따라 노드는 이러한 개방형 공용 네트워크를 떠날 것이며 노드가 사라지면 저장한 데이터도 사라집니다. 따라서 네트워크는 시스템에서 어느 정도의 중복성을 능동적으로 유지해야 합니다. Sia와 Storj는 조각의 하위 집합을 수집하고 기본 데이터를 재구성한 다음 파일을 다시 인코딩하여 누락된 조각을 다시 만들고 손실된 삭제 코딩된 조각을 보완하여 중복성을 달성합니다. Sia에서 사용자는 Sia 클라이언트에 주기적으로 로그인하여 샤드를 보충해야 합니다. 클라이언트만이 어떤 데이터 샤드가 어떤 데이터에 속하는지, 사용자를 구분할 수 있기 때문입니다. 그러나 Storj에서 Satellite는 항상 온라인 상태이며 주기적으로 데이터 감사를 실행하여 데이터 단편을 보완합니다.

Arweave의 액세스 증명 알고리즘은 데이터가 항상 네트워크를 통해 정기적으로 복제되는 반면 Swarm에서는 데이터가 서로 가까운 노드에 복제됩니다. Filecoin에서 시간이 지남에 따라 데이터가 사라지고 나머지 파일 조각이 특정 임계값 아래로 떨어지면 스토리지 주문이 스토리지 시장에 다시 도입되어 다른 스토리지 광부가 스토리지 주문을 인수할 수 있습니다. Crust의 보충 메커니즘은 현재 개발 중입니다.

인센티브 데이터 전송

이미지 설명

그림 13: SWAP(Swarm Accounting Protocol), 출처: Swarm 백서

토큰 경제

이미지 설명

그림 14: 스토리지 네트워크에 대한 감사된 토크노미 설계 결정.

어떤 것이 최고의 네트워크입니까?

한 네트워크가 다른 네트워크보다 객관적으로 더 낫다고 말할 수는 없습니다. 분산형 스토리지 네트워크를 설계할 때 수많은 장단점이 있습니다. Arweave는 데이터를 영구적으로 저장하는 데 적합하지만 Arweave는 Web2.0 업계 플레이어를 Web3.0으로 마이그레이션하는 데 반드시 적합한 것은 아닙니다. 모든 데이터를 영구적으로 보관할 필요는 없습니다. 그러나 데이터의 강력한 하위 필드에는 NFT 및 dApp과 같은 영속성이 필요합니다.

궁극적으로 설계 결정은 네트워크의 목적을 기반으로 합니다.

다음은 아래에 정의된 일련의 척도에서 서로 비교되는 다양한 스토리지 네트워크의 요약 프로필입니다. 사용된 규모는 이러한 네트워크의 비교 차원을 반영하지만 분산형 스토리지의 문제를 극복하기 위한 접근 방식은 많은 경우에 더 좋거나 나쁘지 않으며 단순히 설계 결정을 반영한다는 점에 유의해야 합니다.

저장 매개변수 유연성: 사용자가 파일의 저장 매개변수를 제어하는 정도
스토리지 지속성: 네트워크를 통해 파일 스토리지가 이론적으로(즉, 개입 없이) 지속 가능한 정도
중복 지속성: 보충 또는 수리를 통해 데이터 중복성을 유지하는 네트워크의 기능
데이터 전송 인센티브: 노드가 관대하게 데이터를 전송하도록 네트워크가 보장하는 정도
스토리지 추적의 보편성: 데이터가 저장되는 노드 간의 합의 정도
보장된 데이터 액세스 가능성: 스토리지 프로세스의 단일 참가자가 네트워크의 파일에 대한 액세스를 제거할 수 없도록 하는 네트워크의 기능

점수가 높을수록 위의 각 항목에서 더 큰 역량을 나타냅니다.

이미지 설명

그림 15: Filecoin 요약 개요

Crust의 토큰 경제학은 중복성과 빠른 검색을 보장하여 트래픽이 많은 dApp에 적합하고 인기 있는 NFT의 데이터를 빠르게 검색하는 데 적합합니다.

이미지 설명

그림 16: 크러스트 요약 개요

이미지 설명

그림 17: Sia 요약 개요

이미지 설명

그림 18: Arweave 요약 개요

이미지 설명

그림 19: Storj 요약 개요

이미지 설명

그림 20: Swarm 요약 개요

이미지 설명

그림 21: 검토한 스토리지 네트워크의 강력한 사용 사례 요약

결국 네트워크의 목적과 최적화하려는 특정 사용 사례에 따라 다양한 설계 결정이 결정됩니다.

다음 장

Web3 인프라 기둥(합의, 스토리지, 컴퓨팅)으로 돌아가서 분산형 스토리지 공간에는 특정 사용 사례를 위해 시장에서 자신을 포지셔닝한 소수의 강력한 플레이어가 있음을 알 수 있습니다. 이것은 기존 솔루션을 최적화하거나 새로운 틈새 시장을 포착하는 새로운 네트워크를 배제하지는 않지만 다음 질문을 제기합니다.

정답은 컴퓨팅입니다. 진정한 분산형 인터넷을 향한 다음 개척지는 분산형 컴퓨팅입니다. 현재 블록체인에서 스마트 계약을 실행하는 비용의 일부만으로 복잡한 dApp을 구동할 수 있는 신뢰할 수 없는 분산형 컴퓨팅 솔루션을 출시할 수 있는 솔루션은 소수에 불과합니다.비용은 더 복잡한 계산을 수행합니다.

인터넷 컴퓨터(ICP)와 홀로체인(HOLO)은 이 글을 쓰는 시점에 분산형 컴퓨팅 시장에서 강력한 존재감을 지닌 네트워크입니다. 그래도 컴퓨팅 공간은 합의 및 저장 공간만큼 혼잡하지 않습니다. 따라서 조만간 강력한 경쟁자가 시장에 진입하여 그에 따라 자리를 잡을 것입니다. Stratos(STOS)는 그러한 경쟁자 중 하나입니다. Stratos는 분산형 데이터 그리드 기술을 통해 고유한 네트워크 설계를 제공합니다.

끝

분산 스토리지에 대한 이 연구 기사를 읽어 주셔서 감사합니다. 공동 Web3 미래의 기본 빌딩 블록을 밝히기 위한 연구를 좋아한다면 Twitter에서 @FundamentalLabs를 팔로우하는 것을 고려해 보십시오.

중요한 개념이나 기타 정보가 누락된 경우? Twitter @0xPhillan에서 나와 연결하여 이 연구를 함께 공고히 할 수 있습니다.

전체 작업은 다음에서 사용할 수 있습니다.Arweave、Crust Network에 획득

원본 링크

Web3.0

Foresight News

作者文库