讀心術:從零知識證明中提取「知識」
安比(SECBIT)实验室
2019-08-28 02:28
本文约9828字,阅读全文需要约39分钟
我們將分析下一個交互系統(安全協議)的三個性質:「完備性」、「可靠性」與「零知識」。

編者按:本文來自編者按:本文來自編者按:本文來自

有些理論非常有趣,零知識證明便是其中之一,摸索了許久,想寫點什麼,與大家一起討論。本文是『探索零知識證明』系列的第三篇。全文約8,000 字,少量數學公式。

本文已更新至Github

https://github.com/

And what, Socrates, is the food of the soul? Surely, I said, knowledge is the food of the soul. 

本文已更新至Github

—— 柏拉圖

二級標題

二級標題

  • 二級標題

  • 我們在許多介紹零知識證明的文章中都能看到這樣三個性質:

  • Soundness —— 可靠性

Completeness —— 完備性

Zero-Knowledge —— 零知識在『但是少有文章深入解釋這個特性背後的深意和洞見。

在『

Rather than giving a list of the events that are not allowed to occur, it (the definition of zero-knowledge proof) gives a maximalist simulation condition.

— Boaz Barak

系列(二)理解「模擬」

』一文中,我們介紹了「模擬器」這個概念。許多介紹文章避而不談「模擬」,但「模擬」可以說是安全協議中核心的核心,因為它是定義「安全性」的重要武器。

通常,我們定義安全會採用這樣一種方式,首先列出一些安全事件,然後說明:如果一個系統安全,那麼列出來的安全事件都不會發生。

  • 借用密碼學家Boaz Barak 的話,翻譯一下,「零知識證明」並不是通過給出一個不允許發生的事件列表來定義,而是直接給出了一個最極致的「模擬條件」。

  • 所謂「模擬條件」是指,通過「模擬」方法來實現一個「理想世界」,使之與「現實世界」不可區分;而由於在理想世界中不存在知識,所以可以推導出結論:現實世界滿足「零知識」。

  • 我們繼續分析下一個交互系統(安全協議)的三個性質:「完備性」、「可靠性」與「零知識」。

可靠性(Soundness):Alice 在沒有知識的情況下不能通過Bob 的驗證。

完備性(Completeness):Alice 在有知識的情況下可以通過Bob 的驗證。

零知識(Zero-knowledge):Alice 在交互的過程中不會洩露關於知識的任何信息。

我們可以看出來「可靠性」和「完備性」有一種「對稱性」。可靠性保證了惡意的Alice 一定失敗,而完備性保證了誠實的Alice 一定成功。

「完備性」比較容易證明,只要Alice 誠實,Bob 也誠實,那麼皆大歡喜。這好比,寫好一段代碼,餵了一個測試用例,跑完通過收工。

我們來想想「可靠性」應該如何定義?這個可靠性的逆否命題是:(在現實世界中)如果Alice 能通過Bob 的驗證,那麼Alice 一定有知識。或者說:Alice 知道那……個「秘密」!

下面的問題是如何證明Alice 知道一個「秘密」?

這好像也很難,對不對?假如我們需要證明一台機器知道一個「秘密」,最簡單的辦法就是我們在機器的硬盤裡,或者內存中找到這個「秘密」,但是這樣暴露了秘密。如果這台機器是黑盒子呢?或者是Alice 呢?我們沒有讀心術,猜不到她心裡的那個秘密。

如何定義「To Know」?

「零知識」保證了驗證者Bob 沒有(計算)能力來把和「知識」有關的信息「抽取」出來。不能抽取的「知識」不代表不存在。 「可靠性」保證了知識的「存在性」。只有「知識」在存在的前提下,保證「零知識」才有意義。』[1] 的核心技術之一。

二級標題

二級標題

  • sk = a

  • PK = aG

二級標題

簡潔的Schnorr 協議

Alice 擁有一個秘密數字,a,我們可以把這個數字想像成「私鑰」,然後把它「映射」到橢圓曲線群上的一個點a*G,簡寫為aG。這個點我們把它當做「公鑰」。

請注意「映射」這個詞,我們這裡先簡要介紹「同態」這個概念。橢圓曲線群有限域之間存在著一種同態映射關係。有限域,我們用Zq 這個符號表示,其中素數q是指有限域的大小,它是指從0, 1, 2, …, q-1 這樣一個整數集合。而在一條橢圓曲線上,我們通過一個基點,G,可以產生一個「循環群」,標記為0G, G, 2G, …, (q-1)G,正好是數量為q 個曲線點的集合。任意兩個曲線點正好可以進行一種「特殊的二元運算」,G + G = 2G,2G + 3G = 5G,看起來這個二元運算好像和「加法」類似,滿足交換律和結合律。於是我們就用+這個符號來表示。之所以把這個群稱為循環群,因為把群的最後一個元素(q-1)G,再加上一個G就回捲到群的第一個元素0G。

給任意一個有限域上的整數r,我們就可以在循環群中找到一個對應的點rG,或者用一個標量乘法來表示r*G。但是反過來計算是很「困難」的,這是一個「密碼學難題」—— 被稱為離散對數難題[2]。

也就是說,如果任意給一個橢圓曲線循環群上的點R,那麼到底是有限域中的哪一個整數對應R,這個計算是很難的,如果有限域足夠大,比如說256bit 這麼大,我們姑且可以認為這個反向計算是不可能做到的。

Schnorr 協議充分利用了有限域和循環群之間單向映射,實現了最簡單的零知識證明安全協議:Alice 向Bob 證明她擁有PK 對應的私鑰sk。

第一步:為了保證零知識,Alice 需要先產生一個隨機數,r,這個隨機數的用途是用來保護私鑰無法被Bob 抽取出來。這個隨機數也需要映射到橢圓曲線群上,rG。

第二步:Bob 要提供一個隨機數進行挑戰,我們把它稱為c。

第三步:Alice 根據挑戰數計算z = r + a * c,同時把z發給Bob,Bob通過下面的式子進行檢驗:z*G ?= R + c*PK = rG + c*(aG )

  • 大家可以看到Bob 在第三步「同態地」檢驗z 的計算過程。如果這個式子成立,那麼就能證明Alice 確實有私鑰a。

  • 可是,這是為什麼呢?

  • 還有,在協議第一步中產生的隨機數r 保證了a 的保密性。因為任何一個秘密當和一個符合「一致性分佈」的隨機數相加之後的和仍然符合「一致性分佈」。

二級標題

二級標題

二級標題

證明零知識

我們這裡看一下Schnorr 協議如何證明一個弱一些的「零知識」性質——「SHVZK」:

注:這裡我們證明的僅僅是Special Honest Verifier Zero-Knowledge(SHVZK)。 SHVZK 要求協議中的Bob 的行為不能不按常理出牌,比如他必須按協議約定,在第二步時,去傳送帶上取一個新鮮的隨機數,並且立即使用。而通常意義上的「零知識」是不會對Bob 做任何要求,所以我們說這裡是一個弱一些的性質。雖然目前Schnorr 協議不能證明完全的「零知識」,但經過添加一些協議步驟,就可以達到完全零知識的目的,細節這裡不展開,有興趣的讀者請參考文獻[4]。以後我們在討論Fiat-Shamir 變換時,還會再次討論這個問題。

首先「模擬器」模擬一個「理想世界」,在理想世界中模擬出一個Zlice 和Bob 對話,Zlice 沒有Schnorr 協議中的知識,sk,而Bob 是有公鑰PK的。請大家看下圖,Bob 需要在Schnorr 協議中的第二步出示一個隨機數c,這裡有個額外的要求, 就是Bob 只能「誠實地」從一個外部「隨機數傳送帶」上拿一個隨機數,每一個隨機數都必須是事先拋k次「硬幣」產生的一個2^k 範圍內的一次性分佈隨機數。 Bob 不能採用任何別的方式產生隨機數,這就是為何我們要求Bob 是誠實的。

下面演示Zlice 如何騙過Bob:

序幕:請注意Zlice 沒有關於sk 的知識,這時Bob 的隨機數傳送帶上已經預先放置了一些隨機數。

第一步:Zlice 產生一個一致性分佈的隨機數c,並且利用一個新的「超能力」,將剛剛產生的隨機數c替換掉Bob 的隨機數傳送帶上第一個隨機數。這時候,Bob 無法察覺。

第二步:Zlice 再次產生一個隨機數z,然後計算R'=z*G - c*PK,並將R' 發送給Bob。

第三步:這時候Bob 會從隨機數傳送帶上取得c,並且將c 發送給Zlice。請注意這個c 正好就是第一步中Zlice 產生的c。

  • 第四步:Zlice 將第三步產生的隨機數z 發送給Bob,Bob 按照Schnorr 協議的驗證公式進行驗證,大家可以檢查下,這個公式完美成立。

  • 大家可以再對比下「現實世界」的Schnorr 協議,在兩個世界中,Bob 都能通過驗證。

  • 但區別是:

在「理想世界中」,Zlice 沒有sk;而在「現實世界中」,Alice 有sk

Q

在「理想世界中」,z 是一個隨機數,沒有涉及sk;而在「現實世界中」,z 的計算過程裡麵包含sk

這裡請大家思考下:

答案是不能。

如果Alice 能提前知道隨機數,那麼(現實世界中的)Alice 就可以按照模擬器Zlice 做法來欺騙Bob。

二級標題

二級標題

二級標題

再遇模擬器

其實,「可靠性」和「零知識」這兩個性質在另一個維度上也是存在著一種對稱性。可靠性保證了惡意的Alice 一定失敗,零知識保證了惡意的Bob 一定不會成功。有趣地是,這種對稱性將體現在模擬出來的「理想世界」中。

我們分析下可靠性這個定義:Alice 沒有知識導致Bob 驗證失敗。它的逆否命題為:Bob 驗證成功導致Alice 一定有知識。

我們再次求助模擬器,讓他在可以發揮超能力的「理想世界」中,去檢驗Alice 的知識。

再次,請大家設想在平行宇宙中,有兩個世界,一個是叫做「理想世界」,另一個叫做「現實世界」。理想世界有趣的地方在於它是被「模擬器」模擬出來的,同時模擬器可以在理想世界中放入帶有超能力的NPC。這次把Alice 的兩個分身同時放入「理想世界」與「現實世界」。

假設「你」扮演Bob 的角色,你想知道和你對話的Alice 是否真的是「可靠的」。於是把你放入「理想世界」,借助一個具有超能力的NPC,你可以把對面的Alice 的知識「抽取」出來。

W...hat?我們不是剛剛證明過:協議是零知識的嗎?零知識就意味著Bob 抽取不出任何的「知識」碎片。這裡敲黑板,「零知識」是對於「現實世界」而言的。我們現在正在討論的是神奇的「理想世界」。

重複一遍,在「理想世界」中,你可以藉助一個有超能力的NPC 來抽取Alice 的知識,從而可以保證「現實世界」中的Alice 無法作弊。可以想像一下,一個作弊的Alice,她肯定沒有知識,沒有知識也就不可能在「理想世界」中讓NPC 抽取到任何東西。然而在「現實世界」中,你無法借助NPC,當然也就看不到Alice 的知識,也就不會和「零知識」性質衝突。因為兩個世界發生的事件是「不可區分」的,我們可以得到這樣的結論:在「現實世界」中,Alice 一定是存在知識的。整理一下思路:如何證明在一個交互會話中Alice 不能作弊呢?我們需要為這個交互會話定義一個「模擬算法」,該算法可以模擬出一個「理想世界」,其中有一個特殊的角色叫做「抽取器」(Extractor),也就是我們前面說的NPC,它能夠通過「超能力」來「抽取」Alice 的知識,但是讓對方「無所察覺」。

注意,超能力是必不可少的!這一點在『

這個要取決於具體的交互系統的證明,我們接下來就先拿我們剛剛講過的Schnorr 協議切入。

二級標題

二級標題

二級標題

Proof of Knowledge :「知識證明」

我們來證明一下Schnorr 協議的「可靠性」,看看這個超能力NPC 如何在「理想世界」中把Alice 私鑰抽取出來。而這個「超能力」,仍然是「時間倒流」。
第一步:Alice 選擇一個隨機數r,並且計算R=r*G,並將R 發給「抽取器」

第二步:抽取器也選擇一個隨機的挑戰數c,並且發給Alice

第三步:Alice 計算並且回應z,然後抽取器檢查z是否正確

第四步:抽取器發現z 沒有問題之後,發動超能力,將時間倒回第二步之前

第五步:抽取器再次發送一個不同的隨機挑戰數c'給Alice,這時候Alice 回到第二步,會有一種似曾相識的感覺,但是無法感知到時間倒回這個事實

第六步:Alice 再次計算了z',然後發給抽取器檢查

注:並不是所有的可靠性都必須要求存在抽取器算法。採用抽取器來證明可靠性的證明系統被稱為「Proof of Knowledge」。

二級標題

二級標題

二級標題

解讀ECDSA 簽名攻擊

在區塊鏈系統中到處可見的ECDSA 簽名方案也是一個樸素的零知識證明系統。橢圓曲線數字簽名方案ECDSA 與Schnorr 協議非常接近,基於Schnorr 協議的簽名方案發表在1991年的『密碼學雜誌』[5]上。 1991年,正值美國國家標準局(NIST)選擇數字簽名算法,優雅的Schnorr 簽名方案居然被申請了專利,因此NIST 提出了另一套簽名方案DSA(Digital Signature Algorithm),隨後這個方案支持了橢圓曲線,於是被稱為ECDSA。中本聰在構思比特幣時,選擇了ECDSA 作為簽名算法,但是曲線並沒有選擇NIST 標準推薦的橢圓曲線—— secp256-r1,而是secp256-k1。因為江湖傳言,NIST 可能在橢圓曲線參數選擇上做了手腳,導致某些機構可以用不為人知的辦法求解離散對數難題,從而有能力在「現實世界」中具備超能力。有不少人在懷疑,也許當年中本聰在設計比特幣時,也有這種考慮,故意選擇了secp256-k1 這樣一條貌似安全性稍弱的曲線。

我們拆解下ECDSA 簽名,用交互的方式定義一個類似ECDSA 的認證方案,交互見下圖。

第一步:Alice 仍然是選擇一個隨機數k,並將k 映射到橢圓曲線上,得到點K ,然後發送給Bob

第二步:Bob 需要產生兩個隨機數,c 和e,然後交給Alice

第三步:Alice 計算s,並且發送給Bob,他來驗證s 的計算過程是否正確

注:對熟悉ECDSA 簽名方案的讀者,這里略作解釋,Bob 產生的c 對應被簽消息的Hash值Hash(m),而e 則是由一個轉換函數F(K)來產生。其中F(.) 是取橢圓曲線上的點的x 坐標經過(mod q) 得到[6]。

k = (c - c')/(s - s')a = (k * s - c)/e

江湖上流傳著一個說法:ECDSA 簽名方案有個嚴重的安全隱患,如果在兩次簽名中使用了同一個隨機數,那麼簽名者的私鑰將會暴露出來。其實Schnorr 簽名方案也有同樣的問題。

當年Sony PlayStation 3 的工程師在調用ECDSA 庫函數時,本來應該輸入隨機數的參數位置上,卻傳入了一個常數。熟悉密碼學的黑客們發現了這個嚴重的後門。 2011年1月,神奇小子Geohot 公開發布了Sony PS3 的主私鑰,這意味著任何用戶都可以輕鬆拿到遊戲機的root 權限。 Sony 隨後大為光火…… (後續故事大家可以上網搜)

如果Alice 在兩次交互過程中使用了同一個K,那麼Bob 可以通過發送兩個不同的c 和c' 來得到s 和s',然後通過下面的公式算出私鑰a:

那麼我們應該怎麼來看這個「安全後門」呢?大家想想看,這個安全後門和我們前面證明過的Schnorr 協議的可靠性證明幾乎一模一樣!這個算法正是ECDSA 認證協議的「可靠性」證明中的「抽取器」算法。只不過在可靠性證明中,為了讓Alice 使用同一個隨機數k 來認證兩次,「抽取器」需要利用「時間倒流」的超能力。

1: z1 = r1 + c1*a2: z2 = r2 + c2*a

但是在Sony PS3 系統中,隨機數被不明所以的工程師寫成了一個固定不變的值,這樣相當於直接賦予了黑客「超能力」,而這是在「現實世界」中。或者說,黑客在不需要「時間倒流」的情況下就能實現「抽取器」。

提醒下,不僅僅是隨機數不能重複的問題。而是隨機數必須是具有密碼學安全強度的隨機數。

設想下,如果隨機數r 是通過一個利用「線性同餘」原理的偽隨機數生成器產生,雖然r的值一直在變化,但是仍然不能阻止「知識抽取」。假設線性同餘算法為r2= d*r1 + e (mod m),還回到Schnorr 協議的第三步:

  • 如果攻擊者讓Alice 連續做兩次簽名,那麼將r2 代入r1 之後,就出現了兩個線性方程求解兩個未知數(r1, a) 的情況,z1, z2, c1, c2, d, e 對於攻擊者是已知的,這個方程組只用初中數學知識就可以求解。

  • 請注意,這並不是Schnorr 協議(或ECDSA 協議)的「設計缺陷」,恰恰相反,這是Schnorr 協議設計比較精巧的地方,它從原理上保證了協議的可靠性。類似技巧在密碼學協議中頻繁出現,達到一目了然的「簡潔」。但是也不得不說,如果不清楚協議的內在機制,尤其是區分不清楚「理想世界」與「現實世界」,使用者很容易引入各種花式的「安全漏洞」。

  • 「理想世界」中的「超能力」到底是什麼?

二級標題

二級標題

二級標題

腦洞:我們生活在模擬世界中嗎

第一次讀懂「模擬器」時,我第一時間想到的是電影『黑客帝國』。我們生活所在「現實世界」也許是某一個模擬器模擬出來的「理想世界」,我們所看到、聽到的以及感知到的一切都是被「模擬」出來的。在「現實世界」裡,我們活在一個母體中。然而我們並不能意識到這一點。

早在春秋戰國時期,莊子也在思考類似的問題:

昔者莊週夢為胡蝶,栩栩然胡蝶也。自喻適志與!不知周也。俄然覺,則蘧蘧然周也。不知周之夢為胡蝶與?胡蝶之夢為週與?週與胡蝶則必有分矣。此之謂物化。

——《莊子·齊物論》

通俗地解釋下:莊子有一天睡著了,夢見自己變成了一隻蝴蝶,翩翩起舞,醒來之後發現自己還是莊子,在夢中,蝴蝶並不知道自己是莊子。於是莊子沉思到底是他夢中變成了蝴蝶,還是蝴蝶夢中變成了莊子呢?如果夢境足夠真實,……

  • 「缸中之腦」是美國哲學家Gilbert Harman 提出的這樣一個想法:一個人的大腦可以被放入一個容器裡面,然後插上電線,通過模擬各種電信號輸入,使得大腦以為自己活在真實世界中。

  • 這個想法源自哲學家笛卡爾的《第一哲學沉思集》[7],在書中他論證我們應該懷疑一切,需要逐一檢驗所有人類的知識,數學,幾何,以及感知到的世界。然而他發現除了「我思故我在」之外,所有的知識都可能不靠譜,因為我們的大腦很可能被一個具有「超能力」的Evil Demon 所欺騙。

  • 2003 年牛津大學的哲學教授Nick Bostrom 鄭重其事地寫了一篇論文『我們生活在計算機模擬世界中嗎? 』[8]。認為以下三個事實中,至少有一個成立:

人類文明徹底滅絕。

人類文明已經到達可以完全模擬現實世界的科技水平,但是處於某種原因,沒有一個人願意去創造出一個新的模擬世界,充當上帝的角色。

我們現在的人類文明就生活在一個模擬世界中。

矽谷企業家Elon Musk 在一次公開採訪中,談到「我們生活在基礎現實世界」的概率只有「十億分之一」。也就是說,他認為我們生活在一個電腦遊戲(模擬世界)中,在模擬世界之外,有一個程序員,他開發並操縱了這個世界,我們每個人都是一個遊戲角色( NPC)。

在玩膩越獄iPhone 和自動駕駛之後,神奇小子Geohot 在今年三月份的「西南偏南」大會上做了一個題為「Jailbreaking the Simulation」的演講[9]。他認為,我們被生活在一個模擬世界中,所謂的上帝就是外部世界里活蹦亂跳的碼農們,他們編程創造了我們的「現實世界」,當然,他們可能啟動了不止一個世界副本。然而,他們可能也生活在一個外層「模擬世界」中。

如果我們確實生活在模擬世界中,或許我們可以在地球的某個地方找到一個後門——「Simulation Trapdoor」,從而獲得「模擬器」的超能力,抽取出不可思議的「秘密知識」。

如果我們的世界的確是被程序模擬出來的,這個程序也許會有Bug,如果有Bug 存在,說不定我們可以利用這個Bug 進行越獄,跳出「理想世界」,到達外面一層的世界中,與可愛的碼農上帝聊一聊。

這是在開玩笑嗎?下面摘自自知乎的一個段子[10]:

如果世界是虛擬的,有哪些實例可以證明?

1.為什麼宏觀上豐富多彩,但是微觀的基本粒子卻都是一模一樣的?這正和圖片富多彩,但是像素是一模一樣的一回事

2.為什麼光速有上限?因為機器的運行速度有限

3.為什麼會有普朗克常量?因為機器的數據精度有限

4.為什麼微觀粒子都是機率雲?這是為了避免系統陷入循環而增加的隨機擾動

5.為什麼有泡利不相容原理?看來系統採用的數據組織是多維數組

9.為什麼時間有開端?系統有啟動時間

未完待續

未完待續

未完待續

If you would be a real seeker after truth, it is necessary that at least once in your life you doubt, as far as possible, all things. 

未完待續

設計一個密碼學協議就好像在走鋼絲,如果你想同時做到「零知識」和「可靠性」就意味著既要讓協議內容充分隨機,又要保證「知識」能夠參與協議的交互。如果協議沒有正確設計,亦或沒有正確工程實現,都將導致系統安全性坍塌。比如可能破壞了零知性,導致「知識」在不經意間洩露;或者也許破壞了可靠性,導致任何人都能偽造證明。而且這種安全性,遠比傳統的代碼底層機制漏洞來得更加嚴重,並且更難被發現。嚴格數學論證,這似乎是必不可少的。

安比(SECBIT)实验室
作者文库