
來源| vitalik.ca
原文標題:《Vitalik: 反對過度使用基尼係數》,作者Vitalik Buterin
基尼係數(也被稱為基尼指數) 是迄今為止最受歡迎、最廣為人知的用於測量收入不平等的標準,特別是用來衡量在某國家、地區或其他社區的收入或財富不平等。它之所以受歡迎,是因為它很容易理解,它的數學定義可以很容易通過一個圖表進行可視化。
然而,人們可以想像,任何試圖把不平等簡化為一個數字的方案都會有局限性,基尼係數亦如此。即使在它一開始用於測量各國的收入和財富不平等的語境下,它也是有局限性的,而當把基尼係數挪用到其他語境(特別是加密貨幣世界) 時,其局限性則更明顯了。在這篇文章裡,我將談論基尼係數的局限性,並提議使用其他替代方案。
什麼是基尼係數?
基尼係數是由科拉多·吉尼(Corrado Gini) 於1912 年提出,用於測量不平等。它通常被用來測量國家的收入和財富的不平等,儘管它越來越多地被用於其他語境。
基尼係數有兩個等值定義:
➤ 用曲線上的面積定義:繪製函數圖,其中, f(p) 等於低收入人群賺取的總收入(即f(0.1) 代表收入最低的10% 的人在總收入中的份額)。 Gini 係數是該曲線與直線y=x 之間的面積,是整個三角形的一部分:
➤ 用平均差值定義:基尼係數是所有可能的每兩人之間收入的平均差值的一半再除以平均收入。
例如,上面例子的圖裡,四個人的收入是[1, 2, 4, 8],因此有16 個可能的差值,它們是[0, 1, 3, 7, 1, 0, 2, 6 , 3, 2, 0, 4, 7, 6, 4, 0]。由此得到平均差值為2.875,而平均收入為3.75,因此基尼係數=2.8752/ (2*3.75) ≈0.3833。
結果是兩者的數值是相等的(證明這一點就當是讀者的一個練習)!
基尼係數有什麼問題?
基尼係數很有吸引力,因為它是相當簡單且易於理解的數據。它可能看起來不簡單,但相信我,幾乎所有處理任意規模人口的統計數據都那麼糟糕,且往往更遭。請看看像標準差一樣基礎的公式:
而基尼係數是:
這真的很簡單的,我保證!
那麼,它有什麼問題呢?它其實有很多問題,人們已經寫了很多關於基尼係數各種問題的文章了。在本文,我將重點討論一個我認為在整個基尼係數領域討論還不足的一個問題,但它與分析在互聯網社區(例如區塊鏈) 裡的不平等特別相關。基尼係數將兩個實際上非常不同的問題——由於缺乏資源而遭受痛苦與權力集中——結合到一個不平等指數裡。
為了更清楚地理解兩個問題的差異,我們來看看兩個反烏托邦:
反烏托邦A:一半人口平分所有資源,其他人一點都分不到
反烏托邦B:一個人擁有所有資源的一半,其他人平均分剩下的一半資源
以下是兩個反烏托邦的洛倫茲曲線(像我們在上文看到的一樣好看的圖表):
顯然,這兩個反烏托邦都不是適合生活的地方。但它們不適合生活的原因並不相同。反烏托邦A等於給每個居民一個拋硬幣的機會,如果落在左邊,面對的是可怕的大規模飢餓;如果落在右邊,則是和平等主義帶來的和諧。如果你是滅霸,你可能會喜歡它!如果你不是,應該以最強的力量避免其發生。另一方面,反烏托邦B類似於“美麗新世界”:每個人都有體面的美好生活(起碼在對每個人的資源進行快照時是這樣),但這是以一個極其不民主的權力結構作為代價的,你最好希望你有一個好的統治者。如果你是柯蒂斯·雅文(譯者註:美國極右派博客作者),你可能喜歡。如果你不是,也應該以最強的力量避免其發生。
這兩個問題相差甚遠,值得分開分析和測量。這個差異不只是理論上的。以下這個圖表展示了底層20% 的人的收入在總收入的佔比(這是避免反烏托邦A 的一個合適的指標) 與頂層1% 的人的收入在總收入的佔比(這是接近反烏托邦B 的一個合適的指標) 的對比:
來源:https://data.worldbank.org/indicator/SI.DST.FRST.20 (合併了2015 年和2016 年的數據) 和http://hdr.undp.org/en/indicators/186106.
兩者明顯是相關的(相關係數是-0.62 ),但遠非強相關(統計學的權威顯然認為0.7 是“高度相關”的較低閾值,而我們得出的數值比它還低)。圖表中有一個有趣的第二個維度可以分析——頂層1% 的人賺總收入的20% 而底層20% 的人賺3% 的國家與頂層1% 的人賺總收入的20% 與底層20% 的人賺總收入7% 的國家有何差異?唉,這種探索最好還是留給其他比我更有經驗、更進取的數據與文化探索者吧。
為什麼基尼係數在非地緣社區裡使用(例如互聯網或加密社區)是非常有問題的
在區塊鏈世界裡,財富集中是一個特別重要的問題,且是一個值得測量和理解的問題。這對整個區塊鏈世界很重要,因為很多人(和美國參議院聽證會) 正試圖搞清楚加密貨幣在多大程度上是真正反精英主義,以及在多大程度上它只是用新精英取代舊精英。這一點在對比不同加密貨幣時也非常重要。
在加密貨幣的初始供應量中,部分代幣直接分給特定內部人員是不平等的一種。請注意,以太坊的數據是稍有問題的:內部人員和基金會的佔比應該是12.3% 和4.2%,而不是15% 和5%。
考慮到對這些問題的關注,很多人都嘗試計算加密貨幣的基尼指數,這應該一點都不奇怪:
受關注的質押EOS 代幣的基尼指數(2018)
加密貨幣的基尼係數(2018)
使用多個指標和粒度來測量比特幣和以太坊的去中心化程度(2021, 包括基尼係數和其他兩個指標)
Nouriel Roubini 將比特幣的基尼係數與朝鮮進行對比(2018)
加密貨幣市場上的鏈上深入觀察(2021, 使用基尼係數來測量中心化程度)
而且在比這更早的時候,我們從2014年起就必須應對這篇轟動一時的文章:
這類分析除了經常犯一般方法論錯誤(通常要么把收入與財富混為一談,要么把用戶與賬戶混為一談) 外,它們在使用基尼係數來做這些類型的對比也有一個嚴重而微妙的問題。這個問題在於典型地緣社區(例如城市、國家) 與典型互聯網社區(例如區塊鏈) 之間的關鍵區別:
一個地緣社區的典型居民會在這個社區上花費他們大部分的時間和資源,因此在一個地緣社區中測量的不平等反映的是人們可獲得的總資源的不平等。但在互聯網社區裡,測量不平等可以有兩個來源:(i) 不同的參與者在總資源里獲得的不平等份額,以及(ii) 參與社區的興趣水平的參差。
擁有15 美元法幣的普通人是貧窮的,他們沒有獲得美好生活的能力。有價值15 美元的加密貨幣的普通人是一個業餘愛好者,他開錢包是為了好玩。興趣水平參差是健康的;每個社區都有其業餘愛好者和沒有生活的全職硬核粉絲。因此,如果一個加密貨幣有非常高的基尼係數,但不平等的很大部分原因是由於興趣水平的參差,那麼這個數字指向的現實遠沒有那些頭條意指的可怕。
加密貨幣,即使是那些已經高度由財閥控制的,也不會把世界的任何地方變為接近於反烏托邦A 那樣。但分配很糟糕的加密貨幣可能看起來像反烏托邦B,如果使用代幣投票治理來做協議決策的話,問題會變得更複雜。因此,為了找出加密社區最令人擔憂的問題,我們想要一個可以反映接近於反烏托邦B 的、更具體的指標。
替代指標:分開測量反烏托邦A 和反烏托邦B 的問題
測量不平等的另一個方法是預估由資源的不平等分配帶來的苦難(即“反烏托邦A” 的問題)。首先,從某效用函數開始,它代表具有一定數量錢的價值。很多人使用log(x) ,因為它能非常直觀地表現一個人收入翻倍的近似值,且在任何水平上都是有效的:從10,000 美元變成20,000 美元增加的效益與從5,000 美元變成10,000美元、或從40,000 美元變成80,000 美元是一樣的。然後,得出的是與如果每個人只能得到平均收入相比,測量損失了多少效用:
第一項(平均數的對數) 是貨幣得到完美分配的情況下每個人會得到的效用,因此每個人都會賺取平均收入。第二項(對數的平均值) 是今天經濟體的平均效用。如果你把資源狹義地看作是用於個人消費的東西,兩項的差值代表不平等帶來的效用損失。還有其他方法可以定義這個公式,但它們最終都接近於等值(例如,安東尼·阿特金森(Anthony Atkinson) 1969 年的論文提出一個“公平分配的均衡收入水平”指標,在U(x) =log(x) 裡,它只是上述公式裡的一個單調函數,而Theil 指數L 則在數學上與上述公式完全相等)。
圖片描述
圖片描述
HHI: 綠色面積除以總面積
它還有其他替代指標;戴爾指數T (Theil T index) 跟它有一些相似性,但也有不同。一個更簡單、更笨的替代指標是Nakamoto 係數:最小需要加起來的參與人數要大於總人數的50%。請注意,這個所有這些集中指標都非常關注在頂部附近發生的情況(而且是故意的):大量擁有少數資源的業餘愛好者對這個指數貢獻很少,甚至沒有貢獻,而頂部兩個參與者的行為合起來可以對這個指標產生非常大的影響。
對於加密社區,資源集中對系統來說是最大風險之一,但只有0.00013 個代幣的人並不能證明他們正在挨餓,但採用這些指數就是這樣的思路。但是,即使對於國家,權力集中與因缺乏資源而受苦這兩件事也應該分開來談論和測量。
也就是說,某種程度上我們必須超越這些指標。集中問題帶來的傷害不只是一個關於行動者數量大小的函數;它很大程度上還取決於行動者和他們互相合謀的能力。同樣地,資源分配是依賴網絡的:如果缺乏資源的人有一個非正式網絡可以進入,那麼缺乏正式資源也不是那麼有害。但處理這些問題的難度大得多,因此在我們仍有較少數據可以利用時,我們確實還需要更簡單的工具。
原文鏈接:https://vitalik.ca/general/2021/07/29/gini.html