Normal Distribution / Power-law Distribution
正規分布とは、身長、体重、成績などの分布グラフでよく見かける、平均値を中心とした左右対称な山型の分布で「ベルカーブ」とも呼ばれます。自然界の現象から人間の行動まで、あらゆる現象によく当てはまる標準的な確率分布です。天文観測データの測定誤差がある法則に従うことを数学者C.F.ガウスが見出した経緯もあって「ガウス分布」とも呼ばれます。
グラフの出典:Wikimedia Commons
この分布を表す関数式は一般に確率密度関数と呼ばれるもので、定義域全区間で積分すると 1.0 になります。
正規分布は、ランダムな動きをするものの統計的な分布です。正規分布は統計の基礎として、特に経済学で数学モデルを作る際に前提とされてきました。
IQ | 55 | 70 | 85 | 100 | 115 | 130 | 145 |
偏差値 | 20 | 30 | 40 | 50 | 60 | 70 | 80 |
ベキ分布とは、右図のようなベキ乗則(Power Law)に従う分布です。統計で用いる分布モデルといえば、正規分布がふつうですが、世の中には実は、それとはまったく性質の異なる分布となる現象が多いことが知られています。1890年代にイタリアのパレート(80:20の法則)は収入分布の研究中にこれを発見しました。また、アメリカのグーテンベルクとリヒターは1950年代に地震の大きさと頻度の研究中に、それがベキ乗則に従っていることを発見しました。近年では、ネットワークの研究でもその性質に注目が集まっています。
From Wikimedia Commons
ベキ分布の特徴は、分布が左右対称になる正規分布とは対照的に、中央値・最頻値が分布の左端に位置します。平均や分散という概念が事実上意味をなさないという点で、正規分布とは異質なものになります。
ベキ分布はどの尺度で拡大・縮小しても、常に同じような分布になるという「スケールの不変性」があります。
この世界には、正規分布よりも、ベキ分布に従う事例が多く存在します。例えば、重力やクーロン力のような自然現象に見られる逆二乗則、ITの分野では、ロングテールという言葉で語られる現象もそうです。これらの現象では、極端な値をとるサンプルの数が正規分布より多く、そのため大きな値の方向に向かって曲線は長くなだらかに伸びます。
例えば商品売り上げのグラフを、縦軸・販売数量(population)、横軸・商品名(product)として販売数量順に並べると、あまり売れない商品が「恐竜の尻尾」のように伸びます。一般に「商品の売り上げの上位の20%が全体の80%を占める」という「パレートの法則」を説明する現象で、世の中には販売数量が低い商品のアイテム数が圧倒的に多いことを物語ります。
近年の経済物理学の研究から、下記のような事象は、正規分布とは明らかに異なる形、即ちベキ分布に従っている・・と考えられるようになりました。
著名な現象・法則
同様の現象は、ネットワークにおいても顕著に見られます。
ベキ乗則に従うネットワークは、グラフのどの部分を取り出して拡大しても同じ形(相似形)となることから、スケールフリーネットワークとも呼ばれます。
画像出典:Wikimedia Commons Author : Chris 73
統計処理において、平均と分散は非常に意味のある母数ですが、ベキ分布においてはこれが意味を持たない場合があります。
分布 | 平均 | 分散 | 特徴 |
正規分布 | 文字通り代表値 | 平均値からの散らばり具合 | ランダム |
ベキ分布 | 意味がない場合がある | 意味がない場合がある | ロングテール |