正規分布(単変量)(Normal distribution)
あの鐘を鳴らすのは正規分布
ベル=カーブ
正規分布(英名 “Normal distribution”)は確率・統計で間違いなく最も重要な分布です。実際これを知らないと何もできない程!19世紀最大の科学者カール・フリードリヒ・ガウスが導入したことから、ガウス分布とも呼ばれています(彼の故郷、ドイツの旧10マルク紙幣にはガウスの自身と正規分布の形が描かれていました)。先ずは正規分布の確率密度関数の形を見てみましょう。
- 左右対称
- 中心部分が一番高く、中心から離れれば離れるほど急速に減少していく
- (見ただけでは分からないけど)実はグラフは永遠に伸びていて、水平軸に接することはない。
分布の特徴
正規分布の形状はなんとたった2つの情報で決まってしまいます。
下の図のように、は分布の山頂の位置に一致し、は分布のウエストのあたりに一致します。
ここで青い三角形()を左右に動かして を、緑の矢印()を動かして を増減させ、分布がどのように変化するかを確認してみよう。
さて、どうでしょうか?
を変化させると、分布は左右に形を変えないまま移動し、 が増加すると分布はだらしなく広がり、 が小さくなると分布はスリムになりますね。
ちなみに 、 の場合、この分布には「標準正規分布」という特別な名前が与えられています。
数式を少々(我慢我慢)
とにかく重要でどこにでも顔を出す分布なので、ここはひとつ数式を見てみましょう。他でもしょっちゅう出てくるものばかりで、きっと試験にも出ます。どうにか我慢してお付き合いください。
その他のトピック
- 左右対称ということから、この分布の歪度(ゆがみ)は 0
- 正規分布の尖度(とがり具合)を 0 として、この分布より裾が厚い分布(尖度が正)を “Leptokurtic“な分布、裾が薄い分布(尖度が負)を “Platykurtic“な分布と呼ぶ
- 多数の分布の極限が正規分布になるということと、多数の不確定要素の積み重ねが正規分布を生み出す(中心極限定理)という事実によって、この分布はどこにでも顔を出す。
分布の形状
基本情報
- 無限区間 で定義された連続分布です。
確率
- 累積分布関数 ここで は標準正規分布の確率密度関数です。
- 確率密度関数
- Excel での累積分布関数 (c.d.f.) と 確率密度関数 (p.d.f.)の求め方
1 2 3 4 5 6 7 A B データ 説明 0.5 対象となる値 8 分布のパラメータ M の値 2 分布のパラメータ Sigma の値 数式 説明(計算結果) =NTNORMDIST((A2-A3)/A4,TRUE) 上のデータに対する累積分布関数の値 =NTNORMDIST((A2-A3)/A4,FALSE) 上のデータに対する確率密度関数の値 - 関連 NtRand 関数 : NTNORMDIST
- 第2引数が TRUE の場合、NtRand 関数 NTNORMDIST は Excel 関数 NORMSDIST と同等です。
分位点
分布の特徴
平均 – 分布の”中心”はどこ? (定義)
- 分布の平均は と与えられます。
標準偏差 – 分布はどのくらい広がっているか(定義)
- 分布の標準偏差は と与えられます。
歪度 – 分布はどちらに偏っているか(定義)
- 分布の歪度は です。
尖度 – 尖っているか丸まっているか (定義)
- 分布の尖度は です。
乱数
Excel での乱数生成法
|
|
メモ: この使用例の数式は、配列数式として入力する必要があります。使用例を新規ワークシートにコピーした後、A5:A104 のセル範囲 (配列数式が入力されているセルが左上になる) を選択します。F2 キーを押し、Ctrl キーと Shift キーを押しながら Enter キーを押します。この数式が配列数式として入力されていない場合、単一の値 2 のみが計算結果として返されます。
関連 NtRand 関数
- Mersenne Twiseter 法による乱数生成 : NTRANDNORM
参照
- Wolfram Mathworld – Normal Distribution
- Wikipedia – Normal distribution
- Statistics Online Computational Resource