ベルヌーイ分布(Bernoulli distribution)
来る?来ない?ベルヌーイ分布
「来る、来ない、来る、来ない…」もう今ではやらないかもしれないけど、花びらをちぎって占った経験、小さい時にありませんでしたか?
ゲームの先攻・後攻を決めるコイントスだったり(日本ではジャンケンが主流ですが)、
はたまた持ってる株の値段が上がるか下がるか…ハラハラドキドキですね。
このように、2つの状態しか現れない事象をモデル化したのが「ベルヌーイ分布」と呼ばれるものです。
コイントスをイメージすると表が出るか裏が出るかは5分5分だと思うかもしれませんが、 コインは曲がっているかもしれないし、イカサマをしてコインの表側に重りが貼り付けてあるかもしれないですもんね。 つまり、確率は5分5分とは限らず、4:6かもしれないし、3:7かもしれないということなんです。
一般にベルヌーイ分布は、成功(あの子が来る、コインの表が出る(勿論賭けた方)、株価が上がる)を 1、失敗を 0 として、
の場合は、成功と失敗の確率が同じとなって、この場合に限り、下限が0、上限が1の一様分布(離散)と同じになる。
つまり0か1の一様分布ですね。- 確率 で1が出る(成功)
- 確率 で0が出る(失敗)
ある営業マンの悲劇:ベルヌーイ試行を使って
ベルヌーイ分布はそれだけで使うことはあまりなく、ベルヌーイ分布に従う乱数を多数生成した場合→つまりコイントスを何度もして(1つ1つのコイントスをベルヌーイ試行といいます)その積み重ねの確率的性質を調べる時に用いられます。 単純な例では、コイントスを100回して表が何回出るかを調べる、といったものがあります。もう少しストーリー性のあふれる例で見てみましょう。
僕は新人サラリーマン。研修を終え、配属されたのは営業部。 この夏は社運を賭けた新製品を大々的に売り出すことになった。僕ら新人も微力ながら販売に力を尽くすことを命じられた。新人は飛び込み営業が基本だ。 よーし、売って売って売りまくるぞ!!
さっそく担当地区に送りだされて、営業を始める。1件目。ドアも開けてくれない。2件目。勢いが空回りしてダメだった。3件目。ここもダメ…。午前中はあっという間に過ぎ、公園でさっき買ったマクドにかぶりつきながら先輩の言葉を思い出す。 「まぁ、50件回って2件でも買ってくれたら良い方じゃないか?」…そうか、すると売れる確率は ってところか。
じゃあ…?
- 最初に買ってくれるお客さんにめぐり合うまで、何件のドアを叩かなければならないか?
- 今日一日250件回って、何件の売り上げが期待できるか?
最初の疑問には幾何分布を利用する。幾何分布の期待値はベルヌーイ試行の成功確率 の逆数だ。…ってことは、 これに1を加えた 26 件となる。絶望的というほどのことはないか。
次の疑問には二項分布が答えをくれる。二項分布の期待値はベルヌーイ試行の成功確率 と試行回数、つまり訪問件数の積だ。ってことは、250件回れば 件か。 50件に2件なら250件回れば10件。当然の結果か。
もう一例、別の日を見てみましょう。
今日もまた飛び込み営業だ。でも今日のエリアは裕福な人が多い。過去の実績からいって20件に1件は買ってもらえる。つまり、成功確率は ってことだ。
- 今日のノルマは12件。では、結果何件回ることになるだろうか?
やっぱり今日も長い一日になりそうだな。
その他のネタ
公正なコイン(成功確率 1/2)を使って表が出たら +1、裏が出たら -1 とした場合、ベルヌーイ分布によく似ていますが、この場合の分布にはラデマッハー分布という名前が付いています。分布の形状
基本情報
- 1つのパラメータ が必要です。 このパラメータは成功確率と呼ばれます。
- 整数 で定義された離散分布です。
確率
- 累積分布関数
- 確率質量関数
- Excel での累積分布関数 (c.d.f.) と 確率質量関数 (p.m.f.)の求め方
1 2 3 4 5 6 A B データ 説明 0 対象となる値 0.3 分布のパラメータ p の値 数式 説明(計算結果) =IF(A2<0,0,IF(A2<1, 1-A3, 1)) 上のデータに対する累積分布関数の値 =IF(A2=0,1-A3,A3) 上のデータに対する確率質量関数の値
分布の特徴
平均 – 分布の”中心”はどこ? (定義)
- 分布の平均 は と与えられます。
標準偏差 – 分布はどのくらい広がっているか(定義)
歪度 – 分布はどちらに偏っているか(定義)
- 分布の歪度 は次式で与えれらます。
尖度 – 尖っているか丸まっているか (定義)
- 分布の尖度 は次式で与えられます。
乱数
Excel での乱数生成法
|
|
メモ: この使用例の数式は、配列数式として入力する必要があります。使用例を新規ワークシートにコピーした後、A4:A103 のセル範囲 (配列数式が入力されているセルが左上になる) を選択します。F2 キーを押し、Ctrl キーと Shift キーを押しながら Enter キーを押します。この数式が配列数式として入力されていない場合、単一の値 2 のみが計算結果として返されます。