// ホーム / 資料 / 分布関数の世界 / 指数分布

指数分布(Exponential distribtuion)

雑踏の中を歩く指数分布

都会の雑踏を歩いていると、1メートル進んでは人にぶつかり、3メートル進んでは人にぶつかり、となかなかスムーズに歩けないですよね(え、私だけ?)。
直感的に考えて
  • 長い距離ぶつからずに歩ける確率は少ない
  • 人がたくさんいると短い距離歩くだけでぶつかる
というのは理解できると思います。では、人とぶつかるタイミングはどういった分布に従うのでしょうか?

まず、雑踏をそのままモデル化するのは難しそうです。そこで簡単なモデルを考えることにします。
歩いている人間は複雑すぎるので、1本道上で人はみんな止まっていると仮定します。ある人の場所から歩いて、次の人までぶつからずに歩く。 このモデルで人と人との間隔の分布を調べてみましょう。
このモデルでもいきなり一般的な話をすると難しいから、更に簡単な状況からスタートすることにしますね。

さて、100メートルの道があります。自分の今いる場所から1メートル先の地点、そこから100個のベンチが1メートル間隔で並んでいます。そこに20人の人が座ることとします。ただし以下の条件の制約があります。
  • 1つのベンチには1人しか座れない。
  • 座り心地の良いベンチがあるとか、日陰と日なたにあるベンチがあるとか、嫌いな奴から離れて座りたいとか、どこかのベンチにモデル級の美女が座っていて、その周辺に何人か集まって座るとか、そういったことはありません。つまりどのベンチに座るかは「同様に確からしい」のです。
図の赤丸が人がいるベンチ、白抜きの丸が空のベンチです。
以上から、どのベンチでも人がいる確率は同様に確からしく \frac{20}{100}=0.2 となります。

では勇気を持って歩き出してください。
  • 隣のベンチに人はいなかった
  • その隣のベンチにも人はいなかった
  • その隣のベンチには人がいた
この状況、つまり2メートル人と出会わなかった確率を求めてみましょう。
先ず隣のベンチに人がいない確率は
1-0.2
となります(ベンチに人がいる確率は0.2であることを思いだして)。 その隣にも人がいないので、ここまでの確率は
(1-0.2)^2
となります。そして次に人が出現。結局2メートル人と出会わない確率は
(1-0.2)^2\times0.2
です。
ここまで来れば、あるベンチから右側にx個分のベンチに人がいなくて、その次に人がいる(つまりxメートル人と出会わない)確率は、
(1-0.2)^x\times0.2
であることが分かります。
では次ステップに移りましょう。ベンチの数を倍にして50センチ間隔に配置してみます。ベンチの数は倍の200個、人の数は変わらず20人になるので、ベンチに人がいる確率は 0.1 となりますね。
こで2x個のベンチを挟んで、次のベンチに人がいる(つまりxメートル人と出会わない)確率は、
(1-0.1)^{2x}\times0.1
となります。
さらにベンチの間隔を半分にします。ベンチが400個、人は20人。4x個のベンチを挟んで、次に人がいる(つまりxメートル人と出会わない)確率は、
(1-0.05)^{4x}\times0.05
となります。
ここまでの様子を図に示してみます(x=2の場合)。

もうここまでくれば、一般化は簡単ですね。
ベンチの間隔を\deltaとしましょう。
xメートル人と会わない確率は、
\left(1-\delta\frac{n}{N}\right)^{x/\delta}\times\delta\frac{n}{N}
となります(ちなみにこの分布は幾何分布と呼ばれます)。一方で隣の人までの距離がxメートル以下である確率を F(x) と書くと、隣の人ととの距離が x より離れていて (x+\delta) メートル以下である確率が
F(x+\delta)-F(x)
であることは分かるでしょうか?
結局、
F(x+\delta)-F(x)=\left(1-\delta\frac{n}{N}\right)^{x/\delta}\times\delta\frac{n}{N}
が得られることとなります。

ここからは微分・積分の知識が必要なんですね。両辺を\deltaで割って、
\frac{F(x+\delta)-F(x)}{\delta}=\left(1-\delta\frac{n}{N}\right)^{x/\delta}\times\frac{n}{N}
\delta\to 0 の極限(つまりバラバラのベンチではなく、100メートルの長いすに自由に座る)を考えると、
f(x)=\frac{1}{\beta}\exp\left(-\frac{x}{\beta}\right)
これが指数分布確率密度分布なんです! ここで
\beta=\frac{N}{n}
としましたが、これは平均間隔です。


平均して\betaメートルに1回ぶつかるとすると(イタイ)、xメートル歩くまでにぶつかる確率が上式F(x)となります。 ではこの状況下で、1メートルで平均何回人とぶつかるでしょう?答えは、パラメータ\nu=1/\betaとしたポアソン分布になるのです!(覚えてましたか?)

分布の形状

基本情報

  • パラメータ \beta が必要です。
    \beta>0

    このパラメータは分布の平均です。

  • 半無限区間 x \geq 0 で定義された連続分布です。
  • 平均対して常に非対称です。

確率

分位点

  • 累積分布関数の逆関数
    F^{-1}(P)=-\beta\ln(1-P)
  • Excel での分位点の求め方
     
    1
    2
    3
    4
    5
    AB
    データ説明
    0.5 この分布の確率
    1.7 分布のパラメータ Beta の値
    数式説明(計算結果)
    =-A3*LN(1-A2) 上のデータに対する累積分布関数の逆関数の値

分布の特徴

平均 – 分布の”中心”はどこ? (定義)

  • 分布の平均\beta と与えられます。

標準偏差 – 分布はどのくらい広がっているか(定義

歪度 – 分布はどちらに偏っているか(定義)

尖度 – 尖っているか丸まっているか (定義)

乱数

  • 乱数 x は一様乱数 U に対して次式で生成されます(逆関数法) :
    x=-\beta\ln(1-U)
  • Excel での乱数生成法
     
    1
    2
    3
    4
       
    AB
    データ説明
    0.5 分布のパラメータ Beta の値
    数式説明(計算結果)
    =-A2*LN(1-NTRAND(100)) 100個の指数乱数を Mersenne Twister アルゴリズムで生成します。

    メモ: この使用例の数式は、配列数式として入力する必要があります。使用例を新規ワークシートにコピーした後、A4:A103 のセル範囲 (配列数式が入力されているセルが左上になる) を選択します。F2 キーを押し、Ctrl キーと Shift キーを押しながら Enter キーを押します。この数式が配列数式として入力されていない場合、単一の値 2 のみが計算結果として返されます。

参照

 

Comments are closed.