■特徴づけ

さて乱数集団の種類を判別するためには、その特徴を見つけなくてはなりませぬ。
それは平均値、標準偏差、そして分布の三つの要素で判別されます。

■乱数集団の重心点(中心点)はどこか(=平均値)

■乱数集団がどの程度の広がりを持つか(=標準偏差)

■乱数集団内の各数値はどこにどれだけ固まっているのか(=分布)


この3つが分かれば、ほぼその乱数の集団の特徴がわかります。
よって正規乱数かどうかを判別し、理解するには
まずは上の3つの条件を理解しなくてはなりませぬ。

■平均値

説明不要かとも思いますが、一応、基本となる計算式だけは書いておきます。
こういうの書いとくと、何か頭良さそうに見えますし(笑)。

集団n内の数値の量=N 
集団内の数値=n1、n2、n3…nN
(N個の数の集団nだからその最後の数をnNとする)

平均値=(n1+n2+n3…+nN)÷N


■標準偏差

お次は標準偏差。「偏差」の「標準」ですから、まずは「偏差」とは何?という点から。
偏差は平均値から任意の数値nまでとの差(距離)です。

偏差=n - 平均値

平均値が「5」の集団における「10」の偏差は10-5=5で「5」。
同じく「1」の偏差は1-5=-4となるので「-4」。
これは集団内の数値が、平均値からどれだけ離れてるかを求めた数字で、
引き算で計算できます。ここまでは問題なし。

となると、この偏差の数値を見れば、その乱数集団が、
どの程度の広がり(最低&最大値)を持つかが分かります。
が、なにせ乱数ですから、最低と最大の値は、他の数値からとんでもない
距離を持つ数値になってる事があります。

例えば集団の99%以上の数値が-10〜10の間に入ってるのに、
最大値=60,最低値=-50といった偏った数字になってる乱数集団です。
この時、この集団の広がりを最低-50から最大60まで、とするのはさすがに無理があります。
そこで標準偏差という考え方が出て来るのです。

ここでまた平均値が出てきます。
多少、特異な数字があっても、偏差の数字を平均化してしまえば、
大よそ集団の特徴を示す偏差が得られるはずです。
が、発想は正しいのですが、実はこれが単純には計算できません。

これは具体例で説明した方が速いでしょう。

-3、-2、-1、0、1、2、3

この集団の平均値は0、それぞれの数値の値がそのまま偏差となりますから
最大で3,最小で-3の広がりをもつ集団です。

ところがこの集団の平均値は0ですから、偏差の平均もまた0、集団としての広がりは全く無い事に。
これは極端な例ですが、平均値以下をマイナスとして表す場合、どうしても似たような問題が生じます。
このため以下の数式で求める“標準偏差”を利用します。




 


偏差を2乗してるのはプラスマイナスの影響をなくすためで、それを集団の全個数で割り平均値を出し、
2乗の効果を消すために、最後にルートを取ってます。
これによって、その集団の広がりが見て取れるようになるわけです。

この点も具体例で考えましょう。
もっとも単純な2つだけの数値の集団を考えます。
例えば1&9のコンビと6&4とのコンビでは、
どちらも重心点(中心)となる平均値は5ですが、
当然、1と9のコンビのほうが集団としての広がりは「大きい」ことなり、
その標準偏差は、1&9の4に対し6&4は1に過ぎません。
集団としての広がりに4倍の差がある、というのが簡単に読み取れるのです。



このように標準偏差を見る事で、その集団の広がりの大きさが分かります。
ちなみに標準偏差は平均値からプラスマイナス両方向に同じ量で存在するのにも注意してください。
標準偏差が4の集団の数値の分布幅は倍の値、8なのです。

ただし実際はもっと多くの数の量を含む集団で見る事になるため、
上で見たような標準偏差=集団の数値幅、という単純な話にはなりません。

平均値である以上、必ず一定量が標準偏差の外に存在することになるからです。
そして、この標準偏差の範囲から外れてる数の量もまた、その乱数集団の特徴の一つとなってゆきます。

最後は分布。
これは集団内の数値がどのあたりにどれだけ密集してるか、を見るもので、
これを手っ取り早く理解するには、グラフにしてしまえばいいのです。
こんな感じに。



乱数集団の分布グラフでは、横軸が集団内に含まれ各数値、中央の縦軸が、各数値の集団内の量を示します。
縦軸を中心に置くのは、集団内の重心点、すなわち平均値の位置を示すためです。
平均値ですから、必ずこの軸線はグラフのど真ん中に来ます。

このように集団内の数値が、どの辺りに、どれだけあるか、
すなわち“分布”を見る事で、その乱数集団の特徴がつかめます。

一般に、“行儀の良い乱数集団”は上のような分布グラフとなり、
平均値付近に多くの数値の量が集中し、平均値から遠ざかるほど、
その量はどんどん減少して行きます。

この“行儀の良い”乱数集団の中でも、いくつかの条件を満たすものが正規分布と呼ばれます。
そしてこの正規分布の乱数集団のみが数学による確率理論の対象となります。
逆に言えば、もし株価の乱数集団の分布が正規分布でないなら、
これを数学的に扱うことはできず、世の中の金融工学の多くは
その土台から崩壊する事になります。

では、次にその正規分布を示す乱数集団についてもう少し詳しく見て行きましょう。



NEXT