■何が起こるか、だけは完全にわかっている世界で

というわけで、ようやく標準偏差を説明します。
まずは「偏差」の「標準」なわけですから、「偏差」とは何よ?という点から。
偏差は、そのデータの平均値からの差です。
平均値が「5」の集団における「10」の偏差は10-5=5ですから、「5」。
同じく「1」の偏差は1-5=-4となるので「-4」。
非常に単純ですね。
そのデータが、平均値からどれだけ離れてるのかを見る数字。
引き算だけで、簡単に求められます。
で、肝心の「標準偏差」とは、集団全体の「偏差」の平均値(のようなもの)です。
例えば、平均値が5、データ数100の集団があるとすると、
この100個のデータが平均値から平均してどれだけ離れてるか、を見る数値ですね。
それはつまり、集団がどの程度の幅(量)の広がりを持つかの目安となります。
これを平均値、すなわち平均偏差と呼べないのは、その計算にちょっとクセがあるからです。
標準偏差を求めるには
各偏差数字の合計÷全データ個数
といった「平均値」計算式ではなく、
全ての偏差の数値を一度2乗して合計し、それをデータ個数で割ってから、
平方根を求めます。式に書くと以下の通り。
なんで、こんな面倒な事を…というと、理由は単純で、単に偏差を合計すると0になってしまい、
平均値を計算出来なくなってしまうからです。
(ちなみにこれは分散の平方根でもあるんですが、今回は必要ない知識なので触れません)
偏差は平均値からの差で、それは当然、マイナスの数字もプラスの数字も含みます。
例えば、1から10までの数の平均を考えてみましょう。
1から10までの数を合計すると55になり、その平均値は55/10=5.5。
ここから、各数字の偏差を計算してみます。
1-5.5=-4.5
2-5.5=-3.3
3-5.5=-2.5
4-5.5=-1.5
5-5.5=-0.5
6-5.5= 0.5
7-5.5= 1.5
8-5.5= 2.5
9-5.5= 3.5
10-5.5=
4.5
さあ、この集団の偏差の平均値を計算して…と、数字を見ただけで、
だいたいもう予測はついてしまいますな。
偏差の合計は「0」。よって、平均値は求めることができません。
なので、上の式のように一度2乗してかから、その平均を求め、
それの平方根を取ることで、もとの数字と比較できるようにしています。
標準偏差で見る、集団の広がりって何やねん、というのも説明しておきましょう。
たとえば平均値が同じ「5」の集団でも、1&9のコンビと6&4とのコンビでは、
当然、1と9のコンビのほうが集団としての広がりは「大きい」のです。
実際、その標準偏差は、1&9コンビの約5.66に対し6&4は1.41に過ぎません。
約3倍の「広がり」の差があります。
この標準偏差が小さいほど、
その集団は平均値周辺に数値が集中している、すなわち広がりは小さい。
逆に大きいほど、平均値から離れた数字が多く、その広がりは大きいのです。
ちなみに、全ての数字が5で平均値が5、といった場合、
上の計算式でわかるように、平均を引いた段階で0になってしまうので、
この標準偏差は「0」、つまりその広がりは「0」ということになります。

同じ平均「5」の集団でも、標準偏差で比べると「5.66」と「1.41」と3倍程度の開きが出ることがある。
そこに含まれる数字によって、その「広がり」は当然異なるからだ。
平均値は集団の中心を示し、標準偏差は集団の広がりを示す、という感じである。
さて、少しずつ、本題に入って行きますよ。
前回見た「実際の株価の上がり下がりの金額は、標準偏差の3倍以内に97%以上が収まる」
というルールを、ここで思い出してください。
つまり、標準偏差の小さい方が、予測される価格範囲も狭く、
標準偏差の大きい方が価格帯は広くなるわけです。
例えば、標準偏差が100円なら、最大でも600円(プラスマイナスに300円ずつ)以内の
値動きの中で動いて行くことになりますが、
標準偏差が200円だと、最大1200円とかなり大きな振幅を持って動いて行くことになります。
標準偏差がいくつなのか、というのは大きな要素なんですね。
さて、ここまでの段階で、自分で計算してみよう!と思ったすばらしい積極性を持つ
読者の方が万が一にも存在していたら(笑)、すでにお気づきと思いますが、
この計算は、暗算はおろか、電卓を使っても結構大変です。
ましてや、これからとりあげる株価を相手にする場合、絶望的な計算量となります。
なので、今回の記事の内容を実際に確かめたり、実戦に投入したりするばあい、
「表計算ソフト」が必須アイテムとなります。
マイクロソフトのエクセルなどが有名ですが、最近はフリーのものもあるようなので、
それらを使ってもいいでしょう。
エクセルのように関数(予めプログラムに入ってる計算式)に標準偏差式(STDEV)が入ってるのが
理想ですが、なくても、上記の式を組めばなんとかなると思います。
まあ、今回の記事を読むだけなら、表計算ソフトがなくても大丈夫です。
で、そちらまでフォローすると、また終わらなくなってしまうので、
表計算ソフトに関しては、各自努力願いますです(手抜き)。
さて。
ここで非常に重要なポイントを一つ、確認しておきます。
それは、ここまで取り上げてきたのは「株価の上がり下がりの価格」だ、と言うこと。
だから?というと、つまり株価そのものは取り上げてません。
理由は簡単、株価のデータは正規分布、平均への回帰を期待できる分布を示さないからです。

過去5年分の株価データを実際に散布図グラフにしてみるとこんな感じ。
アタマの悪い幽霊コンビみたいなグラフになります。
よって、株価自体は平均への回帰現象を持ちません。
ちなみに「金額をならす」ために偏差値で作図(後ほど説明します)しても、
緩やかな二つのコブのグラフとなります。
平均への回帰が期待できるのはあくまで「毎日の上げ下げの額」、
今日は400円上げた、昨日は150円下げた、とう数値だけです。
(ちょっと数字をいじると正規分布とみなせる、とするのが現在の金融工学
の基本理論の一つだが、ここでは触れない。私にもわかないからだ(涙))。
はい、というわけで、ちょっとだけ話が面倒になってきました(笑)。
とりあえず、次回、今回まで説明した事を元に、
いよいよ実戦に入っていきますですよ。
BACK