■乱数の掟
ここで最初に乱数の定義を決めておかないと話にならないのは明白だ。
が、先に述べたように乱数の定義は極めて難しい。
なので、この原稿ではとりあえず以下の三つのルールで
それが“乱数的”か否かを判断したい。
この条件が成立しても必ずしも乱数である、とは断言できないが、
それでも“限りなく乱数らしい数字の列”にはなるはずである。
●試料(サンプル)数が1000以上なら有限量でも問題無いとする。
すなわち最低でも1000個のデータがある母集団であれば考察の対象となる。
●なんら規則性が存在しないこと。すなわち未来予測が不可能なこと。
●集団中の各値の出現確率は理論値(期待値)からのズレが5%以内に収まってること。
■最初の条件は、先に説明したように、極めて長い周期で出現する規則性は
人間には認識不可能なため、一定の有限量で区切ったものだ。
最低を1000としたのは、個人的な経験から、これ以下だとデータとして
信頼がおけなくなる事が多いからで、それ以上の理由はない。
1000以上のサンプルがあれば、対象の母集団全体の数が5000だろうが10000だろうが、
そのデータの誤差は、大よそ5%に収まる、という経験則からの判断である。
当然、理想を言うなら多い方がよりよいが、現実的に有効な最低量で区切った方が理想的だが、
実際の作業はやりやすいので1000としたものだ。
■二つ目の条件は、乱数の基本中の基本未来予測が出来ない、
全く規則性がない数字の列である事を要求しているものだ。
未来予測とは時系列的な先読みで、「いつ」「なにが」起きるかの二点の予測である。
もし数字の列内に、なんらかの規則性があると、
それを使って未来予測が可能なのだから、その数字の列は乱数ではない。
基本的には関数の数式で示せない関係を持つ集団とも言える。
ただし、話はそう簡単ではないから注意が要る。
関数化できないのが乱数、という条件は正しいが、それは絶対条件ではないのだ。
例えば基本的に前の数字+1なんだけど、
特定の数字、2と9を含む数字だけが常に抜ける数字の列、
1345678
10 11 13 14 15 16 17 18
20…
といったものがある。
これは関数の数式化できないが、数列の未来予測、
何個後にどの数字が来るかは簡単に予測できてしまう。
よって、これも乱数とは言えない。
さらに、9534276 9534276
のように、なんら規則性のない数字が一組になって繰り返し並んでしまうような集団も、
未来予測は簡単にできるため、これまた乱数とは言えない。
こういった明確に数式化できない規則性もあるため、その判断はなかなか困難となるが、
ここではとにかく未来予測が出来ない、を絶対条件とする。
■最後、三つ目の均等な出現条件の意味は、サイコロを考えると早い。
サイコロの1から6までの数字は常に均等に出現する。でなければ、サイコロの意味が無い。
もし1ばかりよく出る、というサイコロがあったらそれはイカサマ用だ。
特定の目がよく出るサイコロでは未来予測が可能になるため乱数は造れないのだ。
乱数において、それぞれの数が出現する(含まれる)確率は
1/n
n=集団中にある値の種類の量
で求められる。
例えばサイコロでは1から6までの数字が含まれるからn=6で、
各数値が出現する確率は全て1/6となる。
もし各数値の出現率が、理論値から容認される誤差5%以上ズレるなら、
そのズレから一定の未来予測が成立してしまうため乱数ではない。
(「いつ」の予測は完全では無いが、高確率で可能となる)、
ちなみに出現率の近似誤差を5%以下としたのは
一般に統計誤差の範囲と認められる数字だからだ。
これもそれ以上の意味は無い。
ただし、実際にサイコロを振って見ると、1が連続して出たり、
逆に全くでなかったり、という事はよくある。
それでも100回、1000回と振る数を増やしてゆくと、
その確率は理論上の確率である1/6に限りなく近づいて行くだろう。
試行回数を増やせば理論値に収束して行く、いわゆる大数の法則である。
最初の条件で、試料数を最低でも1000で、と指定したのは、
この大数の法則による補正を期待してるからだ。
といったところが乱数の定義となる。
では実際に株式価格の変動率が乱数になるかを確認してみよう。
NEXT