大数の法則(多数の法則)とは
概要
大数の法則(たいすうのほうそく)は試行回数を多くすることで理論値に近づくという基本的な定理です。
確率や統計では理論値が算出されますが分母(試行回数)が小さいと偏りが大きくなってしまう傾向があるため試行回数を増やして偏りを軽減し実際の近似値に収束する事はとても重要です。
基本的な事のように感じる人も多いと思いますが、理論的に導かれた数字や実験の内容を証明をするためのサンプル数が少ないと事が後々大きな問題となる事例はとても多いです。
大数の法則は数字を扱う事のある様々な分野で使われているため政治・経済・金融などの社会基盤では欠かす事のできないものとなっています。
具体例
一般的な1~6まであるサイコロを投げる場合、それぞれの目が出る確率は理論値ではいずれも1/6づつです。
しかし、サイコロを投げる回数が一回の場合はいずれか1つの目だけが100%出たことになります。
当然このようなサンプルで理論を証明しても誰も納得はしないと思います。
そのため、試行回数を増やして偏りを減らす必要があり、多くの場合は回数を重ねると理論値に近づいていきます。
しかし、ここで注意しなくてはいけない点がありま、サイコロを実際に振る場合は1/6に収束しないことが大半です。
これは古典物理学的な現象の重心のずれが影響していると考えられています。
※重心を計算して作られているサイコロは非常に高価で、一般的に流通している物とは精度が大きく異なります。
これはコインも同様で片面が重い場合は1/2に収束しませんし、実際に人が行うと力加減の影響で偏りが生じます。
このため、現実的な数字と理論的な数字にはずれが生じる事が多いです。
また、コインが連続して片方の面が出ていると、次に出る面は連続してでている面とは異なった面がでるように誤認してしまうギャンブラーの錯誤(ギャンブラーの誤謬/モンテカルロの誤謬)など、直感的な判断と理論的な数字が異なる点にも注意が必要です。
そして、片方の面が過剰に連続して出続けている時は作為的にそのような現象がが引き起こされている可能性の方が高いので、統計のような理論ではなく人的な要因を考える必要がでてきます。
まとめ
大数の法則は様々な分野で使用されていて、特に銀行の金利(利息/利子)や保険会社の保険料などは代表的で”一見偶然に見える事象”でもサンプルを大量に観察する事で一定の規則性をもって金融事故や自己破産、事故・病気・怪我などが発生している事がわかります。
このような方法は実態の数字を計算から導き出す事が困難な状況(未来に起こる確率を予測する事はとても難しいです)で用いられる事が多い方法です。
わかりやすく表現すると「今までこうだったから未来もだいたい同じになるであろう」という予想から”似たような出来事”の統計を取って未来の数字を予測します。
このような情報を使って基礎数値を求めて統計的に費用を算出する際には実際の数字の近似値に収束させるためには試行回数を増やす(分母を大きくする)事がとても大切で、データの数が少ないと予測が大きくずれてしまためより多くのサンプル数を検証することはとても重要な要因となります。
また、車両事故のような正しい理論が確立されていないような状況(現代の科学で解明されていない現象などは結果からどのような傾向があるのかを分析して統計的に確率を算出しています)では交通事故などの実際に発生している状況を分析することで統計的な確率を割り出して実数に近い試算を行っています。
※理論が正しくなければ理論値と乖離する事もあります。
また「全体の総数を把握する事が困難なケース」や「確率を計算する時に正確な数字がわからない場合」は一般的にフェルミ推定を使う事が多いです。
例えば
車の保険料を計算する際には車の登録台数や過去の事故件数などの推移から未来の事故件数を予想することで保険料の概算を算出しています。
※わかりやすいように簡略化して記載しています。
一般的に「青い車両」や「左利きドライバー」は事故の発生率が高いと言われますが「なぜ事故の発生率が高いのか」については不明瞭ですが過去のデータを分析する事で特徴的な要因が発見されます。
しかし、このような予想はあくまで過去のデータを分析しているため想定外の事象によって予測した値と実際の値が大きく異なる事もあります。
例えば
車両保険のケースでは地震が発生した影響で家屋が大量に倒壊したり津波が発生するなどの影響によって一時の間に多くの車両トラブルが頻発するなどの想定外(ある程度は計算されているはずですが)の事象が発生する可能性があるため注意が必要です。
一方で天気予報のように長年にわたって多くのデータを収集する事ができているケースでは日々制度が高上しています。
※台風などはまだまだ誤差が大きいようですが次第に精度も向上していくはずです。