異常原因がなければ、自然界や社会現象の
様々な事象のデータを取り、分布を書いて
みると正規分布(Normal Distribution)となる。
これって統計学ではすごく重要な事
前回平均とばらつきの概念と計算方法を
明確にしたのはこの正規分布に当てはめて
考えたかったから。
正規分布は、その形状が平均値をy軸(垂直軸)
に取ると左右対称で、中央が最も高くなり、
ばらつきが大きくなるほど曲線が広がる特徴
を持っている。
そしてこの正規分布とx軸(水平軸)との間の
面積を積分していくと1となる性質がある。
この性質から平均から距離に応じて発生確率
が求められる。
平均をμ、ばらつき(標準偏差)をσとすると
以下の発生確率となる。
μ±1σ 0.683
μ±2σ 0.954
μ±3σ 0.997
つまり平均から正の方向、負の方向にばら
つきの整数倍行ったところには発生する
確率が決まっていることになる。
1つの例を取って具体的に説明すると
平均からプラスマイナス3倍のばらつき
の範囲内にデータは99.7%収まるという
ことである。
更に規格と不良品の関係に落とし込むと
データが正規分布となっていれば、その
平均からプラスマイナス3倍のばらつき
のところに規格を当てはめると、その
規格を外れるものが1000個中3個という
ことになる。
だから様々な事象のデータが正規分布
していれば、その平均とばらつきを
計算することで、中心の位置とばら
つきの範囲を把握することができる