2012.06.23 Saturday
統計学<中心極限定理の確認>
中心極限定理は統計学において非常に重要な定理である。
母集団がどのような統計に従っていたとしても、無作為抽出するサンプルサイズが十分に大きければその標本平均は正規分布になる、というものである。
これを確認してみる。母分布は[0,1)の一様分布としよう。
標本集団を10000個用意してそれぞれの平均を求め、ヒストグラムにした。
ヒストグラムの階級は[0,1)を20分割している。
標本サイズは1~8まで変化させた。
標本サイズを大きくすると正規分布らしくなっていくことがわかる。
正規分布でフィッティングしてみる。Gnuplotで簡単にフィッティングできる。
f(x) = A/sqrt(2.0*3.14159265*s**2)*exp(-(x-mu)**2/2.0/s/s)
fit f(x) "hist8.txt" via A,s,mu
などと入力するだけ。
母集団がどのような統計に従っていたとしても、無作為抽出するサンプルサイズが十分に大きければその標本平均は正規分布になる、というものである。
これを確認してみる。母分布は[0,1)の一様分布としよう。
標本集団を10000個用意してそれぞれの平均を求め、ヒストグラムにした。
ヒストグラムの階級は[0,1)を20分割している。
標本サイズは1~8まで変化させた。
標本サイズを大きくすると正規分布らしくなっていくことがわかる。
正規分布でフィッティングしてみる。Gnuplotで簡単にフィッティングできる。
f(x) = A/sqrt(2.0*3.14159265*s**2)*exp(-(x-mu)**2/2.0/s/s)
fit f(x) "hist8.txt" via A,s,mu
などと入力するだけ。
きれいにフィッティングできた。
これは分散約0.01の正規分布になっている。
中心極限定理によれば標本平均の分散は母分散/標本サイズとなる。
[0,1)の一様分布の分散は1/12、標本サイズ8より1/(8*12)~0.01となるため妥当な結果といえる。
計算に使用したソースは続きから。
これは分散約0.01の正規分布になっている。
中心極限定理によれば標本平均の分散は母分散/標本サイズとなる。
[0,1)の一様分布の分散は1/12、標本サイズ8より1/(8*12)~0.01となるため妥当な結果といえる。
計算に使用したソースは続きから。