統計学の使い方2
前回は統計学の持つ意味と、統計学の基本的な考え方について学んでいきました。
その内容について確認しておきたいと思います。
1 統計の意義として、データによる比較によって( )を抑えるというものがあります。
2 データを比較した結果について( )がないのかを意識しておくことが重要です。
3 データを比較するときには( )と( )の違いを比較する必要があります。
回答例
1 思考の偏り 2 誤差(偶然) 3 目標を達成したデータ・達成していないデータ(順不同)
それでは今回も西内啓さんの『統計学が最強の学問である』で学んでいきたいと思います。
ランダム化が最強の武器
せっかくデータをとって、結果を示しても「偶然だ」と言われてしまうかもしれません。
その結果を正しいというための武器として「ランダム化」というものがあります。ランダム化のポイントは
・実験参加者をランダムに分ける
・異なる条件にする
・比較して分析する
と、することが基本です。
このようにすることで、変えたい条件以外を平均的にすることができるため、「偶然ではない」と主張できるようになります。
ランダム化してみよう
裏付けがなく否定するのも、肯定するのもよくありません。正解が分からないのであればとりあえずランダム化するという選択肢もあります。
会議で話し合って結論が見えないようであれば、とりあえず試してダメならやめようとしてみるのもよいのです。
ランダムは意外と難しい
ランダム化は強力な武器にはなりますが、ランダム化でうまくいかないパターンもあります。
・現実的に不可能
たとえば、チャンスが1回・2回しかないものはランダム化を使用して試すことができません。
・倫理的に不可能
実験をすることで被害を受ける人やモノがある場合は、いくら効果があると思っても試すことはできません。
・感情的に不可能
実験をすることによって、明らかに得をする人と損をする人がいそうな場合は試すことによって問題が発生することがあります。
ランダム化ができない場合は?
・ケースコントロール
ある結果になった人について、「原因と考えられるもの」以外は条件が似ている人と比較するようにする方法。
このような方法を用いて、ランダムに近い形で統計をとる方法があります。
オリンピックが前評判通りにならない理由
何か記録をとる場合、その結果は色々な条件に左右されることが多いです。体調や気分、気候なども影響を与えるかと思います。
オリンピックに出場するためには、大会で良い結果を残すなどの成果が必要になります。オリンピックにむけて準備をし、自己ベストを更新して出場を決めたという選手がいたとします。
しかし、その選手がオリンピックの舞台では思ったほど記録をのばすことができなかったということがあります。そのときにも専門家による原因分析などが行われますが、統計的には普通である場合があります。
様々な結果は「平均」におさまっていく傾向があり、非常に良い結果のときもあれば、よくない結果のときもあります。そうすると結果としては「良い記録とよくない記録の平均くらい」におさまってきます。
オリンピック直前で最高の記録を出しながらも、オリンピックでは力を出しきれないということは普通にあるということですね。
