いろんなものはつながっている

100回中、何回あてればあてずっぽうではない、といえるか。

統計学の仮説検定の項目によくでてくるエピソードに、「紅茶にミルクを注ぐのと、ミルクに紅茶を注ぐのでは味が違う、という主張は正しいのか」、というものがある。

この主張が正しいかを検証するため、紅茶を先にいれたもの、ミルクを先にいれたものを1杯ずつランダムに用意し違いを言い当てるという実験を行ったとする。その際、100杯中、何杯正しくいいあてられたら味が違うという主張が正しいといえるのか?という問題。ようは、100回中、何回あてれば、それはあてずっぽうではないといえるか。また、あてずっぽうで100回中、何回以上あてることは非常にむずかしいかという問題。

この問題は仮説検定という方法で議論できる。
仮説検定とは、母数(対象としている集団を特徴づける量)に関して、これくらいの値だと仮定して、実際にサンプルを集めて母数の推定量を計算、そして仮定した分布と推定量を比較して、仮定は正しいか正しくないか、と判断するもの。正しい、正しくないかのしきい値は分析者が自分できめなければいけない。
仮説検定1

仮説検定による判断は完全ではなく判断を誤る可能性もある。
判断を誤るケースを示すと下図のようになる。本当は仮説が正しいけど仮説は間違っていると判断してしまうケース(第1種の過誤)と、本当は仮説が間違っているけれども仮説は正しいと判断してしまうケース(第2種の過誤)がある。
判断を誤る確率はしきい値に依存する。下図でもわかるように第1種の過誤と第2種の過誤が発生する確率はトレードオフの関係にある。
仮説検定2

仮説検定を用いた検証では、仮説が正しいという判定をするのではなく仮説は間違っているという方向で論理をくみたてる。
上図の赤の部分の確率を小さくなるようにしきい値を決めることで、「本当は仮説が正しいけど仮説は間違っていると判断してしまうケース」の確率を極力小さくすることができる。
一方、赤の部分の確率を小さくすることで「本当は仮説が間違っているけれども仮説は正しいと判断してしまうケース」という確率は大きくなり、仮説は正しいという判断は、仮説が正しいことことを必ずしも意味しない、ということなる。
したがって、仮説検定では、仮説は間違っているという判定することにのみ意味がある、ということになる

この考え方をこの紅茶の問題にあてはめてみる。
仮説検定の手法に従うと、まず「味の違いはわからない」と仮定し、この仮定を間違っていると判断でいる正解率はどれくらか、という方向で考える。
仮説検定は「本当は仮説が正しいけど仮説は間違っていると判断してしまうケース(=上図の赤の部分)」の確率を5%と設定することが多いのでそれに従うと、おおよそ100回中58.2回正解すれば、「味の違いはわからない」という仮定が間違っている、つまり、味の違いはわかる、と判断できることになる。

あてずっぽうにいっても50回はあたることになることを考えると、たった8回多く正解することがそんなに難しいんだ、ということがとても驚きだった。

関連記事

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

スポンサード リンク

カテゴリー

スポンサード リンク