いろんなものはつながっている

観測したデータがポアソン分布にしたがっているか知りたかった

観測したデータがポアソン分布に従っているか知りたくて、カイ二乗検定というものにたどりついた。

自分が知りたかった

観測されたデータの分布が、理論値の分布とほぼ同じと見なせるか?

適合度の検定というものの範疇だった。

こちら、ネットにある練習問題をいくつかといて手順は腹に落ちた。

ただ、練習問題で

「理論値が5未満のところは5以上になるようにまとめて、、」

という記述をしばしばみかけた。

これはなんだろうと思っていたらここに記述をみつけた。ある種慣例のようだ。

また、カイ二乗検定はなにも適合度を調べるためだけのものではない。

カイ二乗検定は

理論的に期待される数値(理論度数)と観測値との差の度合いを調べるもの

ともいえる。

カイ二乗分布を使って調べるものとして、独立性の検定というのもよくでてきた。

これは、ある調査結果の表があったとして、独立ならこの表はこんな数値になるよね、ってのをもとめて、それとの差を評価するという手順で行うようだ。

・独立なら表はこんな数値になるはず、というものを求めて
・帰無仮説を、独立である、とし、
・独立であったら差がこれくらいにおさまるでしょ、って値をカイ二乗分布の表から調べて、
・実際計算した差はそれ以上になってるよね、
・だから、独立であるとはいけないね、つまり関係性をあるよね、

って手順で調べる。

カイ二乗検定ができる条件や精度を上げるために標準化する等の話も考えないといけないが、大筋としてはだいぶすっきりした。

関連記事

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

スポンサード リンク

カテゴリー

スポンサード リンク