統計的因果推論　まとめ②

統計的因果推論を実践するための、数学的な準備を行う。具体的には次のような項目を最低限の数学的知識として抑えておくと、いざ統計的因果推論を学習しようとした際の理解の助けとなるだろう。

条件付き確率
ベイズの定理
カイ2乗検定
フィッシャー検定
マクネマー検定
t検定

条件付き確率

事象Bが起きたという条件のもとで事象Aが起きる確率。Y=y の条件下で X=x となる条件付き確率を P(X=x|Y=y) と表す。

条件付き確率については改めての説明は不要であろう。ただし、条件付き確率が統計的因果推論の数学的な基礎となっていることには注意したい。

ベイズの定理

P(A|B) = P(B|A) P(A) / P(B)

確率論における最重要公式である。「事象Bが起きたうえで事象Aが起きる確率」は「事象Aが起きる確率」に「事象Aが起きたうえで事象Bが起きる確率」をかけ、「事象Bが起きる確率」で割る。ベイズの定理は次の自明な式から導出可能である。

P(A∧B) = P(A|B) P(B) = P(B|A) P(A)

すなわち、「事象Aと事象Bが同時に起きる確率」は、「事象Bが起きる確率」と「事象Bが起きたうえで事象Aが起きる確率」の積で表される。またこれはAとBに対して対称である。

カイ2乗検定、フィッシャー検定

統計的因果推論において、結果に対する原因を特定または仮定したときに、その原因が結果に対して与える影響が統計的に有意であるかどうか、仮説検定によって定量的に評価したい。どういう場合にどの検定手法を使うのか、まとめておきたい。

まず、処置群（薬を飲んだ層、またDMを受け取った層）と対照群（薬を飲まなかった層、DMを受け取らなかった層）に対して、それぞれ有効であった割合と無効であった割合に差があるときに、その差が偶然によるものなのかそうでないのか、2群比較を行いたいとする。その際、2群が独立である場合はカイ2乗検定やフィッシャー検定を用いる。

なお、各度数（処置群・対照群 × 有効・無効の 2×2のマトリクスの各度数）がある程度大きいときはカイ2乗検定を、小さいときはフィッシャー検定を用いると良い。

参考：https://best-biostatistics.com/contingency/fisher-exact.html

マクネマー検定

カイ2乗検定やフィッシャー検定に対し、2群に対応がある場合はマクネマー検定を用いると良い。

ここで、対応がある場合とは、同一人物がそれぞれ処置群・対照群に含まれる場合（同一人物が薬を飲んだときと飲まなかったときの比較、等）やマッチングされている場合等を指す。

t検定

仮説検定のなかでも馴染み深いt検定であるが、一口にt検定と言っても様々なt検定がある。t検定は2群の平均値比較の有意差を評価する検定である。

t検定の使い分けは次のとおりである。

Studentのt検定

独立な場合で分散が等しいと仮定できる場合の平均値比較

Welchのt検定

独立な場合で分散が等しいと言えない場合の平均値比較

対応のあるt検定

対応のある場合で2変量正規分布を仮定できる場合の平均値比較

フィッシャーのランダム化検定・ウィルコクンソンの符号付き順位検定

対応のある場合で必ずしも正規分布を仮定しない場合の平均値比較

なお、一般的なt検定（Studentのt検定）は独立な場合を仮定している。実際には対応があるデータに対して、対応がない、つまり独立な場合に適したt検定を用いると、しばしば不利な結果を招く。対応があるデータに対して検定を行う場合は、それに適した仮説検定手法を用いるべきである。

統計的因果推論　まとめ②

投稿者ぽんぽこ太郎

コメントを投稿

0 コメント

Popular Posts

G検定　カンペ　まとめ（for G検定2021#1）

学会の研究委員会メンバーになった

ブログを書き書き

ラベル

Contact form

統計的因果推論 まとめ②

投稿者 ぽんぽこ太郎

コメントを投稿

0 コメント

Popular Posts

G検定 カンペ まとめ（for G検定2021#1）

学会の研究委員会メンバーになった

ブログを書き書き

ラベル

Contact form

統計的因果推論　まとめ②

投稿者ぽんぽこ太郎

G検定　カンペ　まとめ（for G検定2021#1）