統計手法を選択する際に「対応がある検定」と「対応がない検定」の違いが分からなくて迷う人もいるかと思います。この違いをリハビリ患者の歩数データを例にして、わかりやすく解説します!
1. 対応がある検定とは?
対応がある検定は、同じ対象について繰り返し測定したデータを扱う場合に使います。
例えば、あるリハビリプログラムを導入したときに、同じ患者の歩数を介入前後で比較する場合がこれに該当します。
例:リハビリ前後の歩数データ
患者30人の1日あたりの歩数をリハビリプログラム前と後で測定したとします。
- リハビリ介入前(前日):5000歩、4800歩、5200歩...
- リハビリ介入後(翌日):6000歩、5900歩、6200歩...
このように同じ患者のデータを比較する場合、対応のある検定(対応のあるt検定)を使います。
2. 対応がない検定とは?
対応がない検定は、異なるグループ間のデータを比較する場合に使います。
例えば、異なるリハビリプログラムを受けた2つのグループの歩数を比較する場合がこれに該当します。
例:異なるリハビリグループ間の歩数データ
- グループA(プログラムAを受けた患者):5000歩、4800歩、5200歩...
- グループB(プログラムBを受けた患者):6000歩、5900歩、6200歩...
このように異なる患者グループのデータを比較する場合、対応のない検定(対応のないt検定)を使います。
3. 対応のある検定とない検定の違いを押さえよう
簡単にまとめると以下のようになります:
検定の 種類 | 使う場面 | 例 |
---|---|---|
対応がある検定 |
同じ対象の介入前後など比較するとき | リハビリ前後の歩数データを比較 |
対応がない検定 |
異なるグループ間で比較するとき |
リハビリプログラムAとBの歩数データを比較 |
イメージしやすいポイント
- 対応がある検定は、「自分のダイエット前と後の体重を比べるイメージ」
- 対応がない検定は、「友達Aのダイエット結果と自分の結果を比べるイメージ」
注意点
安易な研究デザインにおける前後比較の検定では、その裏に隠された背景因子(交絡など)を見落とすことがあるので注意してください!
4. Rでの実際の分析例
リハビリ前後のデータ(対応あり)と2つのグループ間のデータ(対応なし)のt検定を行うRコード例を示します。
# リハビリ前後のデータ(対応あり)
before <- c(5000, 4800, 5200, 5100, 4900)
after <- c(6000, 5900, 6200, 6100, 5800)
# 対応のあるt検定
paired_t <- t.test(before, after, paired = TRUE)
print(paired_t)
# 異なるグループ間のデータ(対応なし)
group_A <- c(5000, 4800, 5200, 5100, 4900)
group_B <- c(6000, 5900, 6200, 6100, 5800)
# 対応のないt検定
independent_t <- t.test(group_A, group_B, paired = FALSE)
print(independent_t)
* 異なったP値が算出されます!
まとめ
「対応がある検定」と「対応がない検定」の違いをリハビリの歩数データを例に説明しました。
- 対応がある検定:同じ患者の前後を比較するとき
- 対応がない検定:異なるグループを比較するとき
研究デザインやデータの特徴に応じて、適切な統計手法を選択し、信頼できる結果を導いていけるようにしていきましょう!