臨床と統計をつなぐブログ

コメディカルのみなさんをサポートしたい

「対応のある検定」と「対応のない検定」ってどう違うの? ~ リハビリ患者の歩数データ ~

統計手法を選択する際に「対応がある検定」と「対応がない検定」の違いが分からなくて迷う人もいるかと思います。この違いをリハビリ患者の歩数データを例にして、わかりやすく解説します!

1. 対応がある検定とは?

対応がある検定は、同じ対象について繰り返し測定したデータを扱う場合に使います。
例えば、あるリハビリプログラムを導入したときに、同じ患者の歩数を介入前後で比較する場合がこれに該当します。

例:リハビリ前後の歩数データ

患者30人の1日あたりの歩数をリハビリプログラム前と後で測定したとします。

  • リハビリ介入前(前日):5000歩、4800歩、5200歩...
  • リハビリ介入後(翌日):6000歩、5900歩、6200歩...

このように同じ患者のデータを比較する場合、対応のある検定(対応のあるt検定)を使います。

2. 対応がない検定とは?

対応がない検定は、異なるグループ間のデータを比較する場合に使います。
例えば、異なるリハビリプログラムを受けた2つのグループの歩数を比較する場合がこれに該当します。

例:異なるリハビリグループ間の歩数データ

  • グループA(プログラムAを受けた患者):5000歩、4800歩、5200歩...
  • グループB(プログラムBを受けた患者):6000歩、5900歩、6200歩...

このように異なる患者グループのデータを比較する場合、対応のない検定(対応のないt検定)を使います。

3. 対応のある検定とない検定の違いを押さえよう

簡単にまとめると以下のようになります:

検定の 種類 使う場面

対応がある検定

同じ対象の介入前後など比較するとき リハビリ前後の歩数データを比較

対応がない検定

異なるグループ間で比較するとき

リハビリプログラムAとBの歩数データを比較

イメージしやすいポイント

  • 対応がある検定は、「自分のダイエット前と後の体重を比べるイメージ」
  • 対応がない検定は、「友達Aのダイエット結果と自分の結果を比べるイメージ」

注意点

安易な研究デザインにおける前後比較の検定では、その裏に隠された背景因子(交絡など)を見落とすことがあるので注意してください!

statfit-lab.hatenablog.com

statfit-lab.hatenablog.com

4. Rでの実際の分析例

リハビリ前後のデータ(対応あり)と2つのグループ間のデータ(対応なし)のt検定を行うRコード例を示します。

# リハビリ前後のデータ(対応あり)
before <- c(5000, 4800, 5200, 5100, 4900)
after <- c(6000, 5900, 6200, 6100, 5800)

# 対応のあるt検定
paired_t <- t.test(before, after, paired = TRUE)
print(paired_t)

# 異なるグループ間のデータ(対応なし)
group_A <- c(5000, 4800, 5200, 5100, 4900)
group_B <- c(6000, 5900, 6200, 6100, 5800)

# 対応のないt検定
independent_t <- t.test(group_A, group_B, paired = FALSE)
print(independent_t)

* 異なったP値が算出されます!

まとめ

「対応がある検定」と「対応がない検定」の違いをリハビリの歩数データを例に説明しました。

  • 対応がある検定:同じ患者の前後を比較するとき
  • 対応がない検定:異なるグループを比較するとき

研究デザインやデータの特徴に応じて、適切な統計手法を選択し、信頼できる結果を導いていけるようにしていきましょう!