臨床と統計をつなぐブログ

理学療法士・作業療法士・言語聴覚士・看護師のみなさんをサポートしたい

多重検定の対処法 ~ 総括的な検定(global test)って何?~

研究を進める上で、「複数のグループに違いがあるかどうか」を判断するために総括的な検定を利用することがあります。これは、個別のグループ間の違いを検討する前に、まず全体的な差を確認するための方法です。

ここでは、総括的検定の基本と応用を具体例を交えて解説します。

総括的な検定の基本

総括的な検定(例えば分散分析: ANOVA)は、複数のグループの平均値が全体として等しいかどうかを確認する統計手法です。
特徴として:

  1. 全体的な差を検出
    個々の比較に進む前に、グループ全体での違いを明らかにします。
  2. 有意差の検出
    p値が閾値未満であれば、少なくとも1つのグループが他と異なる可能性が示唆されます。

具体例:3つのダイエット法の比較

仮説
A, B, Cの3つのダイエット法があり、それぞれの効果に違いがあるかを検討します。

データ

グループ 体重減少量(kg) 平均(kg)
A 2.3, 2.1, 2.5, 2.4, 2.0, 2.2, 2.3, 2.4 2.28
B 3.0, 2.8, 3.1, 3.2, 2.9, 3.0, 3.1, 3.3 3.05
C 4.1, 4.2, 4.0, 4.1, 4.3, 4.0, 4.1, 4.2 4.13

総括的な検定(ANOVA)を実施

仮説検定

  • 帰無仮説: A, B, Cの平均はすべて等しい。
  • 対立仮説: 少なくとも1つのグループが異なる。

結果:p値 = 0.0003

p値が0.05未満であるため、3つのグループ間に有意な差がある(少なくとも1つのグループが異なる)と結論付けます。

次に何をする?

総括的な検定で差があると判断されても、「どのグループがどのくらい違うのか?」までは分かりません。そのため、個別の比較(対比較)を行います。

Rosner (2016)は、総括的な検定を行った後に個別の比較を行う場合、事前に比較する群や対比較の数が研究の目的を達成するために必要最低限に絞り込まれていれば、必ずしも多重性の調整(補正)をしなくてもよいと述べています。

興味のあるA vs C の対比較を実施

興味のあるグループ間のペア比較(A vs C)のみ検定を実施します。

比較ペア 平均の差(kg) p値
A vs C -1.85 <0.0001
A vs B -0.77 0.0012

まとめ

Rosner (2016)は、総括的な検定の後に対比較を行う際、多重性の補正を必ずしも必要としないと述べています。その理由は以下の通りです:

  1. 総括的な検定が門番の役割を果たす
    p値が有意でない場合、対比較を行わないため、誤検出のリスクが抑えられる。
  2. パワー(検出力)の確保
    補正を行うとパワー(検出力)が低下し、小さな差を見逃す可能性が高まる。

結論

  • 総括的な検定は、全体の差を確認するための重要な手法
  • 総括的な検定で有意差が認められた場合、興味のある対比較のみを実施することで詳細な違いを明らかにできる
  • 興味のある対比較のみの結果は多重性の補正をしない

このように、総括的な検定を適切に活用すれば、信頼性の高い研究結果を導くことができます。

ダイエット法の例を通じて、皆さんの研究に役立てていただけると嬉しいです!

【参考文献】

Rosner, B. (2016). Fundamentals of Biostatistics (8th ed.). Cengage Learning.