多重検定の対処法～総括的な検定（global test）って何？～

研究を進める上で、「複数のグループに違いがあるかどうか」を判断するために総括的な検定を利用することがあります。これは、個別のグループ間の違いを検討する前に、まず全体的な差を確認するための方法です。

ここでは、総括的検定の基本と応用を具体例を交えて解説します。

総括的な検定（例えば分散分析: ANOVA）は、複数のグループの平均値が全体として等しいかどうかを確認する統計手法です。
特徴として：

仮説
A, B, Cの3つのダイエット法があり、それぞれの効果に違いがあるかを検討します。

仮説検定

結果：p値 = 0.0003

p値が0.05未満であるため、3つのグループ間に有意な差がある（少なくとも1つのグループが異なる）と結論付けます。

総括的な検定で差があると判断されても、「どのグループがどのくらい違うのか？」までは分かりません。そのため、個別の比較（対比較）を行います。

Rosner (2016)は、総括的な検定を行った後に個別の比較を行う場合、事前に比較する群や対比較の数が研究の目的を達成するために必要最低限に絞り込まれていれば、必ずしも多重性の調整（補正）をしなくてもよいと述べています。

興味のあるグループ間のペア比較（A vs C）のみ検定を実施します。

比較ペア	平均の差（kg）	p値
A vs C	-1.85	<0.0001
A vs B	-0.77	0.0012

Rosner (2016)は、総括的な検定の後に対比較を行う際、多重性の補正を必ずしも必要としないと述べています。その理由は以下の通りです：

このように、総括的な検定を適切に活用すれば、信頼性の高い研究結果を導くことができます。

ダイエット法の例を通じて、皆さんの研究に役立てていただけると嬉しいです！

【参考文献】

Rosner, B. (2016). Fundamentals of Biostatistics (8th ed.). Cengage Learning.

臨床と統計をつなぐブログ