Studentのt-testとMann-WhitneyのU-testの使い分けですが、サンプル数によって分けるというよりは、データの性質(正規分布しているかどうか)によって使い分けるものだと思います。
ちょっと、ここからは個人的なとらえ方になるのですが(バイオサイエンスの統計学(南江堂)にも似たような記述はありますが)、生物の実験の場合、スコアリングなど人為的な数値付けをする場合を除いて、ほとんどのデータは正規分布および対数正規分布と見て問題ないと思います。
正規性の検定を行うべきだという立場もあることは承知していますが、n数が少ない状況で分布の推定をすること自体に無理がありますので、通常は『経験的にこのデータは正規分布に従うだろう』という前提でStudentのt-testを行っていると解釈しています。(等分散性が仮定できないとしてWelchのt-testを行うという立場もありますが、僕はStudentのt-test派です)
また、以前統計のスレで言及しましたが、Studentのt-testは結構頑健なので、相当極端な分布(極端な外れ値があるとか)でなければ適用できます(誤って有意とすることがあまりない)。
さて、今回の例ですが、片方がn=2でも検定することは可能です。
そして、p値も0.05を下回ることも十分あり得ます。
例えば
A群 10, 15
B群 40, 50, 30, 50, 60, 20, 40, 50
という場合、p=0.013となります。
Mann-Whitneyを使うとそもそもサンプル数が少ないときは有意差がでないので、検定を行いたいのであればStudentのt-testで良いと思います(極端な外れ値がなければ)。
ただ、やはりn=2だとその値の信頼性という意味では低くなりますし、生物の実験の場合、『再現性』という統計の埒外にあることも意識しないといけません。
そのことを十分分かった上で、『今回の試験で有意差は見られたが、実験の都合上サンプル数が十分に確保できなかったので、今後(もしくは他の試験で)検証する。』という立場はありだと思います。 |
|