Tukey検定は目的が異なる処理を施しいくつかのサンプルの分散分析から個々の手段を比較することの方法です。
1949年にJohn.Wが発表したテスト。Tukeyを使用すると、得られた結果が大幅に異なるかどうかを見分けることができます。これは、Tukeyの正直有意差検定(TukeyのHSD検定)とも呼ばれます。
図1.テューキー検定により、同じ特性を持つ3つ以上のグループに適用された3つ以上の異なる処理間の結果の違いに、有意かつ正直に異なる平均値があるかどうかを識別できます。
同じ数のサンプルに適用された3つ以上の異なる処理が比較される実験では、結果が大幅に異なるかどうかを見分ける必要があります。
すべての統計サンプルのサイズが各処理で同じである場合、実験はバランスが取れていると言われます。サンプルのサイズが処理ごとに異なる場合、不均衡な実験が行われます。
いくつかのサンプルに適用された異なる処理(または実験)の比較において、帰無仮説(Ho:「すべての処理は等しい」)を満たすか、逆に、分散分析(ANOVA)では不十分な場合があります。対立仮説を満たします(Ha:「少なくとも1つの処理が異なります」)。
Tukeyのテストは一意ではありません。サンプルの平均を比較するためのテストは他にもたくさんありますが、これは最もよく知られ適用されているテストの1つです。
ターキーコンパレータとテーブル
このテストのアプリケーションでは、Tukeyコンパレーターと呼ばれる値wが計算され、その定義は次のとおりです。
w = q√(MSE / r)
係数qは、さまざまな数の処理または実験のq値の行で構成されるテーブル(Tukey's Table)から取得されます。列は、さまざまな自由度に対する係数qの値を示します。通常、利用可能なテーブルの相対有意性は0.05と0.01です。
この式では、平方根内にファクターMSE(平均二乗誤差)をrで割ったものが表示されます。これは繰り返し数を示します。MSEは、通常、分散分析(ANOVA)から取得される数値です。
2つの平均値の差が値w(Tukeyコンパレータ)を超える場合、それらは異なる平均値であると結論付けられますが、差がTukey数よりも小さい場合、統計的に同じ平均値を持つ2つのサンプルです。 。
番号wは、HSD(正直有意差)番号とも呼ばれます。
この単一の比較数は、各処理のテストに適用されたサンプルの数がそれぞれのサンプルで同じである場合に適用できます。
アンバランスな実験
何らかの理由でサンプルのサイズが比較する各処理で異なる場合、上記の手順は少し異なり、Tukey-Kramer検定として知られています。
ここで、コンパレーター番号wが、処理i、jの各ペアについて取得されます。
w(i、j)= q√(½MSE /(ri + rj))
この式では、係数qはTukeyの表から取得されます。この係数qは、処理の数とエラーの自由度に依存します。r iは治療iの繰り返し数で、r jは治療jの繰り返し数です。
事例
ウサギの飼育者は、ウサギの肥育食品の4つのブランドのうちどれが最も効果的であるかを彼に知らせる信頼できる統計的調査をしたいと考えています。研究のために、彼は6匹の生後1ヶ月半のウサギで4つのグループを形成し、それまでは同じ摂食条件でした。
その理由は、グループA1とA4では、ウサギの1つが虫に刺されたため、食物に起因しない原因で死亡し、もう1つのケースではおそらく先天性欠損症の原因となったためです。したがって、グループは不均衡であり、Tukey-Kramer検定を適用する必要があります。
運動が解決されました
計算が長くなりすぎないようにするために、バランスの取れた実験ケースを解く練習とします。以下はデータとして扱われます:
この場合、4つの異なる治療に対応する4つのグループがあります。ただし、すべてのグループのデータ数が同じであるため、バランスのとれたケースになります。
ANOVA分析を実行するには、Libreofficeスプレッドシートに組み込まれているツールを使用しました。Excelなどの他のスプレッドシートには、データ分析のためにこのツールが組み込まれています。以下は、分散分析(ANOVA)の実行後に得られた要約表です。
分散分析から、P値も得られます。この例では2.24E-6であり、有意水準の0.05レベルをはるかに下回っています。これは、帰無仮説の棄却に直接つながります。すべての処理は等しいです。
つまり、処理の中には、平均値が異なるものもありますが、Tukey検定を使用して統計的に有意かつ正直に異なる(HSD)ものを知る必要があります。
番号woを見つけるには、HSD番号も知られているため、誤差MSEの平均二乗を見つける必要があります。分散分析から、グループ内の平方和はSS = 0.2であることがわかります。そして、グループ内の自由度の数はdf = 16であり、これらのデータからMSEを見つけることができます。
MSE = SS / df = 0.2 / 16 = 0.0125
テーブルを使用して、Tukeyの係数qを見つけることも必要です。ANOVA分析ではグループ内で16の自由度が得られたため、比較対象の4つのグループまたは処理に対応する列4と行16が検索されます。これにより、qの値は次のようになります。q= 4.33は、0.05の有意性または95%の信頼性に対応します。最後に、「正直有意差」の値が見つかります。
w = HSD = q√(MSE / r)= 4.33√(0.0125 / 5)= 0.2165
正直に異なるグループまたは治療法を知るには、各治療法の平均値を知る必要があります:
次の表に示すように、治療のペアの平均値の違いを知ることも必要です。
結果を最大化するという観点から、最良の治療法はT1またはT3であり、統計的な観点からは無関心であると結論付けられています。T1とT3のどちらかを選択するには、ここで示した分析以外の要因を探す必要があります。たとえば、価格、在庫状況など。
参考文献
- コクランウィリアムとコックスガートルード。1974。実験デザイン。脱穀。メキシコ。3回目の転載。661p。
- Snedecor、GWおよびCochran、WG1980。統計的手法。アイオワ州立大学出版局第7版アイオワ。507p。
- Steel、RGDおよびTorrie、JH1980。統計の原則と手順:生体認証アプローチ(第2版)。マグローヒル、ニューヨーク。629p。
- Tukey、JW1949。分散分析における個々の平均の比較。バイオメトリクス、5:99-114。
- ウィキペディア。テューキーのテスト。から回復:en.wikipedia.com