- マンホイットニーU検定の問題の説明
- 定性変数と定量変数
- 通常の場合
- 非正常傾向のケース
- ペアのサンプルまたはペアのないサンプル
- マンホイットニーU検定の特徴
- マン-ホイットニー式
- テストを適用する手順
- 実用例
- - ステップ1
- - ステップ2
- 地域A
- 地域B
- ステップ3
- ステップ4
- 比較基準
- Mann-Whitney Uテスト用のオンライン計算機
- 参考文献
マン-ホイットニーU検定は、彼らは少しのデータを持っているか、正規分布に従わない2つの独立したサンプルの比較のために適用されます。このように、サンプルが十分に大きく、正規分布に従う場合に使用される同種のスチューデントのt検定とは異なり、ノンパラメトリック検定と見なされます。
フランクウィルコクソンは、同じサイズのサンプルについて1945年に初めてそれを提案しましたが、2年後、ヘンリーマンとDRホイットニーによって異なるサイズのサンプルのケースに拡張されました。
図1.マンホイットニーU検定は、独立したサンプルの比較に適用されます。出典:Pixabay。
このテストは、質的変数と量的変数の間に関係があるかどうかを確認するためによく適用されます。
説明的な例は、高血圧の人々のセットを取り、2つのグループを抽出し、そこから1か月間の毎日の血圧データが記録されます。
治療Aはあるグループに適用され、治療Bは別のグループに適用されます。ここで、血圧は量的変数であり、治療のタイプは質的変数です。
測定値の平均ではなく中央値が統計的に同じか異なるかを知り、両方の処理の間に差があるかどうかを確認します。答えを得るために、ウィルコクソン統計またはマン-ホイットニーU検定が適用されます。
マンホイットニーU検定の問題の説明
テストを適用できる別の例は次のとおりです。
ソフトドリンクの消費量が国内の2つの地域で大きく異なるかどうかを知りたいとします。
そのうちの1つはリージョンAと呼ばれ、もう1つはリージョンBと呼ばれます。毎週消費されるリットルの記録は、2つのサンプルで記録されます。1つはリージョンAの10人、もう1つはリージョンBの5人です。
データは次のとおりです。
-地域A:16、11、14、21、18、34、22、7、12、12
-地域B:12,14、11、30、10
次の質問が発生します。
定性変数と定量変数
-定性変数X:地域
-量的変数Y:ソフトドリンクの消費
消費されたリットルの量が両方の地域で同じである場合、結論は2つの変数間に依存性がないということになります。調べる方法は、2つの地域の平均または中央値の傾向を比較することです。
通常の場合
データが正規分布に従う場合、2つの仮説が立てられます。平均値の比較を通じて、ヌルH0と代替H1です。
- H0:二つの領域の平均値との間の違いはありません。
- H1:両方の領域の手段が異なります。
非正常傾向のケース
逆に、データが正規分布に従わない場合、またはサンプルが小さすぎてそれを認識できない場合は、平均を比較する代わりに、2つの領域の中央値を比較します。
- H0:二つの領域の中央との間の違いはありません。
- H1:両方の領域の中央値が異なっています。
中央値が一致する場合、帰無仮説が満たされます。清涼飲料水の消費量と地域の間に関係はありません。
そして逆のことが起こった場合、対立仮説は真実です:消費と地域の間には関係があります。
マン-ホイットニーU検定が示されるのは、これらの場合です。
ペアのサンプルまたはペアのないサンプル
マンホイットニーU検定を適用するかどうかを決定する際の次の重要な問題は、両方のサンプルのデータ数が同じかどうか、つまり、それらが同等であるかどうかです。
2つのサンプルがペアになっている場合は、元のWilcoxonバージョンが適用されます。ただし、そうでない場合は、例のように、修正されたウィルコクソン検定が適用されます。これは、まさにマンホイットニーU検定です。
マンホイットニーU検定の特徴
マン-ホイットニーU検定はノンパラメトリック検定であり、正規分布に従わないサンプルやデータがほとんどないサンプルに適用できます。次の特性があります。
1.-中央値を比較する
2.-順序付き範囲で機能します
3.-それはそれほど強力ではありません。つまり、力は、帰無仮説が実際に偽である場合にそれを拒否する確率です。
これらの特性を考慮して、次の場合にMann-Whitney Uテストが適用されます。
-データは独立しています
-正規分布に従っていない
-2つのサンプルの中央値が一致する場合、帰無仮説H0は受け入れられます:Ma = Mb
-2つのサンプルの中央値が異なる場合、対立仮説H1は受け入れられます:Ma≠Mb
マン-ホイットニー式
変数Uは、マン-ホイットニー検定で使用される対比統計であり、次のように定義されます。
これは、Uが各グループに適用されるUaとUbの間の値の最小値であることを意味します。この例では、各地域(AまたはB)に対するものです。
変数UaおよびUbは、次の式に従って定義および計算されます。
Ua = Na Nb + Na(Na +1)/ 2-Ra
Ub = Na Nb + Nb(Nb +1)/ 2-Rb
ここで、NaおよびNbの値は、それぞれ領域AおよびBに対応するサンプルのサイズであり、それらの部分については、RaおよびRbは、以下で定義するランク合計です。
テストを適用する手順
1.- 2つのサンプルの値を注文します。
2.-各値に順序ランクを割り当てます。
3.-データ内の既存の関係を修正します(繰り返し値)。
4.- Raの計算=サンプルAのランクの合計。
5.- Rbを見つける=サンプルBのランクの合計。
6.-前のセクションで示した式に従って、値UaおよびUbを決定します。
7.- UaとUbを比較し、2つのうち小さい方を実験的U統計(つまり、データ)に割り当て、理論的または通常のU統計と比較します。
実用例
ここで、前述の清涼飲料水の問題に上記を適用します。
地域A:16、11、14、21、18、34、22、7、12、12
地域B:12,14、11、30、10
両方のサンプルの平均が統計的に同じか異なるかに応じて、帰無仮説が受け入れられるか拒否されます。つまり、変数YとXの間に関係はありません。つまり、ソフトドリンクの消費量は地域に依存しません。
H0:Ma = Mb
H1:Ma≠Mb
図2.地域AおよびBの清涼飲料消費データ。出典:F. Zapata。
- ステップ1
2つのサンプルのデータを一緒に並べ、値を最低から最高に並べます:
値11が2回出現することに注意してください(各サンプルで1回)。元々は、位置または範囲3と4を持っていますが、どちらか一方を過大評価または過小評価しないように、平均値が範囲、つまり3.5として選択されています。
同様に、値12に進みます。これは、範囲5、6、7で3回繰り返されます。
まあ、値12には6 =(5 + 6 + 7)/ 3の平均範囲が割り当てられます。また、値14についても同様で、位置8と9に合字(両方のサンプルに表示されます)があり、平均範囲8.5 =(8 + 9)/ 2が割り当てられます。
- ステップ2
次に、リージョンAとBのデータが再び分離されますが、対応する範囲が別の行に割り当てられます。
地域A
地域B
範囲RaおよびRbは、各ケースまたは領域の2行目の要素の合計から取得されます。
ステップ3
それぞれのUaとUbの値が計算されます:
Ua = 10×5 + 10(10 + 1)/ 2-86 = 19
Ub = 10×5 + 5(5 + 1)/ 2 -34 = 31
実験値U = min(19、31)= 19
ステップ4
理論上のUは、サンプルのサイズによってのみ指定されるパラメーターを持つ正規分布Nに従うと想定されます。
N((na⋅nb)/ 2、√)
実験的に得られた変数Uを理論的なUと比較するには、変数を変更する必要があります。標準化された正規分布と比較できるようにするために、実験変数UからZと呼ばれるその標準化された値に移動します。
変数の変更は次のとおりです。
Z =(U-na.nb / 2)/√
変数の変更には、Uの理論分布のパラメーターを使用したことに注意してください。理論Uと実験Uのハイブリッドである新しい変数Zは、標準化された正規分布N(0,1 )。
比較基準
Z≤Zαの場合⇒帰無仮説H0が受け入れられます
Z>Zαの場合⇒帰無仮説H0を棄却
標準化されたZα臨界値は、必要な信頼レベルに依存します。たとえば、最も一般的な信頼レベルα= 0.95 = 95%の場合、臨界値Zα= 1.96が取得されます。
ここに示されているデータの場合:
Z =(U-na nb / 2)/√= -0.73
これは臨界値1.96未満です。
したがって、最終的な結論は、帰無仮説H0が受け入れられるということです。
Mann-Whitney Uテスト用のオンライン計算機
SPSSやMINITABなどの統計計算用の特定のプログラムがありますが、これらのプログラムは有料であり、その使用は必ずしも容易ではありません。これは、それらが非常に多くのオプションを提供し、その使用が統計の専門家のために実質的に予約されているという事実によるものです。
幸いなことに、数ある中でも、マンホイットニーUテストを実行できる、非常に正確で無料の使いやすいオンラインプログラムが数多くあります。
これらのプログラムは次のとおりです。
-Social Science Statistics(socscistatistics.com):バランスの取れたサンプルまたはペアのサンプルの場合のMann-Whitney U検定とWilcoxon検定の両方があります。
-AIセラピー統計(ai-therapy.com)、これには記述統計の通常のテストのいくつかがあります。
-Statistic to Use(physics.csbsju.edu/stats)、最も古いものの1つであるため、非常に効率的な無料プログラムですが、インターフェイスの日付が古くなっている可能性があります。
参考文献
- ディートリッヒソン。定量的方法:ランク検定。回収元:bookdown.org
- MarínJ P. SPSSガイド:ノンパラメトリック検定の分析と手順。から回復:halweb.uc3m.es
- USAL MOOC。ノンパラメトリック検定:Mann-Whitney U. 回収元:youtube.com
- ウィキペディア。マンホイットニーU検定。回復元:es.wikipedia.com
- XLSTAT。ヘルプセンター。Mann-Excelのホイットニーテストチュートリアル。から回復:help.xlsat.com