ランダムサンプリングは、所定の集団から統計的に代表的なサンプルを選択する方法です。サンプルのすべての要素が同じ確率で選択される必要があるという原則の一部。
抽選はランダムサンプリングの例であり、参加者の母集団の各メンバーに番号が割り当てられます。ラッフル賞品(サンプル)に対応する番号を選択するには、ランダムな手法を使用します。たとえば、同一のカードに記録された番号をメールボックスから抽出します。
図1.ランダムサンプリングでは、サンプルは、すべての要素が同じ確率で選択されるようにするいくつかの手法を使用して、ランダムに母集団から抽出されます。出典:netquest.com。
ランダムサンプリングでは、サンプルサイズを適切に選択することが不可欠です。これは、母集団の代表的でないサンプルが、統計の変動により誤った結論につながる可能性があるためです。
サンプルのサイズ
サンプルの適切なサイズを決定するための式があります。考慮すべき最も重要な要素は、人口サイズがわかっているかどうかです。サンプルサイズを決定するための式を見てみましょう。
ケース1:人口の規模は不明
母集団サイズNが不明な場合、適切なサイズnのサンプルを選択して、特定の仮説が真か偽かを判断できます。
これには、次の式が使用されます。
どこ:
-pは、仮説が真である確率です。
-qはそうでない確率であるため、q = 1-pです。
-Eは相対的な誤差範囲です。たとえば、5%の誤差にはE = 0.05の余裕があります。
-Zは、調査で必要な信頼度のレベルに関係しています。
標準化(または正規化)正規分布では、結果が-1,645σから+1,645σの確率が90%であるので、90%の信頼水準はZ = 1,645です。ここで、σは標準偏差です。 。
信頼水準とそれに対応するZ値
1.- 50%の信頼水準はZ = 0.675に対応します。
2.- 68.3%の信頼水準はZ = 1に対応します。
3.- 90%の信頼水準は、Z = 1,645に相当します。
4.- 95%の信頼水準はZ = 1.96に対応
5.- 95.5%の信頼水準はZ = 2に対応します。
6.- 99.7%の信頼水準はZ = 3と同等です。
この公式を適用できる例は、ビーチの小石の平均重量を決定するための調査です。
明らかに、浜辺のすべての小石を調べて計量することは不可能であるため、サンプルをできるだけランダムに、適切な数の要素で抽出することをお勧めします。
図2.ビーチの小石の特性を調べるには、代表的な数のランダムなサンプルを選択する必要があります。(出典:pixabay)
ケース2:人口の大きさがわかっている
特定の母集団(またはユニバース)を構成する要素の数Nがわかっている場合、単純なランダムサンプリングでサイズnの統計的に有意なサンプルを選択するには、次の式を使用します。
どこ:
-Zは信頼水準に関連する係数です。
-pは、仮説が成功する確率です。
-qは、仮説における失敗の確率です。p+ q = 1。
-Nは総人口のサイズです。
-Eは、調査結果の相対誤差です。
例
サンプルを抽出する方法は、実行する必要のある研究のタイプに大きく依存します。したがって、ランダムサンプリングには無数のアプリケーションがあります。
調査とアンケート
たとえば、電話調査では、調査対象の地域に適用できる乱数ジェネレータを使用して、コンサルトされる人々が選択されます。
大企業の従業員にアンケートを適用する場合は、従業員番号またはIDカード番号を使用して回答者の選択に頼ることができます。
前記数はまた、例えば乱数発生器を使用してランダムに選択されなければならない。
図3.参加者をランダムに選択することにより、アンケートを適用できます。出典:Pixabay。
QA
調査が機械で製造された部品に関するものである場合、部品はランダムに選択する必要がありますが、1日の異なる時間に、または異なる日または週に製造されたバッチから選択する必要があります。
利点
単純なランダムサンプリング:
-統計的に信頼できる結果を得るために総母集団を調査する必要がないため、統計的調査のコストを削減できます。調査で必要な信頼水準とエラーのレベルが得られます。
-偏りを避ける:研究対象の要素の選択は完全にランダムであるため、研究は人口の特性を忠実に反映しますが、その一部のみが研究されました。
短所
-この方法は、さまざまなグループまたは人口層の好みを知りたい場合には適していません。
この場合、研究を実施するグループまたはセグメントをあらかじめ決定しておくことが好ましい。階層またはグループが定義されたら、それぞれがランダムサンプリングを適用すると便利です。
-少数派セクターに関する情報が得られる可能性は非常に低く、その少数派セクターの特性を知る必要がある場合があります。
たとえば、それが高価な製品のキャンペーンの問題である場合、最も裕福な少数派セクターの好みを知る必要があります。
運動が解決されました
特定のコーラ飲料に対する人口の好みを調査したいのですが、この人口にはその規模が不明な以前の調査はありません。
一方、サンプルは90%の最小信頼レベルで代表的である必要があり、結論は2%のパーセント誤差を持つ必要があります。
-サンプルのサイズnを決定する方法は?
-誤差範囲を5%まで柔軟にすると、サンプルサイズはどのようになりますか?
解決
母集団のサイズは不明なので、上記の式を使用してサンプルサイズを決定します。
n =(Z 2 p q)/(E 2)
私たちのブランドのソフトドリンクの嗜好(p)は、嗜好ではない(q)と同じ確率であると想定しているため、p = q = 0.5です。
一方、調査の結果は2%未満の誤差率でなければならないため、相対誤差Eは0.02になります。
最後に、Z値= 1,645は90%の信頼水準を生成します。
要約すると、次の値があります。
Z = 1,645
p = 0.5
q = 0.5
E = 0.02
これらのデータを使用して、最小サンプルサイズが計算されます。
n =(1.645 2 0.5 0.5)/(0.02 2)= 1691.3
これは、必要な誤差範囲と選択された信頼度のある研究には、単純なランダムサンプリングによって選択された、少なくとも1692人の回答者のサンプルが必要であることを意味します。
エラーマージンが2%から5%になると、新しいサンプルサイズは次のようになります。
n =(1.645 2 0.5 0.5)/(0.05 2)= 271
これは、かなり少ない数の個人です。結論として、サンプルサイズは、研究における望ましい誤差範囲に非常に敏感です。
参考文献
- Berenson、M。1985。経営と経済学、概念と応用のための統計。エディトリアル・インターアメリカーナ。
- 統計学。無作為抽出。出典:encyclopediaeconomica.com
- 統計学。サンプリング。復元:Estadistica.mat.uson.mx。
- 探索可能。無作為抽出。回復元:explorable.com。
- ムーア、D。2005。応用基本統計。2番目。版。
- Netquest。無作為抽出。回収元:netquest.com。
- ウィキペディア。統計的サンプリング。から回復:en.wikipedia.org