- クォータでサンプリングする手順
- ステップ1
- ステップ2
- ステップ3
- ステップ4
- 手順5
- 実用的なケース
- 階層ごとの割り当て
- 適用性、長所と短所
- 利点
- 短所
- 簡単な応用例
- 年齢による割り当ての決定
- 年齢と性別による割り当ての決定
- 調査の適用と結果の調査
- 層別ランダムサンプリングとの違い
- 提案された演習
- 参考文献
クォータサンプリングは非です - クォータを割り当てるサンプル地層からデータを取るための確率的な方法。割り当て量は、この層が総母集団に対して表す割合に比例している必要があり、割り当て量の合計はサンプルのサイズに等しい必要があります。
研究者は、たとえば、集団を男性と女性に分けることができるグループまたは階層を決定する人です。階層の別の例としては、年齢の範囲(18歳から25歳、26歳から40歳、40歳以降など)があります。
図1.サンプリングクォータは、総人口の違いに従ってセグメント化されています。出典:Pixabay。
全人口の何パーセントが各層を表すかを事前に知ることは非常に便利です。次に、統計的に有意なサンプルサイズが選択され、人口全体に対する各層の割合に比例割り当てが割り当てられます。階層ごとの割り当ての合計は、サンプルの合計サイズと同じである必要があります。
最後に、各階層に割り当てられた割り当てのデータが取得され、割り当てを完了する最初の要素が選択されます。
このサンプリング方法が非確率論的であると見なされるのは、要素を選択するこの非ランダムな方法のためです。
クォータでサンプリングする手順
ステップ1
総人口をいくつかの共通の特性を持つ階層またはグループに分割します。この特性は、調査を実施する統計研究者によって事前に決定されます。
ステップ2
総人口の何パーセントが前のステップで選択された各階層またはグループを表すかを決定します。
ステップ3
統計科学の基準と方法論に従って、統計的に有意なサンプルサイズを推定します。
ステップ4
各層の要素または割り当ての数を計算します。これにより、要素の総数がサンプルの合計サイズおよび合計サイズに対して表すパーセンテージに比例します。
手順5
各ストラタムに対応する割り当てを完了するまで、各ストラタムの要素のデータを取得します。
実用的なケース
都市のメトロサービスの満足度を知りたいとします。2000人の人口に関する以前の調査では、ユーザーの50%は16〜21歳の若者であり、40%は21〜55歳の成人であり、ユーザーの10%のみが55歳以上であると決定しました。
この調査の結果を利用して、ユーザーの年齢に応じてセグメント化または階層化されます。
-若者:50%
-大人:40%
-高齢者:10%
予算が限られているため、この研究は統計的に有意な少数のサンプルに適用する必要があります。サンプルサイズは200を選択します。つまり、満足度の調査は合計200人に適用されます。
これで、各セグメントまたは層のクォータまたは調査の数が決定されます。これは、サンプルのサイズと層ごとのパーセンテージに比例する必要があります。
階層ごとの割り当て
階層ごとの調査数の割り当ては次のとおりです。
青年:200 * 50%= 200 *(50/100)= 100調査
大人:200 * 40%= 200 *(40/100)= 80調査
高齢者:200 * 10%= 200 *(10/100)= 20調査
図2.年齢層別の200人のサンプルの割り当て量。出典:F. Zapata。
料金の合計はサンプルサイズ、つまり適用される調査の合計数と同じである必要があります。次に、各層の割り当て量が満たされるまで調査に合格します。
以前のデータによると、少数派層は調査から除外される可能性が非常に高いため、この方法はすべての調査を行って最初の200人に表示するよりもはるかに優れていることに注意することが重要です。
適用性、長所と短所
この方法を適用するには、層の形成に基準が必要です。これは、研究の目的によって異なります。
クォータサンプリングは、層ごとまたはセグメントごとに特定のキャンペーンを指示するために、セクターごとの好み、違い、または特性を知りたい場合に適しています。
何らかの理由で少数派セクターの特徴や関心を知ることが重要な場合、または少数派セクターを調査から除外したくない場合にも、その使用は役立ちます。
適用するには、各層の重みまたは重要度を総人口に対して知る必要があります。この知識が信頼できることは非常に重要です。さもなければ、誤った結果が得られます。
利点
-通常、階層ごとの料金は小さいため、学習時間を短縮します
-データの分析を簡素化します。
-調査は総人口の小さいが代表的なサンプルに適用されるため、コストを最小限に抑えます。
短所
-地層はアプリオリに定義されているため、人口の特定のセクターが調査から除外される可能性があります。
-限られた数の階層を確立することによって、詳細が研究で失われている可能性があります。
-いくつかの層を別の層の一部として取り除くか組み込むことにより、誤った結論が研究で引き出される可能性があります。
-最大サンプリング誤差を推定することが不可能になります。
簡単な応用例
私たちは2000人の人口の不安のレベルについて統計的調査をしたいと思っています。
研究を指示する研究者は、結果の違いが年齢と性別によって見出されなければならないことを直感します。このため、彼は、First_Age、Second_Age、Third_Ageの3つの年齢層を形成することにしました。セックスセグメントに関しては、男性と女性の2つの通常のタイプが定義されています。
First_Ageが定義され、18〜25歳、Second_Ageが26〜50歳、最後にThird_Ageが50〜80歳になります。
総人口のデータを分析するには、次のことが必要です。
人口の45%がFirst_Ageに属しています。
40%がSecond_Ageにいます。
最後に、研究人口のわずか15%がサードエイジに属しています。
ここでは詳しく説明していませんが、適切な方法を使用すると、300人のサンプルが統計的に有意であると判断されます。
年齢による割り当ての決定
次のステップは、年齢セグメントに対応する割り当てを見つけることです。これは次のように行われます。
First_Age:300 * 45%= 300 * 45/100 = 135
Second_Age:300 * 40%= 300 * 40/100 = 120
Third_Age:300 * 15%= 300 * 15/100 = 45
割り当ての合計がサンプルの合計サイズを与えることが確認されています。
年齢と性別による割り当ての決定
これまでのところ、人口の性別セグメントは考慮されていません。このセグメントには、女性と男性の2つの階層がすでに定義されています。ここでも、総人口のデータを分析する必要があります。これにより、次の情報が得られます。
全人口の-60%が女性です。
一方、調査対象の人口の40%は男性の性別に属しています。
性別による人口の分布に関する以前のパーセンテージは年齢を考慮していないことに注意することが重要です。
これ以上の情報が得られないことを考えると、これらの性別比率は、この研究で定義されている3年齢層に均等に分布していると仮定されます。これらの検討事項を踏まえて、年齢と性別による割り当ての確立に進みます。つまり、6つの下位階層があることになります。
S1 = First_Age and Female:135 * 60%= 135 * 60/100 = 81
S2 = First_Age and Male:135 * 40%= 135 * 40/100 = 54
S3 = Second_AgeおよびFemale:120 * 60%= 120 * 60/100 = 72
S4 = Second_Age and Male:120 * 40%= 120 * 40/100 = 48
S5 = Third_AgeおよびFemale:45 * 60%= 45 * 60/100 = 27
S6 = Third_Ageおよび男性:45 * 40%= 45 * 40/100 = 18
調査の適用と結果の調査
6つのセグメントとそれに対応する割り当てが確立されると、すでに計算された割り当てに従って適用される300の調査が準備されます。
調査は次のように適用され、81件の調査が行われ、S1セグメントにいる最初の81人がインタビューされます。その後、残りの5つのセグメントで同じように行われます。
調査シーケンスは次のとおりです。
-調査の結果を分析し、次にそれを議論し、結果をセグメント別に分析します。
-セグメントごとの結果を比較します。
-最後に、これらの結果の原因を説明する仮説を立てます。
層別ランダムサンプリングとの違い
割り当てによるサンプリングを適用するこの例では、最初に行うべきことは、割り当てを確立してから調査を実行することです。もちろん、これらの割り当ては総人口に関する以前の統計情報に基づいているため、まったく奇抜ではありません。
調査中の母集団に関する事前情報がない場合は、手順を逆にすることが推奨されます。つまり、最初にサンプルサイズを定義し、サンプルサイズが確立されたら、調査の適用を続行します。無作為に。
ランダム性を保証する1つの方法は、乱数ジェネレータを使用して、従業員番号がランダムジェネレータの番号と一致する従業員を調査することです。
データが利用可能になり、研究の目的は年齢と性別の階層に基づいて不安レベルを確認することであるため、データは以前に定義した6つのカテゴリに従って分類されます。しかし、事前の手数料を確立することなく。
このため、層別ランダムサンプリング法は確率論的方法と見なされます。以前に設定された割り当てによるサンプリングはそうではありませんが。
ただし、人口統計に基づく情報を使用して割り当てが設定されている場合、割り当てのサンプリング方法はほぼ確率論的であると言えます。
提案された演習
次の演習が提案されています。
中等学校では、科学の勉強と人文科学の勉強のどちらを好むかについて調査したいとします。
学校には、学年に応じて合計1000人の生徒が5つのレベルにグループ化されているとします。1年目に350人、2年目に300人、3年目に200人、4年目に100人、最後に5年目に50人の学生がいることが知られています。学校の生徒の55%が男の子で45%が女の子であることも知られています。
調査年と性別セグメントに応じて適用される調査の数を知るために、階層と階層ごとの割り当てを決定します。さらに、サンプルが全生徒数の10%であるとします。
参考文献
- Berenson、M。1985。経営と経済学、概念と応用のための統計。エディトリアル・インターアメリカーナ。
- 統計学。割り当てのサンプリング。から回復:encyclopediaeconomica.com。
- 統計学。サンプリング。復元:Estadistica.mat.uson.mx。
- 探索可能。割り当てのサンプリング。回復元:explorable.com。
- ムーア、D。2005。応用基本統計。2番目。版。
- Netquest。確率サンプリング:層別サンプリング。回収元:netquest.com。
- ウィキペディア。統計的サンプリング。から回復:en.wikipedia.org