- 重要な考慮事項
- 層別サンプリングとは何ですか?
- 層別サンプリングを実行するプロセス
- タイプ
- 比例層別サンプリング
- 均一層別サンプリング
- 長所と短所
- -アドバンテージ
- 主要な機能を収集する
- より高い統計精度
- 小さいサンプルサイズ
- -短所
- 地層を見つける難しさ
- 整理する複雑さ
- 例
- 層の作成
- 参考文献
層化抽出、又は層化、地層として知られるより小さなサブグループに集団を分割することを含むサンプリング方法です。次に、これらの層は、収入や教育レベルなど、メンバーの共有属性または特性に基づいて形成されます。
これは、母集団のすべてのメンバーを同じように扱い、同じ確率で母集団を扱う単純なサンプリングとは対照的に、母集団内のグループ間の違いを強調するために使用されます。
出典:needpix.com
目標は、サンプリング誤差を減らすことにより、サンプルの精度を向上させることです。母集団の単純なサンプルの算術平均よりも変動が少ない加重平均を生成できます。
層別化は、サンプリングの前に、母集団のメンバーを均質なサブセットに断片化するプロセスです。層を通じて、人口分布が定義されます。
つまり、集合的に包括的で相互に排他的である必要があるため、母集団の各要素に単一の階層を割り当てる必要があります。次に、体系的または単純なサンプリングが各階層内で適用されます。
重要な考慮事項
レイヤーを並べてはいけないことに注意することが重要です。サブグループが重複していると、一部の人々が主題として選択される可能性が高くなります。これは、サンプリングプロトタイプとしての層別サンプリングの概念を完全に鈍くします。
研究者が異なる階層内で単純なサンプリングを使用する必要があることも同様に重要です。
層別サンプリングで使用される最も一般的な階層は、年齢、性別、社会経済的地位、宗教、国籍、および教育レベルです。
層別サンプリングとは何ですか?
類似した特性を持つエンティティのグループの分析を完了すると、調査員は、母集団のサイズが大きすぎて調査を完了できないことに気付く場合があります。
時間とお金を節約するために、人口から小グループを選択することにより、より実現可能な視点をとることができます。この小さなグループはサンプルサイズと呼ばれ、これは母集団全体を表すために使用される母集団のサブセットです。
母集団からのサンプルは、いくつかの方法で選択できます。そのうちの1つは、層別サンプリングです。これには、総人口を階層と呼ばれる均一なグループに分割することが含まれます。次に、ランダムなサンプルが各層から選択されます。
層別サンプリングを実行するプロセス
-メンバーが共有する属性と特性に従って、母集団をサブグループまたはより小さな階層に分割します。
-階層のサイズに比例する数の各階層からランダムなサンプルを取得します。
-ランダムなサンプルを形成するために、階層のサブセットをグループ化します。
-分析を実行します。
たとえば、2018年に卒業してから3か月以内に求人を受け取ったビジネス学生の数を知りたいと思っている研究者を考えてみてください。彼らはすぐにその年に20万人近くのビジネス卒業生がいることに気付くでしょう。
5,000人の卒業生から無作為に抽出して調査を実施することもできます。さらに良いことに、人口を層に分割し、それらの層からランダムなサンプルを取得できます。
これを行うには、年齢、人種、国籍、または職業的背景に基づいて人口グループを作成します。
ランダムなサンプルは、総人口に対する層のサイズに比例して、各層から取得されます。これらのサブセットは、サンプルを形成するために一緒にグループ化されます。
タイプ
比例層別サンプリング
このタイプでは、各層のサンプルサイズは、総母集団と比較した場合、層の母集団サイズに比例します。つまり、各層のサンプリングレートは同じです。
層を定義するために個人の特性を選択すると、結果のサブグループのサイズが異なることがよくあります。
たとえば、メキシコの人口の喫煙率を調査したい場合、喫煙習慣は年齢によって大きく異なると考えられているため、年齢は層別化の良い基準になると判断されました。3つの層が定義されています。
-20歳未満。
-20〜44歳。
-44歳以上。
メキシコの人口がこれらの3つの層に分割されると、3つのグループが同じサイズになるとは予想されません。実際、実際のデータはこれを裏付けています。
-層1:4240万(41.0%)。
-層2:3760万(36.3%)。
-層3:2350万(22.7%)。
比例層別サンプリングを使用する場合、サンプルは母集団と同じ比率を維持する層で構成する必要があります。1,000人のサンプルを作成する場合、サンプルは次のサイズである必要があります。
これは、人口内の地層の相対的比率によって決定される、より小さな人口を集めることと非常に似ています。
均一層別サンプリング
このタイプでは、母集団内のこれらの層の重みに関係なく、すべての定義された層に同じサンプルサイズが割り当てられます。
前の例を使用して均一な層別サンプリングを行うと、層ごとに次のサンプルが生成されます。
この方法では、より関連性の高い階層と同じレベルの重要度を付与することで、人口の重みが少ない階層を優先します。
これにより、サンプルの全体的な有効性が低下しますが、各層の個々の特性をより正確に調査できます。
この例では、層3(44を超える)の母集団について特定のステートメントを作成する場合、227単位のサンプルではなく、333単位のサンプルを使用して、サンプリングエラーを減らすことができます。比例層別サンプリング。
長所と短所
層別サンプリングは、さまざまな属性を持つ母集団に適していますが、サブグループを形成できない場合は効果がありません。
-アドバンテージ
主要な機能を収集する
層別サンプリングの主な利点は、サンプル内の母集団の主要な特性を収集することです。
加重平均と同様に、このサンプリング方法は、総母集団に比例するサンプルの特性を生成します。
より高い統計精度
階層化により、単純なサンプリング方法よりも推定の誤差が少なくなります。階層間の差が大きいほど、精度が向上します。
単純なサンプリングと比較すると、統計的精度が高くなります。これは、サブグループ内では、母集団全体で発生する変動と比較して、変動性が低いためです。
小さいサンプルサイズ
この手法は統計的精度が高いため、必要なサンプルサイズが小さくなるため、研究者の労力、費用、時間を大幅に節約できます。
-短所
残念ながら、この研究方法はすべての研究で使用できるわけではありません。この方法の欠点は、正しく使用するためにいくつかの条件を満たす必要があることです。
地層を見つける難しさ
主な欠点は、研究に適した階層を特定することが難しい場合があることです。さらに、母集団全体の完全で決定的なリストを見つけることは困難な場合があります。
整理する複雑さ
2番目の欠点は、単純なサンプリングと比較して、結果の整理と分析が複雑になることです。
研究者は、研究母集団の各メンバーを特定し、それを1つの部分母集団のみに分類する必要があります。その結果、研究者が自信を持って集団の各メンバーをサブグループに分類できない場合、層別サンプリングは不利です。
複数のサブグループに分類されるサブジェクトがある場合、並置は問題になる可能性があります。単純なサンプリングを実行すると、複数のサブグループのものが選択される可能性が高くなります。その結果、人口の不正確な表現や不正確な反映が生じる可能性があります。
大学生、卒業生、男性、女性などの例は、明確に定義されたグループであるため、簡単です。
ただし、他の状況では、はるかに難しい場合があります。人種、民族、または宗教などの特性を組み込むことを想像できます。分類プロセスはより困難になり、層別サンプリングは非効率的な方法になります。
例
研究チームが米国の大学生の成績平均点を求めたいとします。
研究チームは、2100万人の大学生からこのデータを収集することが明らかに困難です。したがって、4,000人の学生のみを使用して、母集団からサンプルを取得することにします。
チームはサンプル参加者のさまざまな属性を調べ、成績平均点と学生の専門分野の間に違いがあるかどうか疑問に思います。
サンプルでは、560人の学生が英語の学生、科学の1,135人、コンピュータサイエンスの800人、工学の1,090人、数学の415人であることがわかります。
チームは、サンプル層が人口サンプルに比例する比例層別サンプリングを使用したいと考えています。
層の作成
これを行うために、チームは米国の大学生の統計を調査し、専門とする学生の公式の割合を見つけます:12%が英語、28%が科学、24%がコンピューターサイエンス、21%がエンジニアリング、15%数学で。
したがって、5つの層が層別サンプリングプロセスから作成されます。チームは、人口層がサンプル層に比例していることを確認する必要があります。しかし、彼は比率が等しくないことを発見しました。
その結果、チームは4,000人の学生の母集団を再サンプリングする必要がありますが、今回はランダムに480人(12%)の英語学習者、1,120人(28%)の科学、960人(24%)のコンピュータサイエンス、840人( 21%)工学および600(15%)数学。
これにより、大学生の比例層別サンプルが得られ、米国の大学生をより適切に表すことができます。
研究者は、特定の層を強調し、米国の大学生のさまざまな研究を観察し、さまざまな成績の平均点を観察することができます。
参考文献
- アダム・ヘイズ(2019)。層別ランダムサンプリング。出典:investopedia.com。
- ウィキペディア、無料の百科事典(2019)。層化抽出法。取得元:en.wikipedia.org。
- 探索可能(2019)。層別サンプリング法。以下から取得:explorable.com。
- 調査ギズモ(2019)。層別サンプリングとは何ですか、いつ使用されますか?取得元:surveygizmo.com。
- アシュリー・クロスマン(2019)。層別サンプルとその作成方法について理解する。Thought Co.取得元:thoughtco.com。
- カルロス・オチョア(2017)。ランダムサンプリング:層別サンプリング。取得元:netquest.com。