- 特徴
- メソッドのタイプ
- 一段階でのサンプリング
- 二段階サンプリング
- いつ使うか
- 母集団のアイテムの完全なリストを作成することは困難、高価、または不可能です
- 人口は「自然な」コングロマリット(都市、学校、病院など)に集中しています。
- 利点
- 生存能力
- 経済
- 変動の減少
- 主な用途
- 短所
- バイアスされたサンプル
- 間違い
- 例
- 一段階でのサンプリング
- 二段階サンプリング
- 多段階サンプリング
- 参考文献
クラスターサンプリングは母集団均質なグループは明らかであるが、内部的に異質であるときにメソッドをサンプリングのタイプが使用されています。市場調査でよく使用されます。
このサンプリング方法を使用すると、研究者は母集団全体からすべての被験者をすぐに選択するのではなく、いくつかの手順を実行して母集団のサンプルを収集します。まず、研究者は総人口をクラスターと呼ばれる別々のグループに分けます。次に、母集団グループから単純なランダムサンプルを選択します。最後に、これらのグループからサンプルデータを取得して分析を実行します。
出典:pixabay.com
固定ランダムサンプルサイズの場合、母集団の変動の最大量がグループ内ではなくグループ内に存在する場合、予想される誤差は小さくなります。
クラスタサンプリングを使用する一般的な理由は、サンプリング効率を上げることでコストを削減することです。これは、精度を高めることを目的とする層別サンプリングとは異なります。
特徴
-人口はコングロマリットと呼ばれるNグループに分けられます。
-研究者は無作為にn個のグループを選択してサンプルに含めます。nはN未満です。
-母集団の各要素は1つに割り当てることができ、1つのクラスターにのみ割り当てることができます。
-理想的には、クラスター内の母集団は可能な限り不均一である必要がありますが、クラスター間には均一性がある必要があります。各クラスターは、総人口の小規模な表現でなければなりません。
メソッドのタイプ
調査に含めるクラスターを選択するには、関連するクラスターでランダムサンプリング手法を使用します。
一段階でのサンプリング
1ステージのクラスターサンプリングでは、選択した各グループ内のすべての要素がサンプリングされます。
二段階サンプリング
2段階クラスターサンプリングでは、選択したグループ内のアイテムのサブセットがランダムに選択され、サンプルに含まれます。
いつ使うか
コスト削減が精度の損失を上回っている場合にのみ、経済的に正当化される場合にのみ使用してください。これは、以下の状況で発生する可能性が高くなります。
母集団のアイテムの完全なリストを作成することは困難、高価、または不可能です
たとえば、金物店のチェーンのすべての顧客をリストすることができない場合があります。
ただし、店舗のサブセットをランダムに選択し(ステージ1)、それらの店舗にアクセスする顧客のランダムなサンプルをインタビューする(ステージ2)ことは可能です。
人口は「自然な」コングロマリット(都市、学校、病院など)に集中しています。
たとえば、手術室の看護師との1対1のインタビューを実施するには、病院のサンプルからランダムに病院を選択し(ステージ1)、その病院のすべての手術室の看護師にインタビューすることは理にかなっています。
クラスタサンプリングを使用すると、面接担当者は1日および1つの病院で多くの面接を実施できます。
対照的に、単純なランダムサンプリングでは、面接担当者が1つの病院で1つの面接を実施するために1日中旅行する必要があります。
利点
これは、他のサンプリング計画よりも安価である場合があります。たとえば、出張費や管理費が少なくて済みます。
生存能力
このサンプリング方法では、大規模な母集団が考慮されます。これらのグループは非常に大きいため、他のサンプリング方法を実装すると非常にコストがかかります。
経済
この方法では、旅行などの支出に対する大きな懸念が大幅に軽減されます。
たとえば、都市の各世帯での調査からの情報をまとめるのは非常に費用がかかりますが、都市のいくつかのブロックで情報をまとめるのは安上がりです。この場合、移動量が大幅に削減されます。
変動の減少
他の方法で推定値を検討すると、結果のばらつきが少なくなります。これは常に理想的な状況であるとは限りません。
主な用途
すべての要素を含むサンプリングフレームが使用できない場合は、クラスターサンプリングのみを使用できます。
短所
バイアスされたサンプル
サンプル母集団のグループに偏った意見がある場合、母集団全体が同じ意見を持つことになります。これは実際のケースではないかもしれません。
間違い
いわゆる「設計効果」で表現できる、より高いサンプリング誤差があります。
他の確率論的方法は、この方法よりもエラーが少ないです。このため、初心者にはお勧めできません。
例
クラスターサンプリングは、戦争、飢饉、自然災害などのケースで高い死亡率を推定するために使用されます。
一段階でのサンプリング
NGOは、教育を提供するために、近隣の5つの町で子供たちのサンプルを確立したいと考えています。
1ステージのクラスターサンプリングにより、NGOは無作為に母集団(クラスター)を選択してサンプルを作成し、これらの都市の教育を受けていない子供たちをサポートすることができます。
二段階サンプリング
事業主は、米国のさまざまな地域に散らばっている彼の植物の統計的性能を見つけようとしています。
プラントの数、各プラントで実行される作業、およびプラントごとの従業員数を考慮に入れると、1つの段階でのサンプリングには時間がかかり、費用がかかります。
したがって、サンプリングは2段階で行うことにしました。所有者は、さまざまな植物から労働者のサンプルを作成してクラスターを形成します。次に、稼働状態のプラントのサイズにそれらを分割します。
2段階のクラスターサンプリングが形成され、単純なランダムサンプリングなどの他のクラスター手法が適用されて計算が開始されました。
多段階サンプリング
地理的クラスターサンプリングは、最も広く実装されている手法の1つです。
各クラスターは地理的なエリアです。地理的に分散した母集団で調査を行うのはコストがかかるため、ローカルエリア内でさまざまな回答者をクラスタリングすることにより、単純なランダムサンプリングよりも大きな経済を達成できます。
一般に、推定で同等の精度を実現するには、サンプルの合計サイズを増やす必要がありますが、コストを節約することで、サンプルのサイズをこのように大きくすることができます。
たとえば、ある組織では、ドイツ全土のスマートフォンのパフォーマンスを分析するための調査を実施する予定です。
国全体の人口を都市(クラスター)に分割し、人口が最も多い都市を選択することもできます。また、モバイルデバイスを使用するものをフィルタリングします。
参考文献
- ウィキペディア、無料の百科事典(2019)。集落抽出。取得元:en.wikipedia.org。
- スタット・トレック。(2019)。クラスターサンプリングとは stattrek.comから取得。
- 探索可能(2019)。集落抽出。以下から取得:explorable.com。
- Adi Bhat(2019)。クラスタサンプリング:定義、方法、および例。Question Pro。以下から取得:questionpro.com。
- CFI(2019)。集落抽出。出典:Corporatefinanceinstitute.com。