- 確率またはランダムサンプリングの種類
- 単純なランダムサンプリング
- 体系的なランダムサンプリング
- 層別ランダムサンプリング
- ランダムクラスターサンプリング
- 非確率的サンプリングタイプ
- コンビニエンスサンプリング
- 割り当てのサンプリング
- 雪玉サンプリング
- 任意のサンプリング
- 参考文献
サンプリングのタイプは、全体の一部からデータを抽出するさまざまな方法です。強力な統計ツールであり、その機能は、母集団または宇宙のどの部分を調べ、推論し、それに関する情報を取得する必要があるかを決定することです。
母集団全体を分析できない、または分析したくない場合、サンプリングは非常に重要です。「人口」という用語は、大規模なグループの人々または生物のみを指すのではなく、一般に、特定の問題で調査される要素の総数を指すことに注意してください。

図1.サンプリングは、ユニバースから代表的なサンプルを選択するために重要です。出典:Pixabay。
選択したサンプリングのタイプに応じて、常に目的に従って、最も代表的であると考えられる母集団の部分が選択されます。
もちろん、データのユニバースの一部しか取得されていない場合、一部の詳細を見逃して情報が省略される可能性があります。そのため、結果は本来の正確さほど得られません。これは、サンプリングエラーと呼ばれます。
アイデアは、データの範囲をできるだけ単純化し、最大の情報を提供できる最も代表的なサンプルを選択して、結果の有効性を確保することです。
確率またはランダムサンプリングの種類
確率サンプリングは、サンプルの被験者を選択する必要がある確率に基づいています。このようにして、母集団の各要素には、選択される既知のチャンスが与えられます。もちろん、それは0より大きくなければなりません。
これは非常に重要です。データのユニバースから、全体を十分に代表していないサンプルが選択されている可能性があるためです。
もしそうなら、人口の一部が他よりも好まれるので、結果は偏ります。いくつかのカテゴリがあるバイアスを回避するための1つのオプションは、サンプルを偶然に選択して、各要素にゼロ以外の選択される確率を与えることです。
単純なランダムサンプリング
これは、チャンスが確実に機能するようにする簡単な方法です。たとえば、学校のアートイベントに参加するクラスの一部の子供を選択する問題の場合、すべての子供たちの名前は同じ折り畳まれた投票用紙に配置され、帽子に混ぜられ、ランダムに描かれた一握りです。
クラスのすべての子供が人口を構成し、帽子から引き出された一握りの投票用紙がサンプルです。
この手順の成功は、すべての子の完全なリストを作成することにあります。小さなコースではこれは問題ではありません。ただし、より大きな母集団からサンプルを選択する場合は、メソッドを改良する必要があります。
単純なランダムサンプリングは、交換または交換で実行できます。たとえば、母集団からいくつかの要素を抽出し、それを選択して調査した後でそれを返す場合、要素のユニバースは調査全体を通して常に同じままです。
逆に、選択された要素が調査された場合、それ以上は返されず、置換せずにサンプリングされます。これは、要素が選択される確率を計算するときに考慮する必要があります。
体系的なランダムサンプリング
このサンプリングを実行するには、N個の要素をリストし、サンプルのサイズ(nと呼ぶ)を決定することも必要です。このリストは、サンプリングフレームと呼ばれます。
これでジャンプ間隔が定義されました。これは文字kで示され、次のように計算されます。
1からkまでのランダムな番号がランダムに選択され、roランダムスタートと呼ばれます。これは選択されるリストの最初の個人であり、そこからリストの次の要素が選択されます。
例:大学から2000人の学生のリストがあり、会議に参加する100人の学生のサンプルを取得するとします。
最初に行うことは、kの値を見つけることです。
生徒の総数を20人の生徒の100個のフラグメントに分割すると、フラグメントの1つが取得され、1から20の間で乱数が選択されます(例:12)。したがって、リストの12番目の生徒はランダムブート。
次に選択される生徒は、12 + 20 = 22、42、62のようになり、100がすべて完了するまで続きます。
ご覧のとおり、これはすばやく適用する方法であり、バイアスが発生する母集団に周期性がない限り、2000の名前を帽子に入れて100を取る必要はなく、通常は非常に良い結果が得られます。 。
層別ランダムサンプリング

図2.層別ランダムサンプリングでは、人口は層と呼ばれるセグメントに分割されます。出典:Pixabay。
単純な無作為抽出では、母集団の各アイテムが選択される確率は同じです。しかし、これは常にそうであるとは限りません。特に、考慮すべき複雑さがもっとある場合はそうです。
層別ランダムサンプリングスキームを実行するには、母集団を類似の特性を持つグループに分割する必要があります。これらは地層です。次に、階層が取得され、単純なランダムサンプルがそれぞれから選択されます。これらが組み合わされて、最終的なサンプルが形成されます。
層は、サンプリングの前に決定され、データユニバースの特性を調べます。
これらの特性には、婚姻状況、年齢、居住地、たとえば都市部、郊外および農村部の人口、職業、教育レベル、性別などがあります。
いずれの場合でも、各層の特性は非常に特徴的であることが期待されます。つまり、各層は均質です。
層別サンプリングでは、各層のサンプルサイズがそのサイズに比例するかどうかに応じて、2つのカテゴリを区別します。
ランダムクラスターサンプリング
上記の方法はサンプルの要素を直接選択しますが、クラスターサンプリングでは、要素のグループが母集団から選択され、これらはクラスターと呼ばれるサンプリング単位になります。
クラスターの例としては、大学の学部、州、市、郡、地方自治体などの地理的エンティティが挙げられ、これらはすべて同じ確率で選択されます。地理的エンティティを選択する場合、エリアごとのサンプリングについて説明します。
クラスターが選択されると、分析対象の要素がそこから選択されます。したがって、手順にはいくつかの段階があります。
この方法は層別ランダム法といくつかの類似点がありますが、ここではいくつかのクラスターが合計から選択されますが、前の方法では母集団のすべての層が調査されました。
非確率的サンプリングタイプ
真に代表的なサンプルを見つけるには時間とリソースを費やす必要があるため、状況によっては確率サンプリングが非常に高価になる場合があります。
また、完全なサンプリングフレーム(リスト)がないこともよくあります。そのため、要素を選択する確率を決定することはできません。
これらのケースでは、結果の精度が保証されていないにもかかわらず、情報が取得される非確率的サンプリングタイプが使用されます。
このタイプのサンプリングが適用される場合、サンプルができるだけ適切であることを求めて、選択時にいくつかの基準に従う必要があります。
コンビニエンスサンプリング
これはかなり基本的なタイプのサンプリングであり、サンプルの要素はそれらの可用性に応じて選択されます。つまり、最も手元にいる個人を選択します。その速度と利便性により、非常に低コストの方法であるという利点があります。
しかし、言ったように、あなたの結果に関する信頼できる情報を得ることは確実ではありません。選挙の前にすばやく短い投票をしたり、特定の製品の顧客の好みを問い合わせたりするために使用されることがあります。
たとえば、世論調査員は、自分の家に最も近い3つのショッピングセンターの出口に行って、出て行く候補者に投票するか尋ねます。または、教師は自分の生徒にすぐにアクセスできるため、自分の生徒を調査できます。
そのような手順の結果は無意味であるように見えますが、バイアスがあまり大きくないと想定する十分な理由がある限り、それらは人口の良い反映である可能性があります。
ただし、特定の教師の生徒が残りの生徒の体の代表的なサンプルを構成していない可能性があるため、それはそれほど単純ではありません。そして、ほとんどの場合、ショッピングモールの世論調査担当者は、最も魅力的に見える人々にインタビューする傾向があります。
割り当てのサンプリング
クォータでサンプリングするには、最も代表的な要素であるというアイデアを得るために、人口階層についての十分な事前知識が必要です。しかし、それは層別サンプリングのランダム性基準によって管理されていません。
このタイプのサンプリングでは、「クォータ」、つまりメソッドの名前を設定する必要があります。これらの割り当ては、特定の条件のある多くの要素を集めることで構成されています。たとえば、25歳から50歳までの15名の女性が喫煙をせず、車も所有しています。
割り当てが決定されると、確立された条件を満たす最初の人々が選択されます。この最後のステップの基準は、治験責任医師の都合にあるかもしれません。ここでは、ランダムな層別サンプリング法との違いを確認できます。
ただし、前述のように、調査中の人口がよく知られている場合は、低コストの方法が有利です。
雪玉サンプリング
このサンプリングスタイルで従う手順は、サンプルが研究者が必要とするサイズになるまで、他の人をリードし、次に他の人をリードする数人を選択することです。
これは、特定の特性を持つ一部の母集団を特徴付けるのに役立つ手順です。例:刑務所の受刑者または特定の病気の人々。
任意のサンプリング
最後に、彼の知識に従って、彼のサンプルを選択するために使用される基準を決定するのは研究者です。これは、ランダムな方法を使用して参加できなかった特定の個人を調査に追加する必要がある場合に役立ちます。
参考文献
- Berenson、M。1985。経営と経済学、概念と応用のための統計。エディトリアルインターアメリカーナ。
- 統計学。サンプリング。から回復:encyclopediaeconomica.com。
- 統計学。サンプリング。復元:Estadistica.mat.uson.mx。
- 探索可能。集落抽出。回復元:explorable.com。
- ムーア、D。2005。応用基本統計。2番目。版。
- Netquest。確率サンプリング:層別サンプリング。回収元:netquest.com。
- ウィキペディア。サンプリング。回復元:es.wikipedia.org
