統計のサンプリングエラーまたはサンプリングエラーは、サンプルの平均値と母集団の平均値の差です。アイデアを説明するために、都市の総人口が100万人で、その平均的な靴のサイズが欲しいと想定して、1,000人のランダムなサンプルを取得したとします。
サンプルにバイアスがかかっていない場合、値は近いはずですが、サンプルから出現する平均サイズは、必ずしも全母集団のサイズと一致するとは限りません。サンプルの平均値と全母集団の平均値のこの差が、サンプリングエラーです。
図1.サンプルは全母集団のサブセットであるため、サンプルの平均には誤差があります。出典:F. Zapata
総母集団の平均値は一般に不明ですが、このエラーを低減する手法と、この記事で説明するサンプリングエラーマージンを推定する式があります。
数式と方程式
サイズNの母集団における特定の測定可能な特性xの平均値を知りたいとしましょう。ただし、Nは大きな数であるため、総母集団についての調査を実行することは不可能であるため、次の無作為抽出を行います。サイズn <
サンプルの平均値は、
m個のサンプルが総母集団Nから取得され、すべて同じサイズnで平均値を持つと仮定します。
これらの平均値は互いに同一ではなく、すべて母平均値μの周りにあります。サンプリング誤差マージンEは、平均値の予想される分離を示します
サイズnのサンプルの標準誤差マージンεは次のとおりです。
ε=σ/√n
ここで、σは標準偏差(分散の平方根)で、次の式を使用して計算されます。
σ=√
標準誤差マージンεの意味は次のとおりです。
平均値
サンプリング誤差の計算方法
前のセクションでは、サイズnのサンプルの標準誤差マージンを求める式を示しました。ここで、標準という語は、68%の信頼度の誤差のマージンであることを示しています。
これは、同じサイズnのサンプルを多数取得した場合、それらの68%が平均値を与えることを示しています。
ルール68-95-99.7と呼ばれる単純なルールがあります。これにより、68%、95%、99.7%の信頼水準のサンプリング誤差マージンEを簡単に見つけることができます。このマージンは1⋅ε、2であるためです。 ⋅εおよび3⋅ε。
自信を持って
信頼水準γが上記のいずれでもない場合、標本誤差は標準偏差σに係数Zγを掛けたものであり、次の手順で得られます。
1.-最初に、以下の関係を介して信頼水準γから計算される有意水準αが決定されます:α= 1-γ
2.-次に、値1-α/ 2 =(1 +γ)/ 2を計算する必要があります。これは、F(z)に代表される正規分布またはガウス分布において、-∞からZγまでの累積正規周波数に対応し、その定義は図2で確認できます。
3.-方程式F(Zγ)= 1-α/ 2は、正規(累積)分布Fの表、または逆標準化されたガウス関数F -1を持つコンピューターアプリケーションによって解かれます。
後者の場合、次のようになります。
Zγ= G -1(1-α/ 2)。
4.-最後に、この式は、信頼性レベルγのサンプリング誤差に適用されます。
E =Zγ⋅(σ/√n)
図2.正規分布の表。出典:ウィキメディア・コモンズ。
例
-例1
100人の新生児のサンプルの平均体重で標準誤差マージンを計算します。平均重量の計算は
解決
標準誤差範囲は、ε=σ/√n=(1,500 kg)/√100= 0.15 kgです。つまり、これらのデータから、新生児の68%の体重は2,950 kgから3.25 kgの間であると推測できます。
-例2
平均体重が3,100 kgで標準偏差σ= 1,500 kgの場合、95%の信頼水準で、誤差Eのサンプリングマージンと100人の新生児の体重の範囲を決定します。
解決
規則68が適用される場合; 95; 99.7→1⋅ε; 2⋅ε; 3⋅ε、私たちは持っています:
E =2⋅ε=2⋅0.15kg = 0.30 kg
つまり、95%の新生児の体重は2,800 kgから3,400 kgになります。
-例3
例1の新生児の体重の範囲を99.7%の信頼マージンで決定します。
解決
99.7%の信頼度のサンプリング誤差は3σ/√nです。これは、この例ではE = 3 * 0.15 kg = 0.45 kgです。ここから、新生児の99.7%の体重は2,650 kgから3,550 kgになります。
-例4
75%の信頼水準の因子Zγを決定します。例1に示したケースについて、このレベルの信頼性でサンプリングエラーのマージンを決定します。
解決
信頼水準はγ= 75%= 0.75であり、関係γ=(1-α)を介して有意水準αに関連しているため、有意水準はα= 1-0.75 = 0です。 、25。
つまり、-∞とZγの間の累積正規確率は次のとおりです。
P(Z≤Zγ)= 1-0.125 = 0.875
これは、図3に示すように、1.1503のZγ値に対応します。
図3. 75%の信頼水準に対応するZγ係数の決定。出典:F. ZapataからGeogebraまで。
言い換えると、サンプリング誤差はE =Zγ⋅(σ/√n)= 1.15⋅(σ/√n)です。
例1のデータに適用すると、次のエラーが発生します。
E = 1.15 * 0.15 kg = 0.17 kg
75%の信頼水準。
-演習5
Zα/ 2 = 2.4の場合、信頼水準はどのくらいですか?
解決
P(Z≤Zα / 2)= 1-α/ 2
P(Z≤2.4)= 1-α/ 2 = 0.9918→α/ 2 = 1-0.9918 = 0.0082→α= 0.0164
重要度のレベルは次のとおりです。
α= 0.0164 = 1.64%
そして最後に、信頼水準は残ります:
1-α= 1-0.0164 = 100%-1.64%= 98.36%
参考文献
- Canavos、G。1988。確率と統計:アプリケーションと方法。マグローヒル。
- Devore、J。2012。工学と科学の確率と統計。8日。版。Cengage。
- レビン、R。1988。管理者のための統計。2番目。版。プレンティスホール。
- Sudman、S. 1982。質問:アンケート設計の実践ガイド。サンフランシスコ。ジョシーベース。
- ウォルポール、R。2007。工学および科学の確率と統計。ピアソン。
- ウォナコット、TH、RJウォナコット。1990.入門統計。5編Wiley
- ウィキペディア。サンプリングエラー。から回復:en.wikipedia.com
- ウィキペディア。誤差の範囲。から回復:en.wikipedia.com