連続変数は、これら二つの値を任意に近い場合であっても、二つの与えられた値の間の数値の無限の数を取ることができるものです。それらは、測定可能な属性を記述するために使用されます。たとえば、身長や体重。連続変数がとる値は、有理数、実数、または複素数にすることができますが、後者の場合は統計ではそれほど頻繁ではありません。
連続変数の主な特徴は、2つの有理または実際の値の間で常に別の値を見つけることができ、他の値と最初の別の値の間で無期限に見つけることができることです。
図1.曲線は連続分布を表し、棒は離散分布を表します。ソース:pixabay
たとえば、最も重い重量が95 kgで最も低い重量が48 kgであるグループの可変重量を想定します。それは変数の範囲であり、可能な値の数は無限です。
たとえば、50.00 kgと50.10 kgの間は50.01になります。ただし、50.00から50.01までは50.005のメジャーになります。それは連続変数です。一方、可能な重量の測定で小数点以下1桁の精度が確立された場合、使用される変数は離散になります。
連続変数には数値が関連付けられているため、連続変数は量的変数のカテゴリに属します。この数値により、算術演算から極小演算まで、さまざまな演算が可能です。
例
物理学のほとんどの変数は連続変数であり、その中には長さ、時間、速度、加速度、エネルギー、温度などがあります。
連続変数と離散変数
統計では、質的および量的の両方のさまざまなタイプの変数を定義できます。連続変数は後者のカテゴリに属します。それらを使用すると、算術演算を実行できます。
たとえば、変数hは、身長が1.50 m〜1.95 mの人に対応し、連続変数です。
この変数を次の変数と比較してみましょう。コイントスが表に出る回数です。これをnと呼びます。
変数nは0から無限大までの値を取ることができますが、値1.3と1.5を取ることができないため、nは連続変数ではありません。値1と2の間には他に値がないためです。これは、離散変数の例です。
連続変数の演習
次の例を考えてみましょう:マシンがマッチ棒を生成し、ボックスにパックします。2つの統計変数が定義されています。
公称一致長は5.0 cmで、許容誤差は0.1 cmです。ボックスごとの一致数は50で、許容誤差は3です。
a)LとNが取り得る値の範囲を示します。
b)Lはいくつの値を取ることができますか?
c)いくつの値をとることができますか?
いずれの場合も、それが離散変数か連続変数かを示します。
解決
Lの値は範囲内です。つまり、Lの値は区間内にあり、変数Lはこれら2つの測定値の間で無限の値をとることができます。これは連続変数です。
変数nの値は区間内にあります。変数nは許容範囲内で6つの可能な値のみを取ることができ、それは離散変数です。
の練習
連続的であることに加えて、変数によって取得された値がそれらに関連付けられた特定の発生確率を持っている場合、それは連続的な確率変数です。変数が離散的であるか連続的であるかを区別することは非常に重要です。なぜなら、一方と他方に適用可能な確率モデルは異なるからです。
連続確率変数は、それが想定できる値、およびそれらのそれぞれが発生する確率がわかっているときに完全に定義されます。
-確率の演習1
仲人は、棒の長さが常に値4.9 cmと5.1 cmの間であり、これらの値の外側ではゼロになるようにそれらを作成します。5,0003 cmの1つを抽出することもできますが、5.00〜5.05 cmの棒を取得する可能性があります。これらの値は等しく可能ですか?
解決
確率密度が均一であると仮定します。特定の長さの一致を見つける確率は以下のとおりです。
-一致が範囲内にある場合、確率= 1(または100%)になります。これは、マシンがこれらの値の外で一致を描画しないためです。
-4.9と5.0の間の一致を見つけると、長さの範囲の半分になるため、確率=½= 0.5(50%)になります。
-一致の長さが5.0〜5.1である確率も0.5(50%)です。
-長さが5.0から5.2のマッチ棒はないことがわかっています。確率:ゼロ(0%)。
つまようじが特定の範囲で見つかる確率
ここで、長さがl 1とl 2の間のスティックを取得する次の確率Pを観察します。
-Pは、一致の長さが5.00から5.05であることをP()として示します。
-P丘の長さが5.00から5.01の間であることは、次のとおりです。
-P丘の長さが5,000から5,001の間であることは、さらに短いです。
間隔を徐々に減らして5.00に近づけると、つまようじがちょうど5.00 cmになる確率はゼロ(0%)になります。ある範囲内で一致が見つかる確率です。
特定の範囲内で複数のつまようじを見つける確率
イベントが独立している場合、2つのつまようじが特定の範囲内にある確率は、それらの確率の積です。
-2つの箸が5.0と5.1の間にある確率は、0.5 * 0.5 = 0.25(0.25%)です。
-50本のつまようじが5.0と5.1の間にある確率は、(0.5)^ 50 = 9×10 ^ -16です。つまり、ほぼゼロです。
-50本のつまようじが4.9から5.1の確率は(1)^ 50 = 1(100%)
-確率の演習2
前の例では、確率が指定された間隔で均一であると想定されていましたが、常にそうであるとは限りません。
つまようじを製造する実際の機械の場合、つまようじが中心値にある可能性は、極端な値の1つにある場合よりも高くなります。数学的な観点から、これは確率密度と呼ばれる関数f(x)でモデル化されます。
メジャーLがaとbの間にある確率は、aとbの間の関数f(x)の定積分を使用して計算されます。
例として、演習1の値4.9と5.1の間の均一分布を表す関数f(x)を見つけたいと仮定します。
確率分布が均一である場合、f(x)は定数cに等しく、cの4.9と5.1の間の積分を取ることによって決定されます。この積分は確率なので、結果は1でなければなりません。
図2.均一確率密度。(独自の詳細)
これは、cが1 / 0.2 = 5の価値があることを意味します。つまり、一様確率密度関数は、f(x)= {5であり、4.9≤x≤5.1であり、この範囲外の場合は0です。一様確率密度関数を図2に示します。
同じ幅の間隔(たとえば、0.02)では、確率は中心で連続変数L(つまようじの長さ)の範囲の終わりと同じであることに注意してください。
より現実的なモデルは、次のような確率密度関数です。
図3.非均一確率密度関数。(独自の詳細)
図3では、4.99〜5.01(幅0.02)のつまようじを見つける確率が、4.90〜4.92(幅0.02)のつまようじを見つける確率よりも高いことがわかります。
参考文献
- ディノフ、イヴォ。離散確率変数と確率分布。取得元:stat.ucla.edu
- 離散および連続確率変数。取得元:ocw.mit.edu
- 離散確率変数と確率分布。取得元:homepage.divms.uiowa.edu
- H.ピシュロ。確率の紹介。回復元:確率Course.com
- メンデンホール、W。1978。経営と経済学の統計。Grupo社説Iberoamericana。103-106。
- 確率変数の問題と確率モデル。から回復:ugr.es。
- ウィキペディア。連続変数。wikipedia.comから復元
- ウィキペディア。統計変数。wikipedia.comから回復。