人口比率の信頼区間を構築する方法

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


統計パラメータの信頼区間は、このパラメータが取り得ると推定される値の範囲です。言い換えれば、それらは、このパラメーターが一定の信頼レベルで変化する可能性のある2つの値です。信頼区間の計算は、母集団の統計パラメータの決定の一部です。パラメータの値は母集団のサンプルで決定され、同じ計算プロセスで、取得されたパラメータの値の信頼区間が決定されます。推論統計を使用して推定できるパラメーターの 1 つのタイプは、母集団の割合です。

たとえば、特定の法律を支持する国の人口の割合は何パーセントかという質問をすることができます。このタイプの質問では、決定された値の信頼区間を決定する必要があります。以下では、母集団の一部の信頼区間がどのように構築され、その理論的根拠の一部が公開されているかを見ていきます。

すでに述べたように、統計パラメーターの信頼区間は、このパラメーターが特定の信頼レベルで変化する可能性のある2つの値として定義されます。パラメータ推定量はこの範囲の中央にあります。したがって、信頼区間は次の形式になります。

推定量 +/- 不確実性

したがって、決定しなければならない 2 つの数値があります。調査しているパラメーターの推定値と、不確実性または誤差範囲です。

計算の前提

統計計算を実行するには、その特定の決定のために定義された特定の前提が満たされている必要があります。母集団の割合を評価するために信頼区間を決定する場合、前提は次のとおりです。

1. 非常に大きなサイズの母集団から無作為に抽出されたサンプルを評価する必要があります。サンプルには多くのケースnがあります。

2. サンプルのメンバーは、互いに独立して選択する必要があります。

3. サイズnのサンプルには、少なくとも 15 回の成功と 15 回の失敗がなければなりません。

サンプルと母集団の割合

母集団の割合を推定する手順を見てみましょう。標本平均を使用して母平均を推定するのと同様に、標本比率を使用して母比率を推定することもできます。母集団の割合は未知のパラメーターであり、決定される値です。このパラメーターを計算する方法は、サンプルに登録されている成功数を加算し、合計の結果をサンプルの合計ケース数nで割ることです。pと呼びます調査対象の母集団のパラメータに対して、特定の基準を満たす母集団の割合。同様に、サンプルの比率を取得します。これを母集団の比率と区別するために、次の式に示すように、その上に線を引きます。サンプルの割合は、母集団の割合の推定量です。

母集団の割合の信頼区間を決定するには、次の図に示すように、その統計的分布が何であるかを知る必要があります。

母集団の割合の統計分布。
母集団の割合の統計分布。

統計分布を使用すると、推定量と標準偏差SE、信頼区間を構成する値を決定することができます

信頼区間

信頼水準で

信頼水準

これらの統計問題では、標準偏差SE は、次の式で示されるように、母集団のサイズnのサンプルにおける陽性ケースの割合であるpの推定量の関数として二項式の動作をします。

標準偏差

一般的な定義では、標準偏差の式でp値を使用しますが、これは未知の値です。そのため、前の式が示すように、その推定値をpに置き換えて標準誤差が使用されます。

考慮すべきもう 1 つの側面は、確立された 3 つの前提の下で、二項分布を標準正規分布で近似できることです。

このようにして、母集団の割合の信頼区間を決定する式が得られます。

母集団の割合の信頼区間。

信頼水準は、前の図に示すように、標準正規分布で考慮されるパーセンテージとして決定されます。面積が大きいほど、信頼区間の信頼レベルが高くなります。次の表は、カバーされる分布領域を表す信頼レベルのさまざまな値に対するパラメーターの値を示しています。

信頼度。

母集団比率の信頼区間の決定の例

特定の政党に共感する都市の有権者の割合を 95% の信頼度で知りたいとします。その都市の 100 人で構成された単純なランダム サンプルで情報を収集すると、そのうちの 64 人がその政党に共感していることがわかりました。

まず、確立した 3 つの前提が満たされていることを確認します。人口が非常に多い都市の人口の意見が評価され、サンプルが無作為に抽出されます。この場合、nは 100 です。100 のケースのうちの特定の 1 つの情報は、個別に収集されました。相談に対する肯定的な回答である成功、否定的な回答である失敗はいずれも15件を超えています。

サンプルの比率の値、つまり、決定したいパラメーターの推定値、つまり、問題の政党と一致する都市の人口の比率は、陽性ケースとサンプルを構成するnケースの数。64 割る 100、0.64。これは推定量の値であり、信頼区間の中心です。

不確実性を評価する式には、2 つの要因があります。最初の係数は、係数が 1.96 になる 95% であると決定された信頼水準です。2 番目の要素を評価するには、値 0.64 と 100 を式に代入する必要があり、2 番目の要素の値が 0.048 であることがわかります。両方の要因の積により、不確実性が得られます。0.094。したがって、この例の信頼区間は

0.640 +/- 0.094

この信頼区間は、信頼度が 95% であると解釈できます。つまり、結果が総人口の 95% を表している場合、問題の都市で政党に共感する人々の割合は 54.6% から 54.6% の間になります。 73.4%。

関連する統計概念

このタイプの信頼区間の決定には、多くのアイデアと統計上の問題が関係しています。たとえば、母比率の値に関連する仮説検定を実行する場合があります。2 つの異なる母集団からの 2 つの割合を比較することもできます。

ソース

気分、アレキサンダー。グレイビル、フランクリンA。Boes、Duane C.統計理論の紹介。第 3 版、McGraw-Hill、1974 年。

仮説検定。統計的推論。メキシコ国立自治大学。2021 年 10 月にアクセス。

Westfall、Peter H.高度な統計手法の理解。フロリダ州ボカラトン: CRC プレス、2013 年。

-広告-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados

実数は?

円周の計算