母集団とサンプルの標準偏差の差

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


記述統計には、母集団のデータのさまざまな一般的な側面を観察できる一連の尺度があります。データの中心傾向を測定するために使用されるものもあれば、データの変動性または分散、つまり、データが中心傾向の周りに分布する方法のアイデアを提供しようとするものもあります。

変動性または分散の 2 つの重要な尺度は、分散と標準偏差です。これら 2 つの測定値は互いに密接に関連していますが、分散には 2 つのバージョンがあり、対応する標準偏差には母集団と標本という 2 つのバージョンがあります。

母集団とサンプル統計の要約

非常に重要な事実に注目する価値があります。つまり、統計では、一連のデータの動作を要約し、異なるコンテキストで使用される各測定値に一般に 2 つのバージョンがあるということです。

まず、母集団からのデータ (または母集団データ) と、サンプルと呼ばれるその母集団のサブセットからのデータを区別する必要があります。母集団データと標本データは数学的には区別できませんが、概念的には大きく異なります。

国勢調査

母集団データとは、母集団を構成する個々の要素または個人を測定または分析する統計的調査によって得られたデータです (もちろん、有限である場合に限ります)。母集団データの中心傾向または分散の測定値を計算すると、母集団の一般的な動作を要約する測定値が得られます。これは母集団パラメーターと呼ばれ、母集団の固定値です (つまり、母集団には 1 つの平均しかありません)。 、1 つのモード、1 つの標準偏差など)。この場合、記述統計を利用しています。

サンプリング

一方、さまざまな状況で、母集団の一部の要素のみを分析するためにサンプリング プロセスを実行し、サンプル データを取得します。これらの場合、記述統計のツールを使用してこれらのデータの一般的な動作を観察することもできますが、実際には母集団に対して記述統計を行っているのではなく、標本に対してのみ記述統計を行っています。

サンプルの数値要約はパラメータではありませんが、統計と呼ばれます(統計と呼ばれるものもあります)。パラメータとは異なり、サンプルが同じ母集団から抽出された場合でも、統計はサンプルごとに異なります。これは、母集団のサブセットを選択するときに、サンプルを構成できる要素の組み合わせが多数存在するためです。このため、一般に、サンプルはさまざまな被験者、個人、または要素で構成されており、さまざまな統計が得られます。

サンプルでこれらの統計を計算する最終的な目的は、それらをそれぞれの母集団パラメーターの推定値として使用できるようにすることです。サンプル データから母集団データの動作を推測または推定するこのプロセスは、推論統計が担当するものです。これにより、母集団とサンプルの分散と標準偏差が本質的に異なります。

しかし、分散と標準偏差とは正確には何ですか?

分散とは何ですか?

分散は、データセットの平均からの分散の尺度です。これは、平均からのすべてのデータの二乗偏差の平均として定義されます。二乗差の平均であるため、常に正の量です。

標準偏差とは何ですか?

一方、標準偏差は単純に分散の正の平方根です。また、平均の周りの分散も測定しますが、データと平均の同じ単位に関してのみ測定します。これにより、分散よりも理解しやすく解釈しやすくなります。

標準偏差は分散の平方根として計算されるため、母集団と標本の分散について話さずに母集団と標本の標準偏差について話すことは意味がありません。

平均値付近の分散のこれらの一般的な尺度間の最も重要な違いについては、次のセクションで詳しく説明します。

相違点 1: 母集団と標本の標準偏差と分散は、異なる記号で表されます

母集団とサンプルの分散、および母集団とサンプルの標準偏差を比較する際に考慮すべき最初の違いは、それらを表すために使用される記号です。統計では、母集団の数値の要約またはパラメータは通常、ギリシャ文字を使用して表されますがサンプルまたは統計バージョンはラテン アルファベットの同等の文字で表されます

この意味で、分散と母標準偏差は両方とも小文字のギリシャ文字 sigma に関連付けられ、サンプル バージョンは文字sで表されます。つまり、母分散はσ 2母標準偏差はσであり、サンプル分散はs 2で表され、サンプル標準偏差はsで表されます

相違点 2: 異なる式で計算される

母集団とサンプルの標準偏差は、それぞれの分散の正の平方根として計算されます。つまり、次のようになります。

母集団とサンプルの標準偏差の差

ただし、母分散とサンプル分散は、わずかに異なる式を使用して計算されます。母分散の場合、これは、母平均に対する各データムの偏差の二乗の平均として計算されます。つまり、次の同等の式のいずれかによって計算されます。

母集団とサンプルの標準偏差の差

ここで、x i は母集団の各データ項目の値を表し、μ は母集団の平均を表し、N は母集団のサイズを表します。したがって、母標準偏差は次のように計算されます。

母集団とサンプルの標準偏差の差

代わりに、予想されるようにデータ ポイントの数nで割る代わりに、標本分散は、標本平均からの偏差の二乗和をn – 1で割ることによって計算されます。つまり、標本分散は次のように計算されます。

母集団とサンプルの標準偏差の差

x i は標本の各データ項目の値を表し、x̄ は標本平均を表し、 nは標本サイズを表します。上記を考慮して、サンプル標準偏差は次のように計算されます。

母集団とサンプルの標準偏差の差

n の代わりに n – 1 で割ることの正当化

母集団標準偏差と標本標準偏差を比較するときに生じる一般的な質問は、なぜnではなくn – 1で割るのかということです。理由はとても簡単です。

前述のように、サンプル標準偏差などの統計の計算では、それぞれの母集団パラメーターにできるだけ近い推定量を確立しようとします。これは、結果が母集団の標準偏差にできるだけ近くなるように、サンプルの標準偏差を計算する必要があることを意味します。

これは、同等の式で計算する必要があることを示唆していますが、常にそうであるとは限りません。問題は、サンプル標準偏差が母平均ではなく、サンプル平均の周りの広がりを測定することです。サンプル平均は、母平均の推定量として使用される統計量ですが、それと正確に等しいわけではありません。これにより、各サンプルの個々の値が、母平均よりもサンプル平均 (つまり、そのデータの中心傾向の尺度) に近くなります。期限、

この不一致を修正するために、分母から 1 単位を引いてサンプルの標準偏差を大きくし、母集団の標準偏差に近づけます。

違い 3: ほとんど同じではない

サンプルの標準偏差に対して行うことができる修正に関係なく、それが母集団の標準偏差と等しくなることはめったにありません。これは、母集団内でデータがランダムに変化する可能性があるためです。そのため、サンプルが異なればサンプル標準偏差も異なります。実際、サンプルのサイズに応じて、サンプル標準偏差の可能な値の全体的な分布があります。

相違点 4: サンプル標準偏差は常に知ることができ、決定することができますが、母集団標準偏差は確実に知ることはほとんどありません。

これら 2 つの分散測定値のもう 1 つの重要な違いは、母集団標準偏差 (および実際には母集団パラメーター) がほとんど知られていないことです。これは、場合によっては、技術的または経済的な制限によるものです。これは、非常に高価であり、さらに、母集団のすべてのデータを完全に測定できる可能性が低いためです。それ以外の場合は、母集団が無限であるか、単に母集団を構成するすべての要素にアクセスできないために、母集団パラメーターを決定することが単純に不可能です。

言い換えれば、母集団内のx iのすべてのN値を知ることはほとんどないため、母集団の平均、分散、さらには標準偏差を計算することは不可能です。私たちが知ることができる最善の方法は、標準偏差などのパラメーターの点推定、または標準偏差または他の母集団パラメーターが存在するというある程度の信頼がある範囲内の値の間隔です。

一方、サンプルの場合、すべてのデータがわかっているため、サイズに関係なく、サンプルの標準偏差をいつでも計算できます。

母集団とサンプルの標準偏差の違いの要約

次の表は、前のセクションで説明した母標準偏差とサンプル標準偏差の違いをまとめたものです。

特性 母標準偏差 サンプル標準偏差
シンボル σ はい
に対して計算されます。 人口データ サンプルデータ
それが使用される統計の枝 記述統計 推測統計
メジャーのタイプ パラメータ 統計
方式 母集団のサイズである N で割ります n – 1 で割ります。ここで、n はサンプル サイズです。
変動性 特定の時間に特定の人口に対して固定されています サンプルが同じサイズであり、同じ母集団から抽出されたかどうかに関係なく、サンプルごとに異なります
その価値の確かさ 一般には知られていません。その見積もりの​​みが利用可能です。 サンプルごとに知られている

参考文献

コミュニティ学習センター。(nd)。標準偏差http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

レヴィ サーフィン、R. (sf)。標本と母集団の標準偏差の差は? 声。https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

メイトモバイル。(2021年1月1日)。分散と標準偏差、例と演習https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

モリーナ、M. (2016 年 1 月 27 日)。なぜ1つを惜しまないのですか?人口パラメータの推定。麻酔します。https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

セラ、BR (2020 年 10 月 26 日)。標準偏差または標準偏差。ユニバースフォーミュラ。https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-広告-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

実数は?

確率の公理

円周の計算