Tabla de Contenidos
大規模なデータセットで、平均スコアに対してどの程度の変動があるかを調べるには、平均絶対偏差と標準偏差を使用するのが最適です。標準偏差は、データ セット内の結果の分散の尺度です。データセットの全体的なばらつきを見つけるには、各スコアの平均からの偏差を足すだけです。
スコアの平均偏差は、合計 (データセットの変動の合計) をスコアの数で割ることによって計算できます。絶対偏差と標準偏差は分散の尺度であり、使用される尺度に応じて、平均に対するスコアの変動を推定することを可能にします。
絶対偏差と平均絶対偏差
スコアの平均からの偏差を計算する最も簡単な方法は、各スコアを取得して平均を見つけることです。例として、次の表に示す 100 人の学生のグループの平均スコアを使用します。
この 100 人の学生のグループの平均スコアは、100 点中 58.75 です。100 点中 60 点の学生の例を使用すると、このスコアの平均からの偏差は 1.25 です。この値は、58.78 である平均値から学生のスコアである 60 を引いた結果です。平均を上回るスコアには正の偏差があり、平均を下回るスコアには負の偏差があることに注意することが重要です。
一方、プラスとマイナスの符号がある場合は、これらの偏差をすべて加算すると相殺され、偏差の合計はゼロになります。たとえば、スコアの偏差がどの程度かを知ることに関心が集中しているが、平均がどの範囲内にあるかを知ることに関心がない場合、単純にマイナス記号を省略して、スコアを与える値に注意を向けることができます。絶対偏差。
これらすべての絶対偏差を合計し、スコアの総数で割ると、平均絶対偏差が得られます。したがって、この例の 100 人の学生の平均絶対差は 12.81 です。それを取得するための式は次のとおりです。
どこ:
- MAD = 平均絶対偏差
- ∑ = の合計。
- X= サンプル (この例のスコア)。
- µ=平均
- N = 値の数。
それで:
- DMA = 1281/100
- DMA = 12.81
標準偏差
標準偏差は、データ セット内の結果の分散の尺度です。一般に、この尺度は、測定対象のデータの母集団の変動性を調べるために使用されます。ただし、多くの場合、サンプルからのデータのみが提示されるため、サンプルの標準偏差から母集団の標準偏差を推定できます。これら 2 つの標準偏差、つまりサンプル標準偏差と母集団標準偏差は、異なる方法で計算されます。
標本標準偏差または母集団標準偏差をいつ使用するか?
母集団には必要なすべての値が含まれているため、通常、母集団の標準偏差を知ることに関心があります。したがって、母集団全体がある場合、またはより大きな母集団からのサンプルがあるが、そのサンプルのみに関心があり、結果を母集団全体に一般化したくない場合は、母標準偏差を計算します。
ただし、標準偏差は、母集団を一般化できるサンプルを提供できることから除外されません。したがって、サンプルしかないが、抽出元の母集団の標準偏差について説明したい場合は、サンプルの標準偏差を使用する必要があります。「サンプル」標準偏差という名前は、サンプルを基準とした母集団の標準偏差の推定値としてではなく、サンプル自体の標準偏差として誤って解釈されるため、どの標準偏差を使用するかについてしばしば混乱が生じる可能性があります。
サンプル標準偏差の式は次のとおりです。
どこ:
- s = サンプルの標準偏差。
- ∑ = の合計。
- X = サンプル。
- x¯ = サンプル平均。
- n = サンプル内のスコアの数。
標準偏差を計算する際の考慮事項
まず、標準偏差は分散の尺度であり、平均とともに、連続データを削減するために使用されますが、カテゴリ データは削減されないことに注意してください。同様に、これらの形式のデータ定量化を使用するのは、連続データが典型的な値から外れたり、より高いパーセンテージのバイアスがないことが確実な場合にのみ適切です。
結論として、平均偏差または平均絶対偏差は、標準偏差と同様の方法で計算されますが、絶対値を使用します。これは、データ ポイントとその平均値の間の負の差の問題を回避するために行われます。実際には、絶対値とは、数値の前にある負の符号をすべて削除し、すべての数値を正 (またはゼロ) として扱う必要があることを意味します。
ソース
- Castillo、O.(2009)。応用統計. 飛散対策。
- フラットアイアンスクール。(2015)。分散の測定。
- ロペス、J.(2017)。標準偏差または標準偏差。エコノミペディア.com
- メンディサバル、M (2017)。絶対偏差はどのように計算されますか?