Diferencia entre las desviaciones estándar de una muestra y una población

- Advertisement -

En el cálculo de la desviación estándar hay que contemplar dos situaciones: la desviación estándar de una población o de un conjunto de valores, y la desviación estándar de una muestra.

Recordemos, antes de avanzar en las dos definiciones, que la desviación estándar σ es un parámetro que permite evaluar la dispersión de un conjunto de valores. Si se calcula el promedio de un conjunto de valores, la desviación estándar evalúa la diferencia de los valores del conjunto respecto del promedio. Y el promedio de un conjunto de valores n se define como la suma de todos ellos dividido la cantidad de valores n. La fórmula general que se utiliza para calcular la desviación estándar σ se muestra a continuación; consiste en restar de cada valor del conjunto que analizamos, que notamos con el subíndice i, el promedio de todos los valores; elevamos al cuadrado cada una de estas diferencias y las sumamos; dividimos el resultado entre el número de valores del conjunto menos 1, y calculamos la raíz cuadrada de éste valor.

Desviación estándar σ de una muestra.
Desviación estándar σ de una muestra.

Si bien ambas definiciones de desviación estándar evalúan la variabilidad, hay diferencias conceptuales entre hacer el cálculo sobre una población y sobre una muestra. La diferencia tiene que ver con la distinción entre una variable estadística y un parámetro matemático. Si se recopilan datos de todos los miembros de una población o se estudia un conjunto de datos definido, se trata del cálculo de la desviación estándar de una población. Si se analizan datos que representan una muestra de una población mayor, se trata del cálculo de la desviación estándar de una muestra. La figura siguiente ilustra gráficamente la diferencia. La desviación estándar de una población es un parámetro matemático con un valor definido; la desviación estándar de una muestra es un parámetro estadístico que evalúa un grupo de datos cuyo resultado se proyecta en un conjunto mayor. Esta evaluación depende de la muestra, no es un valor definido, como lo es en el caso de una población.

Población y muestra.
Población y muestra.

Cualitativamente la diferencia en la definición implica un cálculo levemente diferente; en el caso de la desviación estándar de una muestra se divide la diferencia entre cada valor y el promedio al cuadrado entre número de valores menos 1 (n – 1), como muestra la fórmula anterior. En el caso de la desviación estándar de una población se divide entre n.

Ejemplo

Veamos un ejemplo para fijar ideas. Tomemos un conjunto de valores y calculemos la desviación estándar de acuerdo a las dos definiciones. El grupo es el siguiente, y contiene 5 valores (n = 5), que son los siguientes:

1, 2, 4, 5, 8

El promedio de estos valores tiene la siguiente expresión

(1 + 2 + 4 + 5 + 8)/5 = 20/5 = 4

Las diferencias de cada valor y el promedio elevadas al cuadrado se representan con la siguiente secuencia

(1 – 4)2 = 9

(2 – 4)2 = 4

(4 – 4)2 = 0

(5 – 4)2 = 1

(8 – 4)2 = 16

La suma de los cinco valores es 30.

En el caso del cálculo de la desviación estándar de la población hay que dividir este valor entre n, 5 en este ejemplo y el resultado es 6. En el caso de la desviación estándar de la muestra hay que dividir entre n – 1; 4 en este caso y el resultado es 7.5. Para completar el cálculo debemos obtener la raíz cuadrada; aproximadamente 2.4495 si se tratase de una población, y aproximadamente 2.7386 si se tratase de una muestra.

Fuente

Yadolah Dodge. The Concise Encyclopaedia of Statistics. New York: Springer, 2010.

Artículos relacionados