Aprende a calcular la desviación estándar

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.
Aprende lo que quieras. Hay miles de cursos populares entre los que elegir.

¿Qué es la desviación estándar?

La desviación estándar, representada bien sea con la letra griega σ (sigma) o con la letra S, es una medida de la variabilidad de una serie de datos. Más precisamente, representa una medida de las desviaciones promedio de los datos de una muestra o de una población con respecto a la media poblacional, por lo que indica qué tan dispersos están los datos en torno a dicho valor de tendencia central.

Una desviación estándar alta indica que, en promedio, los datos se encuentran muy alejados de la media en ambas direcciones (los datos son muy dispersos), mientras que una desviación estándar pequeña indica todo lo contrario.

La desviación estándar se calcula siempre como la raíz cuadrada de otra medida de la variabilidad, denominada varianza. Existen varias formas de calcular la varianza dependiendo del tipo de datos con los que se cuenta (muestrales o poblacionales), lo que trae como consecuencia que haya más de una forma de calcular la desviación estándar.

En ambos casos se utilizan fórmulas levemente diferentes, las cuales se describen en la siguiente sección. En adelante se describecómo calcular cada una de ellas paso a paso y “a mano”. También se describe cómo usar las calculadoras con funciones estadísticas y hojas de cálculo tipo Excel o Google Sheets para el cálculo de esta importante variable estadística.

Existen dos tipos de desviación estándar

En estadística existen dos clases de medidas descriptivas de una serie de datos, dependiendo de si se cuenta con todos los datos de una población o tan solo los de una muestra. Aquellas medidas que se utilizan para describir a la población se denominan parámetros poblacionales y se suelen representar con letras griegas. Mientras, los parámetros que describen a una muestra se denominan estadísticos y se suelen representar con letras minúsculas.

En vista de esto existen dos tipos de desviación estándar:

  • La desviación estándar poblacional, que es un parámetro poblacional que se representa con la letra griega σ (sigma minúscula).
  • La desviación estándar muestral, que es un parámetro estadístico que se representa con la letra S.

A continuación se presentan las fórmulas para calcular ambos tipos de desviación estándar.

Fórmulas para calcular la desviación estándar poblacional σ

Fórmula para calcular la desviación estándar poblacional

En estas ecuaciones xi representa el valor de cada dato individual, μ es la media poblacional y n es el número total de datos en la población.

Fórmulas para calcular la desviación estándar muestral S

Fórmula para calcular la desviación estándar muestral

En estas ecuaciones xi representa el valor de cada dato individual de la muestra, ¯x es la media muestral y n es el número total de datos en la muestra.

La única diferencia real en la forma de calcular ambas desviaciones estándar es que en un caso se divide entre n, mientras que en el otro se divide entre n – 1. Esto último es para corregir la diferencia entre la media muestral y la media poblacional, las cuales no suelen ser iguales.

¿Cuál fórmula se debe utilizar?

Lo único que se debe considerar para saber cuál de las fórmulas utilizar es si los datos a los que se les calculará la desviación estándar representan todos los datos de una población o si representan solo una muestra. Esto suele ser evidente a partir del enunciado (en caso de que se esté resolviendo un problema de estadística) o de la forma como se obtuvieron los datos.

TIP: En caso de duda, es más seguro asumir que se trata de una muestra, ya que rara vez se cuenta con todos los datos de una población.

En cuanto a utilizar la primera (la de la izquierda) o la segunda (la de la derecha) fórmula para σ o para S, en ambos casos las dos ecuaciones mostradas dan el mismo resultado. Sin embargo, resulta más práctico utilizar la fórmula de la derecha, a pesar de que pueda parecer más complicada. La razón es muy sencilla: se requieren menos pasos para calcular la desviación estándar con las fórmulas de la derecha que con las de la izquierda.

Cómo calcular la desviación estándar “a mano”

A continuación presentamos los pasos que se deben llevar a cabo para calcular la desviación estándar, utilizando un ejemplo para ilustrar el proceso.

Problema

Se determinó el tiempo que una muestra de 15 automóviles tardó en llenar el tanque de combustible en una estación de servicio. Los datos, medidos en segundos, se presentan a continuación:

7165487680
6442558066
5349706742

Determine la desviación estándar.

Solución: en este caso, el enunciado especifica que los datos corresponden a una muestral, por lo que la ecuación que utilizaremos para determinar la desviación estándar (muestral) será:

Ejemplo del uno de fórmula para calcular la desviación estándar muesrtal

Para aplicar esta fórmula, solo necesitamos calcular la sumatoria de los datos (∑Xi), la sumatoria de los cuadrados de los datos (∑Xi2) y el número total de datos (n). Esto se logra fácilmente por medio de los siguientes pasos:

Paso 1: Organizar los datos en forma vertical

Calcular la desviación estándar es más fácil si se tienen los datos organizados en una lista vertical, ya que facilita los pasos siguientes. No es estrictamente necesario, pero también ayuda tener cada dato identificado con un número, ya que proporciona fácilmente el número total de datos (n) el cual es necesario para el uso de la fórmula. No es necesario que los datos estén ordenados de ninguna manera.

#XiXi2
171 
265 
348 
476 
580 
664 
742 
855 
980 
1066 
1153 
1249 
1370 
1467 
1542 

Paso 2: calcular el cuadrado de cada dato

El siguiente paso consiste en elevar cada dato individual al cuadrado para luego anotar el resultado en una columna a su lado.

#XiXi2
1715041
2654225
3482304
4765776
5806400
6644096
7421764
8553025
9806400
10664356
11532809
12492401
13704900
14674489
15421764

Paso 3: sumar todos los datos originales

Sumamos todos los valores que aparecen en la columna que identificamos como Xi y anotamos el resultado al final de dicha columna.

Paso 4: sumar todos los cuadrados de los datos y anotar el resultado al final de la columna

Sumamos todos los valores que aparecen en la columna que identificamos como Xi2 y anotamos el resultado al final de dicha columna. Tras llevar a cabo los pasos 3 y 4, la tabla se verá así:

#XiXi2
1715041
2654225
3482304
4765776
5806400
6644096
7421764
8553025
9806400
10664356
11532809
12492401
13704900
14674489
15421764
Número de datos (n)Sumatoria de datos (∑Xi)Sumatoria de cuadrados (∑Xi2)
1592859750

Paso 5: Aplicar la fórmula de desviación estándar

El último paso consiste simplemente en reemplazar los valores al final de la tabla en la fórmula respectiva:

Sustitución de valores en la fórmula para calcular la desviación estándar
Resultado del cálculo de la desviación estándar a mano

Cómo calcular la desviación estándar con calculadora estadística

La mayoría de calculadoras científicas y financieras tienen funciones especiales para facilitar el cálculo de todas las medidas de tendencia central y de dispersión que se utilizan en estadística. El procedimiento, sin importar el modelo de la calculadora, siempre es el mismo:

Paso 1: ingresar al modo de estadística

Las calculadoras normalmente tienen un modo especial para las funciones estadísticas. Generalmente se accede presionando el botón MODE seguido de un número que suele aparecer en pantalla al lado de STAT, SD (de standard deviation) o algo similar.

Paso 2: limpiar la memoria

En las calculadoras más viejas no aparece en pantalla si ya hay datos almacenados o no en la memoria de la misma, por lo que siempre es buena idea borrar la memoria antes de comenzar. Para esto, presiona la tecla CLR o MCL y luego selecciona la opción de MODE (esto borrará solo la información almacenada en el modo de estadística). En muchos casos hace falta volver a ingresar al modo estadística después de este paso.

Paso 3: ingresar todos los datos

Se introducen secuencialmente todos los datos, uno por uno, presionando la tecla DT, DATA o similar entre uno y otro.

Paso 4: obtener el resultado

El último paso consiste simplemente en pedirle a la calculadora la desviación estándar. El lugar en el que se encuentran los resultados varía mucho entre los modelos y marcas de calculadoras. En algunas hay que presionar la tecla SHIFT seguida de la tecla que encima diga S-VAR, en otras es diferente. Se aconseja referirse al manual de la calculadora.

Una vez conseguimos el menú adecuado, debemos seleccionar cuál de las dos desviaciones estándar necesitamos. Si se trata de datos poblacionales, seleccionamos la opción que diga σ o σ(n). Si se trata de datos muestrales, seleccionamos la opción que diga σ(n-1) o S.

Cómo calcular la desviación estándar en Microsoft® Excel™

La forma más sencilla para calcular la desviación estándar es por medio de hojas de cálculo como Excel o Google Sheets. Estos programas ya tienen todos los protocolos para calcular las distintas variables estadísticas que podamos necesitar. Esto se hace en dos simples pasos:

Paso 1: pegar o añadir los datos

Esto es tan sencillo como copiar los datos directamente, uno por uno en celdas separadas (en forma de columnas, filas o matrices, no importa cómo). En el caso de nuestro ejemplo:

Como calcular la desviación estándar en hojas de cálculo como Excel

PASO 2: Escribir la fórmula para la desviación estándar que necesitamos

Esto depende de la hoja de cálculo que se esté utilizando y del idioma en el que esté configurada. En el caso de Microsoft® Excel™, versión en español, las fórmulas para la desviación estándar son:

Desviación Estándar Muestral (S):=DESVEST.M(dato 1; dato 2;…;dato n)
Desviación Estándar Poblacional (σ):=DESVEST.P(dato 1; dato 2;…;dato n)

No es necesario introducir los datos individuales, sino simplemente seleccionar las celdas en las que ya se han pegado los datos. En nuestro ejemplo, los datos se encentran en el rango que va desde la celda B1 hasta la celda F3, lo que se escribe como B2:F3.

Como calcular la desviación estándar en hojas de cálculo como Excel - Paso 2

Finalmente, se presiona la tecla ENTER y ¡LISTO! Se obtiene la desviación estándar.

Referencias

  • Espinoza, C. I., & Echecopar, A. L. (2020). Aplicaciones Estadísticas usando MS Excel con ejemplos paso a paso (Spanish Edition) (1.a ed.). Lima, Perú: Luis Felipe Arizmendi Echecopar y Duo Negocios SAC.
mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

Qué es el bórax