Tabla de Contenidos
¿Qué es la desviación estándar?
La desviación estándar, representada bien sea con la letra griega σ (sigma) o con la letra S, es una medida de la variabilidad de una serie de datos. Más precisamente, representa una medida de las desviaciones promedio de los datos de una muestra o de una población con respecto a la media poblacional, por lo que indica qué tan dispersos están los datos en torno a dicho valor de tendencia central.
Una desviación estándar alta indica que, en promedio, los datos se encuentran muy alejados de la media en ambas direcciones (los datos son muy dispersos), mientras que una desviación estándar pequeña indica todo lo contrario.
La desviación estándar se calcula siempre como la raíz cuadrada de otra medida de la variabilidad, denominada varianza. Existen varias formas de calcular la varianza dependiendo del tipo de datos con los que se cuenta (muestrales o poblacionales), lo que trae como consecuencia que haya más de una forma de calcular la desviación estándar.
En ambos casos se utilizan fórmulas levemente diferentes, las cuales se describen en la siguiente sección. En adelante se describecómo calcular cada una de ellas paso a paso y “a mano”. También se describe cómo usar las calculadoras con funciones estadísticas y hojas de cálculo tipo Excel o Google Sheets para el cálculo de esta importante variable estadística.
Existen dos tipos de desviación estándar
En estadística existen dos clases de medidas descriptivas de una serie de datos, dependiendo de si se cuenta con todos los datos de una población o tan solo los de una muestra. Aquellas medidas que se utilizan para describir a la población se denominan parámetros poblacionales y se suelen representar con letras griegas. Mientras, los parámetros que describen a una muestra se denominan estadísticos y se suelen representar con letras minúsculas.
En vista de esto existen dos tipos de desviación estándar:
- La desviación estándar poblacional, que es un parámetro poblacional que se representa con la letra griega σ (sigma minúscula).
- La desviación estándar muestral, que es un parámetro estadístico que se representa con la letra S.
A continuación se presentan las fórmulas para calcular ambos tipos de desviación estándar.
Fórmulas para calcular la desviación estándar poblacional σ
En estas ecuaciones xi representa el valor de cada dato individual, μ es la media poblacional y n es el número total de datos en la población.
Fórmulas para calcular la desviación estándar muestral S
En estas ecuaciones xi representa el valor de cada dato individual de la muestra, ¯x es la media muestral y n es el número total de datos en la muestra.
La única diferencia real en la forma de calcular ambas desviaciones estándar es que en un caso se divide entre n, mientras que en el otro se divide entre n – 1. Esto último es para corregir la diferencia entre la media muestral y la media poblacional, las cuales no suelen ser iguales.
¿Cuál fórmula se debe utilizar?
Lo único que se debe considerar para saber cuál de las fórmulas utilizar es si los datos a los que se les calculará la desviación estándar representan todos los datos de una población o si representan solo una muestra. Esto suele ser evidente a partir del enunciado (en caso de que se esté resolviendo un problema de estadística) o de la forma como se obtuvieron los datos.
TIP: En caso de duda, es más seguro asumir que se trata de una muestra, ya que rara vez se cuenta con todos los datos de una población.
En cuanto a utilizar la primera (la de la izquierda) o la segunda (la de la derecha) fórmula para σ o para S, en ambos casos las dos ecuaciones mostradas dan el mismo resultado. Sin embargo, resulta más práctico utilizar la fórmula de la derecha, a pesar de que pueda parecer más complicada. La razón es muy sencilla: se requieren menos pasos para calcular la desviación estándar con las fórmulas de la derecha que con las de la izquierda.
Cómo calcular la desviación estándar «a mano»
A continuación presentamos los pasos que se deben llevar a cabo para calcular la desviación estándar, utilizando un ejemplo para ilustrar el proceso.
Problema
Se determinó el tiempo que una muestra de 15 automóviles tardó en llenar el tanque de combustible en una estación de servicio. Los datos, medidos en segundos, se presentan a continuación:
71 | 65 | 48 | 76 | 80 |
64 | 42 | 55 | 80 | 66 |
53 | 49 | 70 | 67 | 42 |
Determine la desviación estándar.
Solución: en este caso, el enunciado especifica que los datos corresponden a una muestral, por lo que la ecuación que utilizaremos para determinar la desviación estándar (muestral) será:
Para aplicar esta fórmula, solo necesitamos calcular la sumatoria de los datos (∑Xi), la sumatoria de los cuadrados de los datos (∑Xi2) y el número total de datos (n). Esto se logra fácilmente por medio de los siguientes pasos:
Paso 1: Organizar los datos en forma vertical
Calcular la desviación estándar es más fácil si se tienen los datos organizados en una lista vertical, ya que facilita los pasos siguientes. No es estrictamente necesario, pero también ayuda tener cada dato identificado con un número, ya que proporciona fácilmente el número total de datos (n) el cual es necesario para el uso de la fórmula. No es necesario que los datos estén ordenados de ninguna manera.
# | Xi | Xi2 |
1 | 71 | |
2 | 65 | |
3 | 48 | |
4 | 76 | |
5 | 80 | |
6 | 64 | |
7 | 42 | |
8 | 55 | |
9 | 80 | |
10 | 66 | |
11 | 53 | |
12 | 49 | |
13 | 70 | |
14 | 67 | |
15 | 42 |
Paso 2: calcular el cuadrado de cada dato
El siguiente paso consiste en elevar cada dato individual al cuadrado para luego anotar el resultado en una columna a su lado.
# | Xi | Xi2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
11 | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
15 | 42 | 1764 |
Paso 3: sumar todos los datos originales
Sumamos todos los valores que aparecen en la columna que identificamos como Xi y anotamos el resultado al final de dicha columna.
Paso 4: sumar todos los cuadrados de los datos y anotar el resultado al final de la columna
Sumamos todos los valores que aparecen en la columna que identificamos como Xi2 y anotamos el resultado al final de dicha columna. Tras llevar a cabo los pasos 3 y 4, la tabla se verá así:
# | Xi | Xi2 |
1 | 71 | 5041 |
2 | 65 | 4225 |
3 | 48 | 2304 |
4 | 76 | 5776 |
5 | 80 | 6400 |
6 | 64 | 4096 |
7 | 42 | 1764 |
8 | 55 | 3025 |
9 | 80 | 6400 |
10 | 66 | 4356 |
11 | 53 | 2809 |
12 | 49 | 2401 |
13 | 70 | 4900 |
14 | 67 | 4489 |
15 | 42 | 1764 |
Número de datos (n) | Sumatoria de datos (∑Xi) | Sumatoria de cuadrados (∑Xi2) |
15 | 928 | 59750 |
Paso 5: Aplicar la fórmula de desviación estándar
El último paso consiste simplemente en reemplazar los valores al final de la tabla en la fórmula respectiva:
Cómo calcular la desviación estándar con calculadora estadística
La mayoría de calculadoras científicas y financieras tienen funciones especiales para facilitar el cálculo de todas las medidas de tendencia central y de dispersión que se utilizan en estadística. El procedimiento, sin importar el modelo de la calculadora, siempre es el mismo:
Paso 1: ingresar al modo de estadística
Las calculadoras normalmente tienen un modo especial para las funciones estadísticas. Generalmente se accede presionando el botón MODE seguido de un número que suele aparecer en pantalla al lado de STAT, SD (de standard deviation) o algo similar.
Paso 2: limpiar la memoria
En las calculadoras más viejas no aparece en pantalla si ya hay datos almacenados o no en la memoria de la misma, por lo que siempre es buena idea borrar la memoria antes de comenzar. Para esto, presiona la tecla CLR o MCL y luego selecciona la opción de MODE (esto borrará solo la información almacenada en el modo de estadística). En muchos casos hace falta volver a ingresar al modo estadística después de este paso.
Paso 3: ingresar todos los datos
Se introducen secuencialmente todos los datos, uno por uno, presionando la tecla DT, DATA o similar entre uno y otro.
Paso 4: obtener el resultado
El último paso consiste simplemente en pedirle a la calculadora la desviación estándar. El lugar en el que se encuentran los resultados varía mucho entre los modelos y marcas de calculadoras. En algunas hay que presionar la tecla SHIFT seguida de la tecla que encima diga S-VAR, en otras es diferente. Se aconseja referirse al manual de la calculadora.
Una vez conseguimos el menú adecuado, debemos seleccionar cuál de las dos desviaciones estándar necesitamos. Si se trata de datos poblacionales, seleccionamos la opción que diga σ o σ(n). Si se trata de datos muestrales, seleccionamos la opción que diga σ(n-1) o S.
Cómo calcular la desviación estándar en Microsoft® Excel™
La forma más sencilla para calcular la desviación estándar es por medio de hojas de cálculo como Excel o Google Sheets. Estos programas ya tienen todos los protocolos para calcular las distintas variables estadísticas que podamos necesitar. Esto se hace en dos simples pasos:
Paso 1: pegar o añadir los datos
Esto es tan sencillo como copiar los datos directamente, uno por uno en celdas separadas (en forma de columnas, filas o matrices, no importa cómo). En el caso de nuestro ejemplo:
PASO 2: Escribir la fórmula para la desviación estándar que necesitamos
Esto depende de la hoja de cálculo que se esté utilizando y del idioma en el que esté configurada. En el caso de Microsoft® Excel™, versión en español, las fórmulas para la desviación estándar son:
Desviación Estándar Muestral (S): | =DESVEST.M(dato 1; dato 2;…;dato n) |
Desviación Estándar Poblacional (σ): | =DESVEST.P(dato 1; dato 2;…;dato n) |
No es necesario introducir los datos individuales, sino simplemente seleccionar las celdas en las que ya se han pegado los datos. En nuestro ejemplo, los datos se encentran en el rango que va desde la celda B1 hasta la celda F3, lo que se escribe como B2:F3.
Finalmente, se presiona la tecla ENTER y ¡LISTO! Se obtiene la desviación estándar.
Referencias
- Bhandari, P. (2021, 21 enero). Understanding and calculating standard deviation. Recuperado de https://www.scribbr.com/statistics/standard-deviation/
- Espinoza, C. I., & Echecopar, A. L. (2020). Aplicaciones Estadísticas usando MS Excel con ejemplos paso a paso (Spanish Edition) (1.a ed.). Lima, Perú: Luis Felipe Arizmendi Echecopar y Duo Negocios SAC.
- Webster, A. (2001). Estadística Aplicada a Los Negocios y La Economia (Spanish Edition). Toronto, Canada: Irwin Professional Publishing.
- DESVESTA (función DESVESTA). Soporte de Microsoft Office. Recuperado de https://support.microsoft.com/es-es/office/desvesta-funci%C3%B3n-desvesta-5ff38888-7ea5-48de-9a6d-11ed73b29e9d.