Grados de libertad en estadística y matemáticas

El concepto de los grados de libertad surge con frecuencia tanto en matemáticas como en estadística. Dependiendo del área del que se trate, el concepto varía considerablemente.

El concepto intuitivo de los grados de libertad

Intuitivamente, el número de grados de libertad se refiere al número de elecciones libres que podemos hacer en determinada situación. Por ejemplo, supongamos que un grupo de cinco personas deben elegir entre 5 frutas diferentes. La primera persona es libre de elegir cualquiera de las frutas. La siguiente, puede elegir libremente entre las cuatro frutas restantes, y así sucesivamente. Al llegar a la última persona, debido a que tan solo había 5 frutas al inicio, esta persona está obligada a escoger la última fruta, lo que quiere decir que, en realidad, la última persona no tuvo libertad de elección, mientras que los otros sí.

En este caso, decimos que hubo cuatro grados de libertad, ya que tras seleccionar las primeras cuatro frutas, la fruta de la quinta persona quedó determinada automáticamente.

Cabe resaltar que la razón por la que las cinco personas no tuvieron la opción de escoger su fruta de manera libre se debe a que para empezar solo había cinco frutas. Si le hubiéramos dicho a las cinco personas que escogieran cada una la fruta que más les gustara, sin especificarles ninguna opción, entonces todas las cinco personas hubieran tenido la libertad de elección. Esto demuestra que el hecho de que hubiese solo cinco frutas representó una restricción que redujo los grados de libertad de elección.

Los grados de libertad en las matemáticas

Matemáticamente, los grados de libertad se definen como el número de dimensiones del dominio de un vector aleatorio. Esto significa que son el número de componentes de un vector aleatorio cuyos valores debemos especificar para conocer al vector completamente.

Para entender mejor este concepto, analicémoslo desde el punto de vista geométrico. Podemos definir un vector aleatorio como aquel que está formado por un conjunto de variables aleatorias escalares. Cada una de estas variables aleatorias representa una de las componentes del vector en una dimensión. Es decir que el número de tales variables o componentes (n) define un espacio n-dimensional dentro del cual se puede mover libremente el vector aleatorio, por lo que decimos que el vector tiene n grados de libertad.

Por ejemplo, si el vector está formado por una sola variable aleatoria, entonces este vector solo puede variar libremente a lo largo de una sola dimensión. Como consecuencia de esto, para definir un vector particular, solo hace falta elegir el valor de esa única variable aleatoria, por lo que decimos que existe un solo grado de libertad.

En cambio, si un vector está formado por dos componentes, podrá representarse en un espacio bidimensional, es decir, en un plano. Decimos que este vector se puede mover libremente a lo largo de dos dimensiones en función de los valores particulares que asuman estas dos variables aleatorias, por lo que decimos que tiene dos grados de libertad.

El mismo razonamiento sirve para un vector aleatorio con 3, 4 o más componentes.

Un ejemplo típico de un vector aleatorio empleado con frecuencia en estadística es una muestra de tamaño n. En este caso, cada uno de los n elementos de la muestra es una variable aleatoria, y todos los n valores conforman el vector aleatorio correspondiente a la muestra. Cada vez que elegimos una muestra nueva, podemos obtener un vector nuevo, y no hay nada que nos prohíba elegir libre e independientemente cada uno de los datos que conforma la muestra.

Las restricciones de grados de libertad

De lo explicado en los párrafos anteriores se desprende que cualquier vector aleatorio de n dimensiones (es decir, formado por n componentes independientes) tendrá n grados de libertad, ya que cualquiera de las n componentes puede tener cualquier valor, es decir, no hay nada que restrinja la elección de cada una de las n variables aleatorias.

Sin embargo, si las variables no son independientes entre sí, sino que están relacionadas por medio de alguna ecuación matemática, entonces el número de grados de libertad disminuye, ya que habrá variables cuyo valor quede completamente determinado, una vez se elijan o especifiquen los valores de las demás variables.

Estas relaciones entre las variables aleatorias que conforman al vector es lo que conocemos como restricciones o condiciones, y son el equivalente matemático a la condición de “solo haber cinco frutas” de nuestra explicación intuitiva de los grados de libertad.

Ejemplo:

Supongamos que tenemos un vector aleatorio formado por las tres variables aleatorias x, y y z. En un principio, este sistema posee tres grados de libertad, ya que debemos elegir los valores de las tres variables para poder especificar completamente un vector particular.

Sin embargo, supongamos ahora que, por alguna razón, estas variables deben cumplir con la condición de que su suma sea igual a 5. Esta condición restringe nuestra elección de los valores particulares de cada variable, ya que, tras elegir libremente las primeras dos (x e y, x y z ó y y z) la tercera queda determinada por la ecuación x + y + z = 5

Por ejemplo, si elegimos x = 10 y y = 5, la variable z no puede asumir cualquier valor, sino que necesariamente debe valer – 10 para poder cumplir con la condición mencionada.

Si incluimos más restricciones o más relaciones independientes entre las variables, podemos reducir aún más el número de grados de libertad, incluso pudiendo llevarlo hasta cero.

Los grados de libertad en estadística

Aclarada la forma de ver a los grados de libertad en matemáticas, será mucho más fácil comprender los grados de libertad en el campo de la estadística, que es donde encuentran la mayor parte de su utilidad.

Los grados de libertad se utilizan para llevar a cabo el cálculo de estadísticas, así como para definir distribuciones de probabilidad tales como la distribución t-student o la distribución chi cuadrado.

En estos contextos, los grados de libertad consisten en el número de variables que debemos especificar para poder determinar el valor de alguna variable estadística tal como la media muestral, la varianza, la desviación estándar muestral, etc.

Por ejemplo, en el cálculo de la media muestral de una muestra de tamaño n, necesitamos conocer todos los valores de los n elementos de la muestra. La media se calcula por medio de la siguiente expresión:

Qué son los grados de libertad

Sin embargo, una vez calculada la media muestral, que calcula la media poblacional, esta se puede utilizar para calcular otras variables estadísticas tales como la varianza y la desviación estándar muestrales. En estos casos, en vista de que la media y los valores individuales de los elementos de la muestra están relacionados por medio de la ecuación anterior, lo que representa una restricción, se cumple que toda cantidad calculada a partir de la media tendrá n-1 grados de libertad:

Qué son los grados de libertad

Referencias

De la Cruz-Oré, J. L. (2013). ¿Qué significan los grados de libertad? Revista Peruana de Epidemiología, 17(2), 1–6. https://www.redalyc.org/pdf/2031/203129458002.pdf

DeVore, J. (2002). Probabilidad y Estadistica Para Ingenieria y Ciencias (5th ed.). Thomson International.

Grados de libertad. (2012, November 18). Enciclopedia Financiera. http://www.enciclopediafinanciera.com/definicion-grados-de-libertad.html

Minitab Blog Editor. (2019, April 18). ¿Qué son los Grados de Libertad en Estadística? Minitab Blog. https://blog.minitab.com/es/que-son-los-grados-de-libertad-en-estadistica

Pacheco, J. (2019, October 15). Grados De Libertad En Estadística (Qué Son Y Cómo Se Aplican) | 2021. Web y Empresas. https://www.webyempresas.com/grados-de-libertad-en-estadistica/

Artículos relacionados