Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Antes de la disponibilidad de los ordenadores personales, y mucho antes de la existencia de los teléfonos inteligentes, los cálculos numéricos de algunas funciones matemáticas se debían hacer a mano, lo que resultaba muy complejo. Sin embargo, los resultados de estos cálculos también eran de gran importancia en distintas aplicaciones como, por ejemplo, en estadística. La solución a este problema fue que algunos matemáticos se dedicaron a llevar a cabo los cálculos y a organizarlos en tablas para utilizarlos como referencia cuando los resultados fueran necesarios.

Algunos ejemplos de ellas son las tablas de funciones trigonométricas (senos, cosenos y tangentes, por ejemplo), las tablas logarítmicas y las tablas estadísticas, de las cuales la tabla chi cuadrado forma parte. A pesar de que hoy en día disponemos de programas de cálculo avanzado como Excel, Google Sheets, Mathematica, Minitab y R, entre otros, que permiten llevar a cabo todos los cálculos en cuestión de segundos, el uso de las tablas estadísticas sigue siendo necesario, en particular para comprender mejor qué es lo que están haciendo estos programas.

En virtud de lo anterior, a continuación exploraremos cómo se utilizan las tablas chi cuadrado para hallar los valores críticos de esta distribución, dados los grados de libertad y un nivel de significancia.

¿Qué es la distribución chi cuadrada (χν²)?

La distribución chi cuadrada (proveniente de la letra griega chi, χ, elevada al cuadrado, es decir χ²) es la distribución estadística de la probabilidad que posee la suma de los cuadrados de dos variables aleatorias normales (que siguen una distribución normal estándar) y que son independientes entre sí.

Es decir, es la distribución que posee la variable aleatoria X definida como:

Definición de variable aleatoria de la distribución chi cuadrado, ji cuadrado o χ2

Donde la sumatoria se hace sobre ν variables independientes Zi que siguen una distribución estándar normal (es decir, dado que Z ̴ N(0,1)). Al número de variables independientes, ν, que integran a X se le denomina el número de grados de libertad de X.

En 1900, Pearson demostró matemáticamente que esta variable aleatoria sigue la una distribución de probabilidad definida por la siguiente función de densidad de probabilidad:

Distribución de probabilidad de la distribución chi cuadrado, ji cuadrado o χ2

Donde ν son los grados de libertad, Γ es la función de distribución Gamma y e es la constante de Euler.

Dependiendo del número de grados de libertad, esta curva de distribución puede tener distintas formas:

Distribución chi cuadrado; densidad de probabilidad para distintos grados de libertad k.
Distintas formas de la densidad de probabilidad para la distribución chi cuadrado con distintos grados de libertad k.

En la gran mayoría de los casos prácticos, se poseen más de dos grados de libertad, y en ellos la gráfica de esta curva de distribución siempre parte de 0, aumenta rápidamente y luego decae lentamente, presentando una cola infinitamente larga hacia la derecha:

Forma de la densidad de probabilidad de la distribución chi cuadrado para distintos grados de libertad >2.

A veces también llamada distribución ji cuadrada o distribución de Pearson (en honor a su inventor), se trata de un caso especial de la distribución gamma que se utiliza con mucha frecuencia en estadística inferencial para llevar a cabo pruebas estadísticas de significancia y para establecer intervalos de confianza.

¿Qué es un valor crítico en estadística?

Los valores críticos son valores particulares de una variable aleatoria que dejan un área determinada de la curva de probabilidad por encima o por debajo del mismo. Por ejemplo, un valor crítico podría representar el valor de la variable aleatoria X que deja el 5% del área de la curva de densidad de probabilidad por encima o, lo que es lo mismo, que deja el 95% del área por debajo de dicho valor.

Esto quiere decir que, para definir un valor crítico, necesariamente debemos conocer completamente la función de densidad de la probabilidad de la variable aleatoria (es decir, debemos conocer su distribución de probabilidad) y debemos definir un valor de probabilidad que nos interese.

Por ejemplo, podemos definir como valor crítico de la variable aleatoria X, el valor particular xc tal que la probabilidad de que X< xc sea igual a un valor de probabilidad p. Es decir que, en este caso, el valor crítico xc para la probabilidad p sería aquel que satisfaga la expresión:

Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

Esto también se suele escribir en términos de la probabilidad de que X >  xc. A esta probabilidad, que es el complemento de p, se le representa con la letra griega α y en algunas aplicaciones se le denomina nivel de significancia. Al ser el complemento de p, se cumple que α = 1 – p.

Desde el punto de vista matemático, los valores críticos se suelen definir en términos de la función de distribución de probabilidad acumulada (F(X)), ya que esta representa el área bajo la curva de densidad de probabilidad. En términos generales, un valor crítico xc es aquel que cumple:

Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

O, en términos de la significancia, es aquel que cumple que:

Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

Dependiendo de la distribución de la variable aleatoria, el límite inferior puede que sea 0 o que no tenga límite inferior (como en la ecuación mostrada antes).

¿Por qué se le llama valor crítico?

Se denomina valor crítico, ya que este valor lo solemos utilizar como un límite para determinar si un estadístico de prueba cae dentro o fuera de la región de aceptación durante una prueba de hipótesis, o para determinar los límites de un intervalo de confianza.

Valor crítico de una distribución chi cuadrada

En base a las definiciones anteriores, podemos ahora definir el valor crítico de una variable aleatoria que sigue una distribución chi cuadrada con ν grados de libertad, como el valor (xc) de dicha variable que satisface la siguiente ecuación:

Determinación de valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

Esto se puede ver de manera más sencilla por medio de la siguiente gráfica:

Valores críticos con una tabla chi cuadrado, ji cuadrado o χ2

Como se pue observar en esta imagen, el valor crítico corresponde al valor sobre el eje x (que representa los posibles valores de la variable aleatocia X) que divide el área bajo la curva en dos partes: el ára azul, que representa la probabilidad de que X < xc, y el área rosa, que representa la probabilidad de uqe X > xc o, lo que es lo mismo, 1 –  P(X < xc).

¿Qué es una tabla chi cuadrado y para qué sirve?

Como podemos ver de su definición matemática, calcular el valor crítico implica integrar una función muy compleja y luego despejar el valor de xc. Esto resulta excesivamente complejo de resolver desde el punto de vista analítico (casi imposible, de hecho). Por lo tanto, en lugar de esto, lo que se hace es utilizar métodos numéricos de integración y de resolución de ecuaciones que permiten determinar uno a uno los valores de x que producen los distintos valores de probabilidad acumulada.

Las tablas chi cuadrado corresponden a una colección de estos valores para distintas funciones de distribución chi cuadrada (las cuales se definen por sus grados de libertad) y para distintos valores de p, de α o de ambos.

A continuación, se presenta un ejemplo de una tabla típica de valores críticos para una distribución chi cuadrada, para los valores más comúnmente utilizados en pruebas estadísticas de una cola, de dos colas y para establecer intervalos de confianza.

P 0,0050,010,0250,050,10,900,950,9750,990,995
α →0,9950,990,9750,950,900,100,050,0250,010,005
ν          
10,0000,0000,0010,0040,0162,7063,8415,0246,6357,879
20,0100,0200,0510,1030,2114,6055,9917,3789,21010,597
30,0720,1150,2160,3520,5846,2517,8159,34811,34512,838
40,2070,2970,4840,7111,0647,7799,48811,14313,27714,860
50,4120,5540,8311,1451,6109,23611,07012,83315,08616,750
60,6760,8721,2371,6352,20410,64512,59214,44916,81218,548
70,9891,2391,6902,1672,83312,01714,06716,01318,47520,278
81,3441,6462,1802,7333,49013,36215,50717,53520,09021,955
91,7352,0882,7003,3254,16814,68416,91919,02321,66623,589
102,1562,5583,2473,9404,86515,98718,30720,48323,20925,188
112,6033,0533,8164,5755,57817,27519,67521,92024,72526,757
123,0743,5714,4045,2266,30418,54921,02623,33726,21728,300
133,5654,1075,0095,8927,04219,81222,36224,73627,68829,819
144,0754,6605,6296,5717,79021,06423,68526,11929,14131,319
154,6015,2296,2627,2618,54722,30724,99627,48830,57832,801
165,1425,8126,9087,9629,31223,54226,29628,84532,00034,267
175,6976,4087,5648,67210,08524,76927,58730,19133,40935,718
186,2657,0158,2319,39010,86525,98928,86931,52634,80537,156
196,8447,6338,90710,11711,65127,20430,14432,85236,19138,582
207,4348,2609,59110,85112,44328,41231,41034,17037,56639,997
218,0348,89710,28311,59113,24029,61532,67135,47938,93241,401
228,6439,54210,98212,33814,04130,81333,92436,78140,28942,796
239,26010,19611,68913,09114,84832,00735,17238,07641,63844,181
249,88610,85612,40113,84815,65933,19636,41539,36442,98045,559
2510,52011,52413,12014,61116,47334,38237,65240,64644,31446,928
2611,16012,19813,84415,37917,29235,56338,88541,92345,64248,290
2711,80812,87914,57316,15118,11436,74140,11343,19546,96349,645
2812,46113,56515,30816,92818,93937,91641,33744,46148,27850,993
2913,12114,25616,04717,70819,76839,08742,55745,72249,58852,336
3013,78714,95316,79118,49320,59940,25643,77346,97950,89253,672
3114,45815,65517,53919,28121,43441,42244,98548,23252,19155,003
3215,13416,36218,29120,07222,27142,58546,19449,48053,48656,328
3315,81517,07419,04720,86723,11043,74547,40050,72554,77657,648
3416,50117,78919,80621,66423,95244,90348,60251,96656,06158,964
3517,19218,50920,56922,46524,79746,05949,80253,20357,34260,275
3617,88719,23321,33623,26925,64347,21250,99854,43758,61961,581
3718,58619,96022,10624,07526,49248,36352,19255,66859,89362,883
3819,28920,69122,87824,88427,34349,51353,38456,89661,16264,181
3919,99621,42623,65425,69528,19650,66054,57258,12062,42865,476
4020,70722,16424,43326,50929,05151,80555,75859,34263,69166,766
5027,99129,70732,35734,76437,68963,16767,50571,42076,15479,490
7547,20649,47552,94256,05459,79591,06196,217100,839106,393110,286
10067,32870,06574,22277,92982,358118,498124,342129,561135,807140,169

Determinación de valores críticos a partir de la tabla χν²

El uso de la tabla chi cuadrada es muy sencillo. El proceso comienza con el análisis de los grados de libertad, el tipo de prueba estadística para la que deseamos obtener el valor crítico, y el nivel de significancia de la prueba.

Grados de libertad

En primer lugar, se debe determinar la función chi cuadrada específica que sigue nuestra variable aleatoria, lo que significa determinar los grados de libertad. Esto implica conocer bien nuestro estadístico de prueba, ya que los grados de libertad corresponden al número de variables normales independientes que se suman para construirlo.

Dependiendo del tipo de prueba que estemos llevando a cabo, el número de grados de libertad se calcula de manera distinta. La siguiente tabla muestra cómo se determina en tres escenarios comunes:

Tipo de PruebaGrados de Libertad (ν)
Pruebas de bondad de ajusteν = n – 1 (donde n es el número de resultados del modelo)
Intervalo de confianza para la varianza poblacional (s2)ν = n – 1 (donde n es el tamaño de la muestra)
Pruebas de independencia de dos variables categóricasν = ( r – 1 )( c – 1) (donde r y c son el número de filas y columnas de la tabla de contingencia)

El número de grados de libertad determina la fila de la tabla chi cuadrado donde buscaremos el valor crítico de interés. Es posible que la tabla no contenga todos los valores de grados de libertad. En caso de que el número de nuestros grados de libertad no aparezca, se pueden tomar tres caminos:

  1. Buscar una tabla más completa que sí lo tenga.
  2. Utilizar la fila inmediatamente anterior.
  3. Interpolar los valores entre la fila anterior y la siguiente.

Tipo de prueba

Luego de establecer el número de grados de libertad, debemos establecer si lo que estamos es creando un intervalo de confianza o si estamos haciendo una prueba de hipótesis. En el caso posterior, también debemos establecer si se trata de una prueba de una cola o de dos colas. Esto es relevante para el paso siguiente.

Nivel de significancia

Tanto los intervalos de confianza como las pruebas de hipótesis tienen asociados un nivel de significancia, que se refiere a la probabilidad de cometer un error tipo I. Este representa la probabilidad de rechazar la hipótesis nula cuando es verdadera. El error tipo I generalmente se considera uno de los peores errores que se puede cometer al hacer un contraste de hipótesis, por lo que muchos contrastes se definen en función la probabilidad de cometer este tipo de error.

El nivel de significancia lo establece el investigador desde el principio de un estudio científico. Él o ella definen cuánto riesgo de equivocarse desean asumir al contrastar su hipótesis. Así mismo, al momento de establecer intervalos de confianza, el nivel de significancia se relaciona con la probabilidad de que la diferencia entre un valor particular y la media poblacional se deba a variaciones aleatorias de la variable, y no a que su valor sea realmente diferente.

En la tabla chi cuadrada, podemos encontrar los valores críticos para distintos niveles de significancia. Sin embargo, este valor solo se puede utilizar directamente si la prueba de hipótesis es de una sola cola.

Si se trata de una prueba de hipótesis de dos colas, o si estamos estableciendo un intervalo de confianza, entonces la probabilidad de error se distribuye de manera equitativa a ambos lados de la distribución. Esto quiere decir que, en estos casos, debemos buscar dos valores críticos en la tabla, ambos correspondientes a un nivel de significancia de la mitad del nivel de significancia total de la prueba.

Ejemplo

Si estamos haciendo una prueba de hipótesis de dos colas para la varianza poblacional con una muestra de tamaño 25 y un nivel de significancia del 5%, entonces debemos determinar dos valores críticos chi cuadrado con 25 – 1 = 24 grados de libertad, y un a/2=0,05/2 = 0,025.

El valor crítico de la cola derecha lo encontramos con el valor de α = 0,025, pero el valor crítico de la cola izquierda lo debemos econtrar con su complemento 1 – α = 1 – 0,025 = 0,975, ya que buscamos el valor crítico que deja un área de 0,025 a la izquierda, que es lo mismo que decir el valor que deja un área de 0,975 a la derecha. Alternativamente (y de forma más práctica), para la cola izquierda podemos buscar en su lugar el valor de p = 0,025, ya que, por definición, p es el complemento de α. De esta manera, no es necesario llevar a cabo la resta sino que buscamos el valor de p en la primera fila.

En el presente ejemplo, los valores críticos correspondientes son 12,401 y 39,364.

Referencias

Addinsoft. (s. f.). ¿Qué es una prueba estadística? https://help.xlstat.com/es/6758-what-statistical-test

Holmes, A. (2015, 31 marzo). Properties of Continuous Probability Density Functions – Introductory Business Statistics. Pressbooks. https://opentextbc.ca/introbusinessstatopenstax/chapter/properties-of-continuous-probability-density-functions/

Minitab, LLC. (2022). ¿Qué es un estadístico de prueba? Minitab. https://support.minitab.com/es-mx/minitab/19/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-statistic/

Quevedo, F. (2011, 1 diciembre). La prueba de ji-cuadrado. Medwave. https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266

Rodó, P. (2021, 7 julio). Distribución de probabilidad acumulada. Economipedia. https://economipedia.com/definiciones/distribucion-de-probabilidad-acumulada.html#:%7E:text=La%20distribuci%C3%B3n%20de%20probabilidad%20acumulada,menor%20que%20un%20valor%20concreto.

Ruiz Mitjana, L. (2022, 15 febrero). Prueba de chi-cuadrado (χ2): qué es y cómo se usa en estadística. Psicología y Mente. https://psicologiaymente.com/miscelanea/prueba-chi-cuadrado

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados