Cómo construir un intervalo de confianza de una proporción de población

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

El intervalo de confianza de un parámetro estadístico es el rango de valores que se estima que puede tomar ese parámetro; dicho de otra forma, son dos valores entre los cuales puede variar este parámetro con un cierto nivel de confianza. El cálculo del intervalo de confianza es parte de la determinación de un parámetro estadístico de una población; se determina el valor del parámetro sobre una muestra de la población y, en el mismo proceso de cálculo, se determina el intervalo de confianza del valor del parámetro que se ha obtenido. Un tipo de parámetro que puede estimarse utilizando estadísticas inferenciales es una proporción de una población.

Por ejemplo, una pregunta que se puede plantear es cuál es el porcentaje de la población de un país que apoya una determinada ley. En este tipo de preguntas se necesita determinar un intervalo de confianza para el valor que se determine. Veremos a continuación cómo se construye el intervalo de confianza de una proporción de una población exponiendo parte de su base teórica.

Como ya se dijo, el intervalo de confianza de un parámetro estadístico se define como dos valores entre los cuales puede variar este parámetro con un cierto nivel de confianza; en el centro de este rango se ubica el estimador del parámetro. De esta forma un intervalo de confianza tendrá la forma

estimador  +/- incertidumbre

Por lo que serán dos los números que se deben determinar: la estimación del parámetro que estamos estudiando y la incertidumbre o margen de error.

Premisas de cálculo

Para realizar un cálculo estadístico es necesario que se cumplan ciertas premisas definidas para esa determinación específica. En el caso de la determinación de un intervalo de confianza para evaluar una proporción de una población, las premisas son las siguientes.

1. Se debe evaluar una muestra tomada en forma aleatoria de una población que tenga un tamaño significativamente grande. La muestra tendrá una cantidad de casos n.

2. Los integrantes de la muestra se deben elegir independientemente entre sí.

3. Debe haber al menos 15 éxitos y 15 fracasos en la muestra de tamaño n.

Proporción de muestra y de población

Veamos el procedimiento para hacer una estimación de una proporción en una población. De la misma forma que se utiliza la media de una muestra para estimar el valor medio de una población, también se puede usar una proporción de una muestra para estimar la proporción de una población. La proporción de la población es el parámetro desconocido, es el valor a determinar. La forma de calcular este parámetro es sumando los éxitos que se registran en la muestra y dividiendo el resultado de la suma entre n, el número total de casos de la muestra. Llamaremos p al parámetro de la población que se quiere estudiar, la proporción de la población que cumple cierto criterio. De la misma forma se tendrá la proporción en la muestra, que para diferenciarla de la proporción de la población le colocaremos un línea encima como se muestra en las fórmulas siguientes. La proporción en la muestra es el estimador de la proporción en la población.

Para la determinación del intervalo de confianza de una proporción de una población es necesario saber cuál es su distribución estadística, como muestra la figura siguiente.

Distribución estadística de la proporción de una población.
Distribución estadística de la proporción de una población.

Con la distribución estadística se puede determinar el estimador y la desviación estándar SE, valores que constituyen el intervalo de confianza

intervalo de confianza

con un nivel de confianza

nivel de confianza

En estos problemas estadísticos la desviación estándar SE tiene un comportamiento binomial en función del estimador de p, la proporción de casos positivos en la muestra de tamaño n de la población, como muestra la fórmula siguiente.

Desviación estándar

La definición general utiliza el valor p en la fórmula de la desviación estándar, que es un valor desconocido, por lo cual se utiliza el error estándar sustituyendo p por su estimador, como muestra la fórmula anterior.

Otro aspecto a considerar es que bajo las tres premisas que se establecieron se puede aproximar la distribución binomial con la distribución normal estándar.

De esta forma se obtiene la fórmula para determinar el intervalo de confianza de una proporción de una población.

Intervalo de confianza de una proporción de una población.

El nivel de confianza se determina como el porcentaje que se quiere considerar en la distribución normal estándar, tal como se muestra en la figura anterior; cuanto mayor sea el área, mayor será el nivel de confianza que se tendrá en el intervalo de confianza. En la siguiente tabla se muestran los valores del parámetro para los diferentes valores del nivel de confianza, que expresan el área de la distribución que se quiere abarcar.

Nivel de confianza.

Ejemplo de determinación de un intervalo de confianza de la proporción de una población

Supongamos que deseamos saber con un 95% de confianza el porcentaje del electorado de una ciudad que se identifica con un partido político determinado. Recabamos la información en una muestra aleatoria simple compuesta por 100 personas en esa ciudad y encontramos que 64 de ellas se identifican con el partido político.

En primer término verificamos que se cumplen las tres premisas que establecimos. Se evalua la opinión de la población de una ciudad, una población significativamente grande, y la muestra se toma en forma aleatoria. En este caso n es igual a 100. La información de dada uno de los 100 casos se recabó en forma independiente. Tanto las respuestas positivas a la consulta, es decir los éxitos, como las respuestas negativas, es decir los fracasos, superan los 15 casos.

El valor de la proporción de la muestra, el estimador del parámetro que queremos determinar, esto es la proporción de la población de la ciudad que se identifica con el partido político en cuestión, se determina como el cociente entre los casos positivos y la cantidad de casos n que integran la muestra; 64 dividido entre 100, 0.64. Éste es el valor del estimador y es el centro del intervalo de confianza.

En la fórmula que evalúa la incertidumbre hay dos factores. El primer factor es el nivel de confianza que se determinó en 95 %, por lo cual el factor será 1.96. Para evaluar el segundo factor se debe sustituir en la fórmula los valores 0.64 y 100, y se obtiene que el valor del segundo factor es 0.048. Con el producto de ambos factores se obtiene la incerteza; 0.094. Por lo que el intervalo de confianza en este ejemplo es

0.640 +/- 0.094

Este intervalo de confianza se puede interpretar como que con una confianza del 95 %, o sea que los resultados representan al 95 % de la población total, la proporción de personas de la ciudad en cuestión que se identifican con el partido político estará entre el 54.6 % y el 73.4 %.

Conceptos estadísticos relacionados

Hay una serie de ideas y temas estadísticos relacionados con la determinación de este tipo de intervalo de confianza. Por ejemplo, podríamos realizar una prueba de hipótesis relacionada con el valor de la proporción de población. También podríamos comparar dos proporciones de dos poblaciones diferentes.

Fuentes

Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. Introduction to the Theory of Statistics. Tercera edición, McGraw-Hill, 1974.

Prueba de hipótesis. Inferencia estadística. Universidad Nacional Autónoma de México. Consultado octubre de 2021.

Westfall, Peter H. Understanding Advanced Statistical Methods. Boca Raton, FL: CRC Press, 2013.

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados