Comment construire un intervalle de confiance d’une proportion de la population

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


L’intervalle de confiance d’un paramètre statistique est la plage de valeurs que l’on estime que ce paramètre peut prendre ; En d’autres termes, ce sont deux valeurs entre lesquelles ce paramètre peut varier avec un certain niveau de confiance. Le calcul de l’intervalle de confiance fait partie de la détermination d’un paramètre statistique d’une population ; la valeur du paramètre est déterminée sur un échantillon de la population et, dans le même processus de calcul, l’intervalle de confiance de la valeur du paramètre qui a été obtenu est déterminé. Un type de paramètre qui peut être estimé à l’aide de statistiques inférentielles est une proportion d’une population.

Par exemple, une question qui peut être posée est de savoir quel est le pourcentage de la population d’un pays qui soutient une certaine loi. Dans ce type de question, il est nécessaire de déterminer un intervalle de confiance pour la valeur déterminée. Nous verrons ci-dessous comment est construit l’intervalle de confiance d’une proportion d’une population en exposant une partie de son fondement théorique.

Comme déjà mentionné, l’intervalle de confiance d’un paramètre statistique est défini comme deux valeurs entre lesquelles ce paramètre peut varier avec un certain niveau de confiance ; l’estimateur de paramètre est situé au centre de cette plage. Ainsi, un intervalle de confiance aura la forme

estimateur +/- incertitude

Par conséquent, il y aura deux nombres à déterminer : l’estimation du paramètre que nous étudions et l’incertitude ou la marge d’erreur.

Locaux de calcul

Pour effectuer un calcul statistique, il est nécessaire que certaines prémisses définies pour cette détermination spécifique soient remplies. Dans le cas de la détermination d’un intervalle de confiance pour évaluer une proportion d’une population, les prémisses sont les suivantes.

1. Un échantillon tiré au hasard d’une population de taille significativement importante doit être évalué. L’échantillon aura un certain nombre de cas n .

2. Les membres de l’échantillon doivent être choisis indépendamment les uns des autres.

3. Il doit y avoir au moins 15 réussites et 15 échecs dans l’échantillon de taille n .

Proportion de l’échantillon et de la population

Regardons la procédure pour faire une estimation d’une proportion dans une population. Tout comme une moyenne d’échantillon est utilisée pour estimer une moyenne de population, une proportion d’échantillon peut également être utilisée pour estimer une proportion de population. La proportion de la population est le paramètre inconnu, c’est la valeur à déterminer. La façon de calculer ce paramètre consiste à additionner les succès enregistrés dans l’échantillon et à diviser le résultat de la somme par n , le nombre total de cas dans l’échantillon. nous appellerons pau paramètre de la population à étudier, la proportion de la population qui répond à un certain critère. De la même manière, nous aurons la proportion dans l’échantillon, que pour la différencier de la proportion de la population, nous placerons une ligne au-dessus comme indiqué dans les formules suivantes. La proportion dans l’échantillon est l’estimateur de la proportion dans la population.

Pour déterminer l’intervalle de confiance d’une proportion d’une population, il est nécessaire de connaître sa distribution statistique, comme le montre la figure suivante.

Répartition statistique de la proportion d'une population.
Répartition statistique de la proportion d’une population.

Avec la distribution statistique, il est possible de déterminer l’estimateur et l’écart type SE , valeurs qui constituent l’intervalle de confiance

intervalle de confiance

avec un niveau de confiance

un niveau de confiance

Dans ces problèmes statistiques, l’écart-type SE a un comportement binomial en fonction de l’estimateur de p , la proportion de cas positifs dans l’échantillon de taille n de la population, comme le montre la formule suivante.

Écart-type

La définition générale utilise la valeur p dans la formule de l’écart type, qui est une valeur inconnue, donc l’erreur type est utilisée, en remplaçant p par son estimateur, comme le montre la formule précédente.

Un autre aspect à considérer est que sous les trois prémisses qui ont été établies, la distribution binomiale peut être approchée avec la distribution normale standard.

De cette façon, la formule pour déterminer l’intervalle de confiance d’une proportion d’une population est obtenue.

Intervalle de confiance d'une proportion d'une population.

Le niveau de confiance est déterminé comme le pourcentage qui doit être pris en compte dans la distribution normale standard, comme indiqué dans la figure précédente ; plus la zone est grande, plus le niveau de confiance à avoir dans l’intervalle de confiance est élevé. Le tableau suivant présente les valeurs du paramètre pour les différentes valeurs du niveau de confiance, qui expriment la zone de distribution à couvrir.

Un niveau de confiance.

Exemple de détermination d’un intervalle de confiance pour une proportion de la population

Supposons que nous voulions connaître avec une confiance de 95 % le pourcentage de l’électorat d’une ville qui s’identifie à un parti politique donné. Nous recueillons les informations dans un échantillon aléatoire simple composé de 100 personnes dans cette ville et nous constatons que 64 d’entre eux s’identifient au parti politique.

Premièrement, nous vérifions que les trois prémisses que nous avons établies sont respectées. L’opinion de la population d’une ville, une population significativement nombreuse, est évaluée et l’échantillon est tiré au hasard. Dans ce cas, n est égal à 100. Les informations pour un cas donné parmi les 100 cas ont été collectées indépendamment. Tant les réponses positives à la consultation, c’est-à-dire les succès, que les réponses négatives, c’est-à-dire les échecs, dépassent 15 cas.

La valeur de la proportion de l’échantillon, estimateur du paramètre que l’on veut déterminer, c’est-à-dire la proportion de la population de la ville qui s’identifie au parti politique en question, est déterminée comme le quotient entre les cas positifs et le nombre de n qui composent l’échantillon ; 64 divisé par 100, 0,64. Il s’agit de la valeur de l’estimateur et du centre de l’intervalle de confiance.

Dans la formule qui évalue l’incertitude, il y a deux facteurs. Le premier facteur est le niveau de confiance qui a été déterminé à 95 %, pour lequel le facteur sera de 1,96. Pour évaluer le deuxième facteur, les valeurs 0,64 et 100 doivent être substituées dans la formule, et on obtient que la valeur du deuxième facteur est de 0,048. Avec le produit des deux facteurs, l’incertitude est obtenue ; 0,094. L’intervalle de confiance dans cet exemple est donc

0,640 +/- 0,094

Cet intervalle de confiance peut s’interpréter comme si avec une confiance de 95 %, c’est-à-dire que les résultats représentent 95 % de la population totale, la proportion d’habitants de la ville considérée qui s’identifient au parti politique sera comprise entre 54,6 % et 73,4 %.

Concepts statistiques connexes

Il existe un certain nombre d’idées et de problèmes statistiques impliqués dans la détermination de ce type d’intervalle de confiance. Par exemple, nous pourrions effectuer un test d’hypothèse lié à la valeur de la proportion de la population. On pourrait aussi comparer deux proportions de deux populations différentes.

Sources

Humeur, Alexandre ; Graybill, Franklin A.; Boes, Duane C. Introduction à la théorie des statistiques . Troisième édition, McGraw-Hill, 1974.

Essai d’hypothèse . Inférence statistique. Université nationale autonome du Mexique. Consulté en octobre 2021.

Westfall, Peter H. Comprendre les méthodes statistiques avancées . Boca Raton, Floride : CRC Press, 2013.

-Publicité-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados