Cum se construiește un interval de încredere al unei proporții a populației

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Intervalul de încredere al unui parametru statistic este intervalul de valori pe care se estimează că le poate lua acest parametru; Cu alte cuvinte, sunt două valori între care acest parametru poate varia cu un anumit nivel de încredere. Calculul intervalului de încredere face parte din determinarea unui parametru statistic al unei populații; se determină valoarea parametrului pe un eşantion al populaţiei şi, în acelaşi proces de calcul, se determină intervalul de încredere al valorii parametrului care a fost obţinut. Un tip de parametru care poate fi estimat folosind statistici inferenţiale este o proporţie a unei populaţii.

De exemplu, o întrebare care poate fi pusă este care este procentul din populația unei țări care susține o anumită lege. În acest tip de întrebare, este necesar să se determine un interval de încredere pentru valoarea care este determinată. Vom vedea mai jos cum este construit intervalul de încredere al unei proporții dintr-o populație expunând o parte din baza sa teoretică.

După cum sa menționat deja, intervalul de încredere al unui parametru statistic este definit ca două valori între care acest parametru poate varia cu un anumit nivel de încredere; estimatorul de parametri este situat în centrul acestui interval. Astfel, un interval de încredere va avea forma

estimator +/- incertitudine

Prin urmare, vor fi două numere care trebuie determinate: estimarea parametrului pe care îl studiem și incertitudinea sau marja de eroare.

Premise de calcul

Pentru a efectua un calcul statistic este necesar ca anumite premise definite pentru determinarea respectivă să fie îndeplinite. În cazul determinării unui interval de încredere pentru a evalua o proporție dintr-o populație, premisele sunt următoarele.

1. Trebuie evaluat un eșantion extras la întâmplare dintr-o populație care este semnificativ mare ca mărime. Eşantionul va avea un număr de cazuri n .

2. Membrii eșantionului trebuie să fie aleși independent unul de celălalt.

3. Trebuie să existe cel puțin 15 reușite și 15 eșecuri în eșantionul de mărime n .

Proporția eșantionului și populației

Să ne uităm la procedura de realizare a unei estimări a unei proporții dintr-o populație. Așa cum o medie a eșantionului este utilizată pentru a estima o medie a populației, o proporție a eșantionului poate fi utilizată și pentru a estima o proporție a populației. Proporția populației este parametrul necunoscut, este valoarea de determinat. Modul de calcul al acestui parametru este prin adăugarea succeselor înregistrate în eșantion și împărțirea rezultatului sumei la n , numărul total de cazuri din eșantion. vom numi pla parametrul populaţiei de studiat, proporţia populaţiei care îndeplineşte un anumit criteriu. În același mod vom avea proporția din eșantion, pe care pentru a o diferenția de proporția populației vom plasa o linie deasupra acesteia așa cum se arată în formulele următoare. Proporția din eșantion este estimatorul proporției din populație.

Pentru a determina intervalul de încredere al unei proporții dintr-o populație, este necesar să știm care este distribuția sa statistică, așa cum se arată în figura următoare.

Distribuția statistică a proporției unei populații.
Distribuția statistică a proporției unei populații.

Cu distribuția statistică se poate determina estimatorul și abaterea standard SE , valori care constituie intervalul de încredere

interval de încredere

cu un nivel de încredere

nivel de încredere

În aceste probleme statistice, abaterea standard SE are un comportament binomial în funcție de estimatorul lui p , proporția cazurilor pozitive din eșantionul de mărime n al populației, după cum arată următoarea formulă.

Deviație standard

Definiția generală folosește valoarea p din formula pentru abaterea standard, care este o valoare necunoscută, deci se folosește eroarea standard, înlocuind p cu estimatorul său, așa cum arată formula anterioară.

Un alt aspect de luat în considerare este că sub cele trei premise care au fost stabilite, distribuția binomială poate fi aproximată cu distribuția normală standard.

În acest fel, se obține formula de determinare a intervalului de încredere al unei proporții dintr-o populație.

Intervalul de încredere al unei proporții dintr-o populație.

Nivelul de încredere este determinat ca procent care trebuie luat în considerare în distribuția normală standard, așa cum se arată în figura anterioară; cu cât aria este mai mare, cu atât este mai mare nivelul de încredere pe care trebuie să-l ai în intervalul de încredere. Următorul tabel prezintă valorile parametrului pentru diferitele valori ale nivelului de încredere, care exprimă aria de distribuție care trebuie acoperită.

Nivel de încredere.

Exemplu de determinare a unui interval de încredere pentru o proporție a populației

Să presupunem că vrem să știm cu 95% de încredere procentul electoratului dintr-un oraș care se identifică cu un anumit partid politic. Colectăm informațiile într-un eșantion simplu aleatoriu format din 100 de persoane din acel oraș și constatăm că 64 dintre ei se identifică cu partidul politic.

În primul rând, verificăm că cele trei premise stabilite de noi sunt îndeplinite. Se evaluează opinia populației unui oraș, o populație semnificativ mare, iar eșantionul este prelevat aleatoriu. În acest caz, n este egal cu 100. Informațiile pentru unul dintre cele 100 de cazuri au fost colectate independent. Atât răspunsurile pozitive la consultație, adică succesele, cât și răspunsurile negative, adică eșecurile, depășesc 15 cazuri.

Valoarea proporției eșantionului, estimatorul parametrului pe care dorim să-l determinăm, adică proporția populației orașului care se identifică cu partidul politic în cauză, se determină ca coeficient între cazurile pozitive și numărul de n care alcătuiesc eșantionul; 64 împărțit la 100, 0,64. Aceasta este valoarea estimatorului și este centrul intervalului de încredere.

În formula care evaluează incertitudinea sunt doi factori. Primul factor este nivelul de încredere care a fost determinat a fi de 95%, pentru care factorul va fi 1,96. Pentru a evalua al doilea factor, valorile 0,64 și 100 trebuie înlocuite în formulă și se obține că valoarea celui de-al doilea factor este 0,048. Cu produsul ambilor factori se obtine incertitudinea; 0,094. Deci intervalul de încredere din acest exemplu este

0,640 +/- 0,094

Acest interval de încredere poate fi interpretat ca acela cu o încredere de 95%, adică că rezultatele reprezintă 95% din totalul populației, proporția persoanelor din orașul în cauză care se identifică cu partidul politic va fi cuprinsă între 54,6% și 73,4 %.

Concepte statistice conexe

Există o serie de idei și probleme statistice implicate în determinarea acestui tip de interval de încredere. De exemplu, am putea efectua un test de ipoteză legat de valoarea proporției populației. De asemenea, am putea compara două proporții din două populații diferite.

Surse

Starea de spirit, Alexandru; Graybill, Franklin A.; Boes, Duane C. Introducere în teoria statisticii . Ediția a treia, McGraw-Hill, 1974.

Testul de ipoteză . Inferență statistică. Universitatea Națională Autonomă din Mexic. Accesat în octombrie 2021.

Westfall, Peter H. Înțelegerea metodelor statistice avansate . Boca Raton, FL: CRC Press, 2013.

-Publicitate-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados