Hvordan konstruere et konfidensintervall for en populasjonsandel

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Konfidensintervallet til en statistisk parameter er rekkevidden av verdier som det er estimert at denne parameteren kan ta; Med andre ord, de er to verdier mellom hvilke denne parameteren kan variere med et visst nivå av tillit. Beregningen av konfidensintervallet er en del av bestemmelsen av en statistisk parameter for en populasjon; verdien av parameteren bestemmes på et utvalg av populasjonen, og i samme beregningsprosess bestemmes konfidensintervallet for verdien av parameteren som er oppnådd. En type parameter som kan estimeres ved hjelp av inferensiell statistikk er en andel av en populasjon.

For eksempel, et spørsmål som kan stilles er hvor stor prosentandel av befolkningen i et land som støtter en bestemt lov. I denne typen spørsmål er det nødvendig å bestemme et konfidensintervall for verdien som bestemmes. Nedenfor vil vi se hvordan konfidensintervallet til en andel av en populasjon er konstruert og avslører en del av dens teoretiske grunnlag.

Som allerede nevnt, er konfidensintervallet til en statistisk parameter definert som to verdier mellom hvilke denne parameteren kan variere med et visst konfidensnivå; parameterestimatoren er plassert i midten av dette området. Dermed vil et konfidensintervall ha formen

estimator +/- usikkerhet

Derfor vil det være to tall som må bestemmes: estimatet av parameteren som vi studerer og usikkerheten eller feilmarginen.

Beregningspremisser

For å utføre en statistisk beregning er det nødvendig at visse premisser definert for den spesifikke bestemmelsen er oppfylt. Når det gjelder å bestemme et konfidensintervall for å evaluere en andel av en populasjon, er premissene følgende.

1. Et tilfeldig utvalg fra en populasjon som er betydelig stor i størrelse skal evalueres. Utvalget vil ha en rekke tilfeller n .

2. Medlemmene av utvalget skal velges uavhengig av hverandre.

3. Det må være minst 15 suksesser og 15 feil i utvalget av størrelse n .

Andel av utvalg og populasjon

La oss se på fremgangsmåten for å lage et estimat av en andel i en populasjon. På samme måte som et utvalgsmiddel brukes til å estimere et populasjonsmiddel, kan en utvalgsandel også brukes til å estimere en populasjonsandel. Andelen av populasjonen er den ukjente parameteren, det er verdien som skal bestemmes. Måten å beregne denne parameteren på er ved å legge til suksessene som er registrert i utvalget og å dele resultatet av summen med n , det totale antallet tilfeller i utvalget. vi vil ringe stil parameteren til befolkningen som skal studeres, andelen av befolkningen som oppfyller et visst kriterium. På samme måte vil vi ha andelen i utvalget, som for å skille den fra andelen av populasjonen vil vi plassere en linje over den som vist i følgende formler. Andelen i utvalget er estimatoren for andelen i populasjonen.

For å bestemme konfidensintervallet til en andel av en populasjon, er det nødvendig å vite hva dens statistiske fordeling er, som vist i følgende figur.

Statistisk fordeling av andelen av en befolkning.
Statistisk fordeling av andelen av en befolkning.

Med den statistiske fordelingen er det mulig å bestemme estimatoren og standardavviket SE , verdier som utgjør konfidensintervallet

konfidensintervall

med et konfidensnivå

selvtillitsnivå

I disse statistiske problemene har standardavviket SE en binomial oppførsel som en funksjon av estimatoren til p , andelen positive tilfeller i utvalget av størrelse n av populasjonen, som vist med følgende formel.

Standardavvik

Den generelle definisjonen bruker p- verdien i formelen for standardavviket, som er en ukjent verdi, så standardfeilen brukes, og erstatter p for estimatoren, som den forrige formelen viser.

Et annet aspekt å vurdere er at under de tre premissene som ble etablert, kan binomialfordelingen tilnærmes med standard normalfordeling.

På denne måten oppnås formelen for å bestemme konfidensintervallet til en andel av en populasjon.

Konfidensintervall for en andel av en befolkning.

Konfidensnivået bestemmes som prosentandelen som skal vurderes i standard normalfordeling, som vist i forrige figur; jo større område, desto høyere grad av konfidens å ha i konfidensintervallet. Følgende tabell viser verdiene til parameteren for de forskjellige verdiene for konfidensnivået, som uttrykker distribusjonsområdet som skal dekkes.

Selvtillitsnivå.

Eksempel på å bestemme et konfidensintervall for en populasjonsandel

Anta at vi med 95 % sikkerhet vil vite prosentandelen av velgerne i en by som identifiserer seg med et gitt politisk parti. Vi samler informasjonen i et enkelt tilfeldig utvalg bestående av 100 personer i den byen, og vi finner at 64 av dem identifiserer seg med det politiske partiet.

Først verifiserer vi at de tre lokalene vi etablerte er oppfylt. Meningen til befolkningen i en by, en betydelig stor befolkning, blir evaluert og utvalget tas tilfeldig. I dette tilfellet er n lik 100. Informasjonen for et gitt av de 100 tilfellene ble samlet inn uavhengig. Både de positive svarene på konsultasjonen, det vil si suksessene, og de negative svarene, det vil si feilene, overstiger 15 saker.

Verdien av andelen av utvalget, estimatoren av parameteren som vi ønsker å bestemme, det vil si andelen av befolkningen i byen som identifiserer seg med det aktuelle politiske partiet, bestemmes som kvotienten mellom de positive tilfellene og antall n som utgjør utvalget; 64 delt på 100, 0,64. Dette er verdien av estimatoren og er sentrum av konfidensintervallet.

I formelen som vurderer usikkerheten er det to faktorer. Den første faktoren er konfidensnivået som ble bestemt til å være 95 %, hvor faktoren vil være 1,96. For å evaluere den andre faktoren, må verdiene 0,64 og 100 erstattes i formelen, og det oppnås at verdien av den andre faktoren er 0,048. Med produktet av begge faktorer oppnås usikkerheten; 0,094. Så konfidensintervallet i dette eksemplet er

0,640 +/- 0,094

Dette konfidensintervallet kan tolkes som at med en konfidens på 95 %, det vil si at resultatene representerer 95 % av den totale befolkningen, vil andelen personer i den aktuelle byen som identifiserer seg med det politiske partiet være mellom 54,6 % og 73,4 %.

Beslektede statistiske begreper

Det er en rekke ideer og statistiske problemer involvert i å bestemme denne typen konfidensintervall. For eksempel kan vi utføre en hypotesetest relatert til verdien av populasjonsandelen. Vi kan også sammenligne to proporsjoner fra to forskjellige populasjoner.

Kilder

Stemning, Alexander; Graybill, Franklin A.; Boes, Duane C. Introduksjon til teorien om statistikk . Tredje utgave, McGraw-Hill, 1974.

Hypotesetest . Statistisk slutning. National Autonomous University of Mexico. Åpnet oktober 2021.

Westfall, Peter H. Forstå avanserte statistiske metoder . Boca Raton, FL: CRC Press, 2013.

-Annonse-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados