Hur man konstruerar ett konfidensintervall för en befolkningsandel

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Konfidensintervallet för en statistisk parameter är intervallet av värden som det uppskattas att denna parameter kan ta; Med andra ord, de är två värden mellan vilka denna parameter kan variera med en viss nivå av förtroende. Beräkningen av konfidensintervallet är en del av bestämningen av en statistisk parameter för en population; värdet på parametern bestäms på ett urval av populationen och i samma beräkningsprocess bestäms konfidensintervallet för värdet på parametern som har erhållits. En typ av parameter som kan uppskattas med hjälp av inferentiell statistik är en andel av en population.

En fråga som till exempel kan ställas är hur stor andel av befolkningen i ett land som stöder en viss lag. I denna typ av frågor är det nödvändigt att bestämma ett konfidensintervall för det värde som bestäms. Vi kommer att se nedan hur konfidensintervallet för en andel av en befolkning är konstruerat och exponerar en del av dess teoretiska grund.

Som redan nämnts definieras konfidensintervallet för en statistisk parameter som två värden mellan vilka denna parameter kan variera med en viss konfidensnivå; parameteruppskattaren är placerad i mitten av detta område. Således kommer ett konfidensintervall att ha formen

estimator +/- osäkerhet

Därför kommer det att finnas två siffror som måste bestämmas: uppskattningen av parametern som vi studerar och osäkerheten eller felmarginalen.

Beräkningsförutsättningar

För att utföra en statistisk beräkning är det nödvändigt att vissa förutsättningar som definierats för den specifika bestämningen är uppfyllda. När det gäller att bestämma ett konfidensintervall för att utvärdera en andel av en population är premisserna följande.

1. Ett slumpmässigt urval från en population som är signifikant stor till storleken måste utvärderas. Urvalet kommer att ha ett antal fall n .

2. Medlemmarna i urvalet måste väljas oberoende av varandra.

3. Det måste finnas minst 15 framgångar och 15 misslyckanden i urvalet av storlek n .

Andel av urval och population

Låt oss titta på proceduren för att göra en uppskattning av en andel i en population. Precis som ett urvalsmedelvärde används för att uppskatta ett populationsmedelvärde, kan en urvalsandel också användas för att uppskatta en populationsandel. Andelen av populationen är den okända parametern, det är värdet som ska bestämmas. Sättet att beräkna denna parameter är genom att addera de framgångar som registrerats i urvalet och dividera resultatet av summan med n , det totala antalet fall i urvalet. vi kommer att ringa ptill parametern för befolkningen som ska studeras, andelen av befolkningen som uppfyller ett visst kriterium. På samma sätt kommer vi att ha andelen i urvalet, som för att skilja den från andelen av populationen kommer vi att placera en linje ovanför den som visas i följande formler. Andelen i urvalet är skattaren av andelen i populationen.

För att bestämma konfidensintervallet för en andel av en population är det nödvändigt att veta vad dess statistiska fördelning är, som visas i följande figur.

Statistisk fördelning av andelen av en befolkning.
Statistisk fördelning av andelen av en befolkning.

Med den statistiska fördelningen är det möjligt att bestämma estimatorn och standardavvikelsen SE , värden som utgör konfidensintervallet

konfidensintervall

med en konfidensnivå

självförtroendenivå

I dessa statistiska problem har standardavvikelsen SE ett binomiskt beteende som en funktion av estimatorn av p , andelen positiva fall i urvalet av storleken n av populationen, vilket visas av följande formel.

Standardavvikelse

Den allmänna definitionen använder p- värdet i formeln för standardavvikelsen, vilket är ett okänt värde, så standardfelet används och ersätter p för dess estimator, som föregående formel visar.

En annan aspekt att beakta är att under de tre premisserna som fastställdes kan binomialfördelningen approximeras med standardnormalfördelningen.

På detta sätt erhålls formeln för att bestämma konfidensintervallet för en andel av en population.

Konfidensintervall för en andel av en befolkning.

Konfidensnivån bestäms som den procentandel som ska beaktas i standardnormalfördelningen, som visas i föregående figur; ju större area, desto högre konfidensnivå att ha i konfidensintervallet. Följande tabell visar värdena för parametern för de olika värdena på konfidensnivån, som uttrycker distributionsområdet som ska täckas.

Självförtroendenivå.

Exempel på bestämning av ett konfidensintervall för en befolkningsandel

Anta att vi med 95 % tillförsikt vill veta hur stor andel av väljarna i en stad som identifierar sig med ett givet politiskt parti. Vi samlar informationen i ett enkelt slumpmässigt urval bestående av 100 personer i den staden och vi finner att 64 av dem identifierar sig med det politiska partiet.

Först kontrollerar vi att de tre lokaler vi etablerat är uppfyllda. Uppfattningen hos befolkningen i en stad, en betydligt stor befolkning, utvärderas och urvalet tas slumpmässigt. I detta fall är n lika med 100. Informationen för ett givet av de 100 fallen samlades in oberoende. Både de positiva svaren på samrådet, det vill säga framgångarna, och de negativa svaren, det vill säga misslyckandena, överstiger 15 fall.

Värdet på andelen av urvalet, skattaren av parametern som vi vill bestämma, det vill säga andelen av befolkningen i staden som identifierar sig med det politiska partiet i fråga, bestäms som kvoten mellan de positiva fallen och antalet n som utgör urvalet; 64 dividerat med 100, 0,64. Detta är värdet på skattaren och är centrum för konfidensintervallet.

I formeln som utvärderar osäkerheten finns två faktorer. Den första faktorn är konfidensnivån som fastställdes till 95 %, för vilken faktorn kommer att vara 1,96. För att utvärdera den andra faktorn måste värdena 0,64 och 100 ersättas i formeln, och det erhålls att värdet på den andra faktorn är 0,048. Med produkten av båda faktorerna erhålls osäkerheten; 0,094. Så konfidensintervallet i detta exempel är

0,640 +/- 0,094

Detta konfidensintervall kan tolkas som att med en konfidens på 95 %, det vill säga att resultaten representerar 95 % av den totala befolkningen, kommer andelen personer i staden i fråga som identifierar sig med det politiska partiet att vara mellan 54,6 % och 73,4 %.

Relaterade statistiska begrepp

Det finns ett antal idéer och statistiska frågor som är involverade i att bestämma denna typ av konfidensintervall. Till exempel kan vi utföra ett hypotestest relaterat till värdet av populationsandelen. Vi skulle också kunna jämföra två proportioner från två olika populationer.

Källor

Humör, Alexander; Graybill, Franklin A.; Boes, Duane C. Introduktion till teorin om statistik . Tredje upplagan, McGraw-Hill, 1974.

Hypotestest . Statistisk slutsats. National Autonomous University of Mexico. Tillträde oktober 2021.

Westfall, Peter H. Att förstå avancerade statistiska metoder . Boca Raton, FL: CRC Press, 2013.

-Annons-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados