Come costruire un intervallo di confidenza di una proporzione della popolazione

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


L’intervallo di confidenza di un parametro statistico è l’intervallo di valori che si stima possa assumere tale parametro; In altre parole, sono due valori tra i quali questo parametro può variare con un certo livello di confidenza. Il calcolo dell’intervallo di confidenza fa parte della determinazione di un parametro statistico di una popolazione; si determina il valore del parametro su un campione della popolazione e, nello stesso processo di calcolo, si determina l’intervallo di confidenza del valore del parametro ottenuto. Un tipo di parametro che può essere stimato utilizzando la statistica inferenziale è una proporzione di una popolazione.

Ad esempio, una domanda che si può porre è qual è la percentuale della popolazione di un paese che sostiene una determinata legge. In questo tipo di domande è necessario determinare un intervallo di confidenza per il valore che viene determinato. Vedremo in seguito come viene costruito l’intervallo di confidenza di una proporzione di una popolazione esponendo parte della sua base teorica.

Come già accennato, l’intervallo di confidenza di un parametro statistico è definito come due valori tra i quali questo parametro può variare con un certo livello di confidenza; lo stimatore del parametro si trova al centro di questo intervallo. Pertanto, un intervallo di confidenza avrà la forma

stimatore +/- incertezza

Saranno quindi due i numeri da determinare: la stima del parametro che stiamo studiando e l’incertezza o margine di errore.

Premesse di calcolo

Per effettuare un calcolo statistico è necessario che siano soddisfatte determinate premesse definite per quella specifica determinazione. Nel caso di determinazione di un intervallo di confidenza per valutare una proporzione di una popolazione, le premesse sono le seguenti.

1. Deve essere valutato un campione estratto a caso da una popolazione di dimensioni significativamente grandi. Il campione avrà un numero di casi n .

2. I componenti del campione devono essere scelti indipendentemente l’uno dall’altro.

3. Devono esserci almeno 15 successi e 15 fallimenti nel campione di dimensione n .

Proporzione di campione e popolazione

Diamo un’occhiata alla procedura per fare una stima di una proporzione in una popolazione. Proprio come una media campionaria viene utilizzata per stimare una media della popolazione, anche una proporzione campionaria può essere utilizzata per stimare una proporzione della popolazione. La proporzione della popolazione è il parametro sconosciuto, è il valore da determinare. Il modo per calcolare questo parametro è sommando i successi registrati nel campione e dividendo il risultato della somma per n , il numero totale di casi nel campione. chiameremo pal parametro della popolazione da studiare, la proporzione della popolazione che soddisfa un certo criterio. Allo stesso modo avremo la proporzione nel campione, che per differenziarla dalla proporzione della popolazione posizioneremo una linea sopra di essa come mostrato nelle seguenti formule. La proporzione nel campione è lo stimatore della proporzione nella popolazione.

Per determinare l’intervallo di confidenza di una proporzione di una popolazione, è necessario conoscere qual è la sua distribuzione statistica, come mostrato nella figura seguente.

Distribuzione statistica della proporzione di una popolazione.
Distribuzione statistica della proporzione di una popolazione.

Con la distribuzione statistica è possibile determinare lo stimatore e la deviazione standard SE , valori che costituiscono l’intervallo di confidenza

intervallo di confidenza

con un livello di confidenza

livello di confidenza

In questi problemi statistici, la deviazione standard SE ha un andamento binomiale in funzione dello stimatore di p , la proporzione di casi positivi nel campione di dimensione n della popolazione, come mostrato dalla seguente formula.

Deviazione standard

La definizione generale utilizza il valore p nella formula per la deviazione standard, che è un valore sconosciuto, quindi viene utilizzato l’errore standard, sostituendo p per il suo stimatore, come mostra la formula precedente.

Un altro aspetto da considerare è che sotto le tre premesse che sono state stabilite, la distribuzione binomiale può essere approssimata con la distribuzione normale standard.

In questo modo si ottiene la formula per determinare l’intervallo di confidenza di una proporzione di una popolazione.

Intervallo di confidenza di una proporzione di una popolazione.

Il livello di confidenza è determinato come percentuale da considerare nella distribuzione normale standard, come mostrato nella figura precedente; maggiore è l’area, maggiore è il livello di confidenza da avere nell’intervallo di confidenza. Nella tabella seguente sono riportati i valori del parametro per i diversi valori del livello di confidenza, che esprimono l’area di distribuzione da coprire.

Livello di confidenza.

Esempio di determinazione di un intervallo di confidenza per una proporzione della popolazione

Supponiamo di voler conoscere con una confidenza del 95% la percentuale dell’elettorato in una città che si identifica con un dato partito politico. Raccogliamo le informazioni in un semplice campione casuale composto da 100 persone in quella città e scopriamo che 64 di loro si identificano con il partito politico.

In primo luogo, verifichiamo che le tre premesse che abbiamo stabilito siano soddisfatte. Viene valutata l’opinione della popolazione di una città, una popolazione significativamente numerosa, e il campione viene prelevato in modo casuale. In questo caso n è uguale a 100. Le informazioni per un dato uno dei 100 casi sono state raccolte in modo indipendente. Sia le risposte positive alla consultazione, cioè i successi, sia le risposte negative, cioè gli insuccessi, superano i 15 casi.

Il valore della proporzione del campione, lo stimatore del parametro che si vuole determinare, cioè la proporzione della popolazione della città che si identifica con il partito politico in questione, viene determinato come quoziente tra i casi positivi e il numero di n che compongono il campione; 64 diviso 100, 0,64. Questo è il valore dello stimatore ed è il centro dell’intervallo di confidenza.

Nella formula che valuta l’incertezza ci sono due fattori. Il primo fattore è il livello di confidenza che è stato determinato pari al 95%, per il quale il fattore sarà 1,96. Per valutare il secondo fattore si devono sostituire nella formula i valori 0,64 e 100, e si ottiene che il valore del secondo fattore è 0,048. Con il prodotto di entrambi i fattori si ottiene l’incertezza; 0,094. Quindi l’intervallo di confidenza in questo esempio è

0,640 +/- 0,094

Questo intervallo di confidenza può essere interpretato come quello con una confidenza del 95%, cioè che i risultati rappresentino il 95% della popolazione totale, la percentuale di persone nella città in questione che si identificano con il partito politico sarà compresa tra il 54,6% e 73,4%.

Concetti statistici correlati

Ci sono una serie di idee e problemi statistici coinvolti nella determinazione di questo tipo di intervallo di confidenza. Ad esempio, potremmo eseguire un test di ipotesi relativo al valore della proporzione della popolazione. Potremmo anche confrontare due proporzioni di due diverse popolazioni.

Fonti

Umore, Alessandro; Graybill, Franklin A.; Boes, Duane C. Introduzione alla teoria della statistica . Terza edizione, McGraw-Hill, 1974.

Prova di ipotesi . Inferenza statistica. Università Nazionale Autonoma del Messico. Accesso ottobre 2021.

Westfall, Peter H. Comprensione dei metodi statistici avanzati . Boca Raton, Florida: CRC Press, 2013.

-Annuncio-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados