Πώς να δημιουργήσετε ένα διάστημα εμπιστοσύνης μιας αναλογίας πληθυσμού

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Το διάστημα εμπιστοσύνης μιας στατιστικής παραμέτρου είναι το εύρος των τιμών που εκτιμάται ότι μπορεί να λάβει αυτή η παράμετρος. Με άλλα λόγια, είναι δύο τιμές μεταξύ των οποίων αυτή η παράμετρος μπορεί να ποικίλλει με ένα ορισμένο επίπεδο εμπιστοσύνης. Ο υπολογισμός του διαστήματος εμπιστοσύνης αποτελεί μέρος του προσδιορισμού μιας στατιστικής παραμέτρου ενός πληθυσμού. Η τιμή της παραμέτρου προσδιορίζεται σε δείγμα του πληθυσμού και, στην ίδια διαδικασία υπολογισμού, προσδιορίζεται το διάστημα εμπιστοσύνης της τιμής της παραμέτρου που έχει ληφθεί. Ένας τύπος παραμέτρων που μπορεί να εκτιμηθεί χρησιμοποιώντας στατιστικές συμπερασμάτων είναι η αναλογία ενός πληθυσμού.

Για παράδειγμα, ένα ερώτημα που μπορεί να τεθεί είναι ποιο είναι το ποσοστό του πληθυσμού μιας χώρας που υποστηρίζει έναν συγκεκριμένο νόμο. Σε αυτόν τον τύπο ερώτησης, είναι απαραίτητο να καθοριστεί ένα διάστημα εμπιστοσύνης για την τιμή που προσδιορίζεται. Θα δούμε παρακάτω πώς κατασκευάζεται το διάστημα εμπιστοσύνης ενός ποσοστού πληθυσμού εκθέτοντας μέρος της θεωρητικής του βάσης.

Όπως αναφέρθηκε ήδη, το διάστημα εμπιστοσύνης μιας στατιστικής παραμέτρου ορίζεται ως δύο τιμές μεταξύ των οποίων αυτή η παράμετρος μπορεί να ποικίλλει με ένα ορισμένο επίπεδο εμπιστοσύνης. ο εκτιμητής παραμέτρων βρίσκεται στο κέντρο αυτού του εύρους. Έτσι, ένα διάστημα εμπιστοσύνης θα έχει τη μορφή

εκτιμητής +/- αβεβαιότητα

Επομένως, θα υπάρχουν δύο αριθμοί που πρέπει να προσδιοριστούν: η εκτίμηση της παραμέτρου που μελετάμε και η αβεβαιότητα ή το περιθώριο σφάλματος.

Υπολογιστικές εγκαταστάσεις

Για να πραγματοποιηθεί ένας στατιστικός υπολογισμός είναι απαραίτητο να πληρούνται ορισμένες προϋποθέσεις που ορίζονται για τον συγκεκριμένο προσδιορισμό. Στην περίπτωση του προσδιορισμού ενός διαστήματος εμπιστοσύνης για την αξιολόγηση ενός ποσοστού ενός πληθυσμού, οι προϋποθέσεις είναι οι ακόλουθες.

1. Ένα δείγμα που προέρχεται τυχαία από έναν πληθυσμό που είναι σημαντικά μεγάλου μεγέθους πρέπει να αξιολογηθεί. Το δείγμα θα έχει έναν αριθμό περιπτώσεων n .

2. Τα μέλη του δείγματος πρέπει να επιλέγονται ανεξάρτητα το ένα από το άλλο.

3. Πρέπει να υπάρχουν τουλάχιστον 15 επιτυχίες και 15 αποτυχίες στο δείγμα μεγέθους n .

Αναλογία δείγματος και πληθυσμού

Ας δούμε τη διαδικασία για την εκτίμηση της αναλογίας σε έναν πληθυσμό. Ακριβώς όπως ένας μέσος όρος δείγματος χρησιμοποιείται για την εκτίμηση ενός μέσου όρου πληθυσμού, ένα ποσοστό δείγματος μπορεί επίσης να χρησιμοποιηθεί για την εκτίμηση ενός ποσοστού πληθυσμού. Η αναλογία του πληθυσμού είναι η άγνωστη παράμετρος, είναι η τιμή που πρέπει να προσδιοριστεί. Ο τρόπος υπολογισμού αυτής της παραμέτρου είναι προσθέτοντας τις επιτυχίες που καταγράφηκαν στο δείγμα και διαιρώντας το αποτέλεσμα του αθροίσματος με το n , τον συνολικό αριθμό των περιπτώσεων στο δείγμα. θα καλέσουμε πστην παράμετρο του προς μελέτη πληθυσμού, το ποσοστό του πληθυσμού που πληροί ένα ορισμένο κριτήριο. Με τον ίδιο τρόπο θα έχουμε την αναλογία στο δείγμα, η οποία για να τη διαφοροποιήσουμε από την αναλογία του πληθυσμού θα τοποθετήσουμε μια γραμμή από πάνω της όπως φαίνεται στους παρακάτω τύπους. Η αναλογία στο δείγμα είναι ο εκτιμητής της αναλογίας στον πληθυσμό.

Για να προσδιοριστεί το διάστημα εμπιστοσύνης μιας αναλογίας ενός πληθυσμού, είναι απαραίτητο να γνωρίζουμε ποια είναι η στατιστική κατανομή του, όπως φαίνεται στο παρακάτω σχήμα.

Στατιστική κατανομή της αναλογίας ενός πληθυσμού.
Στατιστική κατανομή της αναλογίας ενός πληθυσμού.

Με τη στατιστική κατανομή είναι δυνατός ο προσδιορισμός του εκτιμητή και της τυπικής απόκλισης SE , τιμές που αποτελούν το διάστημα εμπιστοσύνης

διάστημα εμπιστοσύνης

με επίπεδο εμπιστοσύνης

επίπεδο αυτοπεποίθησης

Σε αυτά τα στατιστικά προβλήματα, η τυπική απόκλιση SE έχει διωνυμική συμπεριφορά ως συνάρτηση του εκτιμητή του p , της αναλογίας των θετικών περιπτώσεων στο δείγμα μεγέθους n του πληθυσμού, όπως φαίνεται από τον ακόλουθο τύπο.

Τυπική απόκλιση

Ο γενικός ορισμός χρησιμοποιεί την τιμή p- στον τύπο για την τυπική απόκλιση, η οποία είναι μια άγνωστη τιμή, επομένως χρησιμοποιείται το τυπικό σφάλμα, αντικαθιστώντας το p για τον εκτιμητή του, όπως δείχνει ο προηγούμενος τύπος.

Μια άλλη πτυχή που πρέπει να ληφθεί υπόψη είναι ότι κάτω από τις τρεις προϋποθέσεις που δημιουργήθηκαν, η διωνυμική κατανομή μπορεί να προσεγγιστεί με την τυπική κανονική κατανομή.

Με αυτόν τον τρόπο, προκύπτει ο τύπος για τον προσδιορισμό του διαστήματος εμπιστοσύνης μιας αναλογίας ενός πληθυσμού.

Διάστημα εμπιστοσύνης ενός ποσοστού πληθυσμού.

Το επίπεδο εμπιστοσύνης προσδιορίζεται ως το ποσοστό που πρέπει να ληφθεί υπόψη στην τυπική κανονική κατανομή, όπως φαίνεται στο προηγούμενο σχήμα. Όσο μεγαλύτερη είναι η περιοχή, τόσο υψηλότερο είναι το επίπεδο εμπιστοσύνης στο διάστημα εμπιστοσύνης. Ο παρακάτω πίνακας δείχνει τις τιμές της παραμέτρου για τις διαφορετικές τιμές του επιπέδου εμπιστοσύνης, οι οποίες εκφράζουν την περιοχή κατανομής που πρέπει να καλυφθεί.

Επίπεδο αυτοπεποίθησης.

Παράδειγμα Προσδιορισμού Διαστήματος Εμπιστοσύνης για Αναλογία Πληθυσμού

Ας υποθέσουμε ότι θέλουμε να γνωρίζουμε με βεβαιότητα 95% το ποσοστό του εκλογικού σώματος σε μια πόλη που ταυτίζεται με ένα δεδομένο πολιτικό κόμμα. Συλλέγουμε τις πληροφορίες σε ένα απλό τυχαίο δείγμα που αποτελείται από 100 άτομα σε αυτήν την πόλη και διαπιστώνουμε ότι 64 από αυτούς ταυτίζονται με το πολιτικό κόμμα.

Αρχικά, επαληθεύουμε ότι πληρούνται οι τρεις εγκαταστάσεις που δημιουργήσαμε. Αξιολογείται η γνώμη του πληθυσμού μιας πόλης, ενός σημαντικά μεγάλου πληθυσμού, και το δείγμα λαμβάνεται τυχαία. Σε αυτή την περίπτωση το n είναι ίσο με 100. Οι πληροφορίες για μια δεδομένη μία από τις 100 περιπτώσεις συλλέχθηκαν ανεξάρτητα. Τόσο οι θετικές απαντήσεις στη διαβούλευση, δηλαδή οι επιτυχίες, όσο και οι αρνητικές απαντήσεις, δηλαδή οι αποτυχίες, ξεπερνούν τις 15 περιπτώσεις.

Η τιμή της αναλογίας του δείγματος, ο εκτιμητής της παραμέτρου που θέλουμε να προσδιορίσουμε, δηλαδή η αναλογία του πληθυσμού της πόλης που ταυτίζεται με το εν λόγω πολιτικό κόμμα, προσδιορίζεται ως το πηλίκο μεταξύ των θετικών περιπτώσεων και τον αριθμό των n που αποτελούν το δείγμα· 64 διαιρούμενο με το 100, 0,64. Αυτή είναι η τιμή του εκτιμητή και είναι το κέντρο του διαστήματος εμπιστοσύνης.

Στον τύπο που αξιολογεί την αβεβαιότητα υπάρχουν δύο παράγοντες. Ο πρώτος παράγοντας είναι το επίπεδο εμπιστοσύνης που καθορίστηκε στο 95%, για το οποίο ο συντελεστής θα είναι 1,96. Για να αξιολογηθεί ο δεύτερος παράγοντας, οι τιμές 0,64 και 100 πρέπει να αντικατασταθούν στον τύπο και προκύπτει ότι η τιμή του δεύτερου παράγοντα είναι 0,048. Με το γινόμενο και των δύο παραγόντων προκύπτει η αβεβαιότητα. 0,094. Άρα το διάστημα εμπιστοσύνης σε αυτό το παράδειγμα είναι

0,640 +/- 0,094

Αυτό το διάστημα εμπιστοσύνης μπορεί να ερμηνευθεί ως ότι με εμπιστοσύνη 95%, δηλαδή ότι τα αποτελέσματα αντιπροσωπεύουν το 95% του συνολικού πληθυσμού, το ποσοστό των ανθρώπων στην εν λόγω πόλη που ταυτίζονται με το πολιτικό κόμμα θα είναι μεταξύ 54,6% και 73,4 %.

Σχετικές στατιστικές έννοιες

Υπάρχουν πολλές ιδέες και στατιστικά ζητήματα που εμπλέκονται στον προσδιορισμό αυτού του τύπου διαστήματος εμπιστοσύνης. Για παράδειγμα, θα μπορούσαμε να εκτελέσουμε μια δοκιμή υποθέσεων που σχετίζεται με την τιμή της αναλογίας πληθυσμού. Θα μπορούσαμε επίσης να συγκρίνουμε δύο αναλογίες από δύο διαφορετικούς πληθυσμούς.

Πηγές

Διάθεση, Αλέξανδρος; Graybill, Franklin A.; Boes, Duane C. Εισαγωγή στη Θεωρία της Στατιστικής . Τρίτη έκδοση, McGraw-Hill, 1974.

Δοκιμή υποθέσεων . Στατιστικό συμπέρασμα. Εθνικό Αυτόνομο Πανεπιστήμιο του Μεξικού. Πρόσβαση τον Οκτώβριο του 2021.

Westfall, Peter H. Understanding Advanced Statistical Methods . Boca Raton, FL: CRC Press, 2013.

-Διαφήμιση-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados