Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Τα διαστήματα εμπιστοσύνης (CI) χρησιμοποιούνται στις στατιστικές συμπερασμάτων ως εργαλείο για την εκτίμηση της τιμής μιας παραμέτρου πληθυσμού. Αυτά παρέχουν μεγαλύτερη ποσότητα πληροφοριών για την πραγματική τιμή μιας παραμέτρου από τους σημειακούς εκτιμητές, καθώς αντιπροσωπεύουν ένα διάστημα τιμών πεπερασμένου πλάτους εντός του οποίου έχουμε έναν ορισμένο βαθμό εμπιστοσύνης ότι η πραγματική τιμή της παραμέτρου θα βρίσκεται. Το τελευταίο είναι κάτι που οι σημειακοί εκτιμητές δεν παρέχουν.

Διαστήματα εμπιστοσύνης για δύο πληθυσμούς

Όταν μας ενδιαφέρει να συγκρίνουμε δύο διαφορετικούς πληθυσμούς, συχνά μας ενδιαφέρει να μάθουμε εάν μια συγκεκριμένη παράμετρος του ενός από αυτούς είναι μεγαλύτερη από, μικρότερη ή ίση με την αντίστοιχη παράμετρο του άλλου. Για παράδειγμα, όταν συγκρίνουμε την απόδοση δύο ηλεκτρικών κινητήρων, μπορεί να μας ενδιαφέρει να προσδιορίσουμε εάν η ροπή του κινητήρα Α είναι μεγαλύτερη ή όχι από αυτή του κινητήρα Β. Σε αυτήν την περίπτωση, συγκρίνουμε δύο πληθυσμιακά μέσα.

Ωστόσο, πολλές φορές μας ενδιαφέρει να συγκρίνουμε όχι τις μέσες τιμές μιας παραμέτρου, αλλά το ποσοστό ενός πληθυσμού που πληροί ή δεν πληροί μια συγκεκριμένη προϋπόθεση. Σε αυτή την περίπτωση, το ζητούμενο είναι να καθοριστεί ένα διάστημα εμπιστοσύνης για να εκτιμηθεί η τιμή της διαφοράς μεταξύ δύο αναλογιών πληθυσμού.

Συμπεράσματα σχετικά με τη διαφορά δύο αναλογιών πληθυσμού P 1P 2

Υπάρχουν πολλές διαφορετικές καταστάσεις στις οποίες μπορεί να μας ενδιαφέρει η διαφορά μεταξύ δύο αναλογιών πληθυσμού. Όπως αναφέραμε προηγουμένως, αυτή η διαφορά μας επιτρέπει να συγκρίνουμε ισοδύναμες αναλογίες σε δύο διαφορετικούς πληθυσμούς. Μερικά παραδείγματα ερευνητικών προβλημάτων που απαιτούν τον καθορισμό ενός διαστήματος εμπιστοσύνης για τη διαφορά μεταξύ δύο αναλογιών πληθυσμού παρουσιάζονται παρακάτω:

  • Σε κλινικές δοκιμές μιας νέας ιατρικής θεραπείας, είναι ιδιαίτερα σημαντικό να συγκρίνεται το ποσοστό των ατόμων που παρουσιάζουν βελτίωση στην ιατρική τους κατάσταση στον πληθυσμό που έλαβε τη θεραπεία με την ίδια αναλογία στην ομάδα των ατόμων που έλαβαν μόνο εικονικό φάρμακο.
  • Όταν θέλουμε να συγκρίνουμε το ποσοστό γυναικών και ανδρών που συμφωνούν ή διαφωνούν με ένα συγκεκριμένο κυβερνητικό μέτρο.
  • Στις επιχειρήσεις, μας ενδιαφέρει συχνά να συγκρίνουμε την ποιότητα της διαδικασίας παραγωγής σε δύο διαφορετικές γραμμές παραγωγής. Σε αυτήν την περίπτωση, μπορούν να συγκριθούν οι αναλογίες των ελαττωματικών ή μη συμμορφούμενων ειδών που παράγονται και από τις δύο γραμμές παραγωγής σε μια δεδομένη χρονική περίοδο.
  • Στον τομέα της μικροβιολογίας, μπορεί να μας ενδιαφέρει να συγκρίνουμε το ποσοστό των βακτηριακών αποικιών που επιβιώνουν μετά από επεξεργασία με διαφορετικά χημικά απολυμαντικά.
  • Οι έμποροι συχνά κάνουν δοκιμές A/B για να προσδιορίσουν ποιο περιεχόμενο σε μια ιστοσελίδα είναι πιο αποτελεσματικό στη μετατροπή των πιθανών πελατών σε αγοραστές. Για να γίνει αυτό, στους μισούς από τους ανθρώπους που έχουν πρόσβαση στον ιστότοπο εμφανίζεται περιεχόμενο (Α) και στους άλλους μισούς εμφανίζεται εναλλακτικό περιεχόμενο (Β) για να συγκρίνουν στη συνέχεια τα ποσοστά των επισκεπτών που αγόρασαν πραγματικά το προτεινόμενο προϊόν ή υπηρεσία.

Από τη σύγκριση των P 1 και P 2 στη διαφορά P 1 – P 2

Υπάρχουν πολλά περισσότερα παραδείγματα καταστάσεων στις οποίες μπορεί να μας ενδιαφέρει να συγκρίνουμε τις αναλογίες δύο διαφορετικών πληθυσμών. Αυτή η σύγκριση μπορεί να γίνει με διάφορους τρόπους. Για παράδειγμα, μπορεί να θέλουμε να μάθουμε εάν:

  • Και οι δύο αναλογίες είναι ίσες (P 1 = P 2 )
  • Η αναλογία 1 είναι μεγαλύτερη από την αναλογία 2 (P 1 > P 2 )
  • Η αναλογία 1 είναι μικρότερη από την αναλογία 2 (P 1 < P 2 )

Σε οποιαδήποτε από αυτές τις περιπτώσεις, αυτές οι δηλώσεις μπορούν να ξαναγραφούν ως προς τη διαφορά μεταξύ των αναλογιών:

  • Αν μας ενδιαφέρει να μάθουμε αν P 1 = P 2 , αυτό ισοδυναμεί με τον προσδιορισμό εάν P 1 – P 2 = 0
  • Αν μας ενδιαφέρει να μάθουμε εάν P 1 > P 2 , αυτό ισοδυναμεί με τον προσδιορισμό εάν P 1 – P 2 > 0
  • Αν μας ενδιαφέρει να μάθουμε εάν P 1 < P 2 , αυτό ισοδυναμεί με τον προσδιορισμό εάν P 1 – P 2 < 0

Επομένως, οποιαδήποτε σύγκριση μεταξύ των αναλογιών πληθυσμού μπορεί να επιλυθεί με την εύρεση ενός διαστήματος εμπιστοσύνης για τη διαφορά μεταξύ των αναλογιών πληθυσμού και στη συνέχεια με τη διεξαγωγή κατάλληλης ανάλυσης του αποτελέσματος.

Πώς όμως καθορίζονται αυτά τα διαστήματα εμπιστοσύνης;

Αυτό επιτυγχάνεται με την ανάλυση δειγμάτων από κάθε πληθυσμό και τη χρήση των εργαλείων της στατιστικής συμπερασμάτων. Αυτή η διαδικασία εξαρτάται από το αν εργαζόμαστε με μεγάλα ή μικρά δείγματα.

Διάστημα εμπιστοσύνης Εκτίμηση της διαφοράς δύο αναλογιών πληθυσμού από μεγάλα δείγματα (n ≥ 30)

Το διάστημα εμπιστοσύνης για τη διαφορά στις αναλογίες πληθυσμού μπορεί να λυθεί ως επέκταση του διαστήματος εμπιστοσύνης για μια διωνυμική αναλογία σε έναν πληθυσμό. Στην περίπτωση διωνυμικών αναλογιών (δηλαδή, το αποτέλεσμα του πειράματος ή της παρατήρησης είναι επιτυχία ή αποτυχία και το P αντιπροσωπεύει την πιθανότητα επιτυχίας), η κατανομή της αναλογίας σε ένα μεγάλο δείγμα ( p ) ακολουθεί μια περίπου κανονική κατανομή με μέσο όρο P (η αναλογία πληθυσμού) και η διακύμανση P(1 – P)/n , εφόσον η πιθανότητα επιτυχίας δεν είναι πολύ υψηλή ή πολύ χαμηλή (δηλαδή, όχι πολύ κοντά στο 1 ή το 0, αντίστοιχα) .

Στην περίπτωση της διαφοράς μεταξύ δύο αναλογιών πληθυσμού, P 1 – P 2 , μπορούμε να καθορίσουμε τα όρια του διαστήματος εμπιστοσύνης από δύο ανεξάρτητα δείγματα με αναλογίες p 1 και p 2 . Εάν αυτά τα δείγματα πληρούν τις ίδιες συνθήκες όπως παραπάνω (δείγματα n 1 και n 2 μεγάλα και αναλογίες p 1 και p 2 μακριά από το 1 και 0) και επομένως ακολουθούν κανονικές κατανομές, η διαφορά θα ακολουθεί επίσης μια κανονική κατανομή με μέσο όρο P 1 – P 2 και διακύμανση p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

Δεδομένων αυτών των αποτελεσμάτων, ένα διάστημα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού που ελήφθησαν από μεγάλα δείγματα, με επίπεδο εμπιστοσύνης 100(1 – α)%, όπου το α αντιπροσωπεύει το επίπεδο σημαντικότητας, δίνεται από:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Στον παραπάνω τύπο, το Z α/2 αντιστοιχεί στην τιμή του Z στην τυπική κανονική κατανομή που αφήνει μια περιοχή α/2 στα δεξιά της.

Διάστημα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού από μικρά δείγματα (n < 30)

Εάν οποιοδήποτε μέγεθος δείγματος είναι μικρότερο από 30 ή εάν οποιαδήποτε αναλογία είναι πολύ κοντά στο 0 ή το 1, η κατανομή σας δεν μπορεί να προσεγγίσει επαρκώς μια κανονική κατανομή. Σε αυτή την περίπτωση, η διαφορά των δύο αναλογιών δεν θα ακολουθεί κανονική κατανομή και γι’ αυτό δεν ισχύει ο παραπάνω τύπος για το διάστημα εμπιστοσύνης.

Το συμπέρασμα σχετικά με τη διαφορά στις αναλογίες πληθυσμού με βάση μικρά δείγματα είναι αρκετά περίπλοκο και ξεφεύγει από το πεδίο εφαρμογής αυτού του άρθρου.

Ερμηνεία του διαστήματος εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Μετά τον υπολογισμό του διαστήματος εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού, το αποτέλεσμα που προκύπτει πρέπει να ερμηνευτεί. Μπορούν να δοθούν τρία αποτελέσματα που ερμηνεύονται διαφορετικά.

Ας εξετάσουμε κάθε περίπτωση κατά την οποία λαμβάνεται ένα διάστημα εμπιστοσύνης με επίπεδο εμπιστοσύνης 100(1 – α)% ή, απλά, ένα επίπεδο σημαντικότητας του α, του οποίου το κατώτερο και το ανώτερο όριο είναι LI και LS, αντίστοιχα. Δηλαδή:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Ανάλογα με το πρόσημο των ορίων που λαμβάνονται, μπορούμε να καταλήξουμε σε διαφορετικά συμπεράσματα σχετικά με τη διαφορά μεταξύ των δύο αναλογιών πληθυσμού:

  • Εάν και το κάτω και το ανώτερο όριο είναι αρνητικά, τότε μπορούμε να πούμε, με επίπεδο εμπιστοσύνης 100(1 – α)%, ότι η αναλογία στον πληθυσμό 2 είναι μεγαλύτερη από την αντίστοιχη αναλογία στον πληθυσμό 1. Δηλαδή, μπορούμε να πούμε ότι P 1 < P 2 ή ότι P 2 > P 1 .
  • Εάν το κατώτερο όριο είναι αρνητικό και το ανώτερο όριο θετικό, και επομένως το διάστημα εμπιστοσύνης περιέχει μηδέν, τότε μπορούμε να πούμε, με επίπεδο εμπιστοσύνης 100(1 – α)%, ότι δεν υπάρχει διαφορά μεταξύ των δύο αναλογίες πληθυσμού . Δηλαδή, συμπεραίνεται ότι P 1 = P 2 .
  • Τέλος, εάν και το κάτω και το άνω όριο είναι θετικά, τότε μπορούμε να πούμε, με επίπεδο εμπιστοσύνης 100(1 – α)%, ότι η αναλογία πληθυσμού 1 είναι μεγαλύτερη από την αντίστοιχη αναλογία πληθυσμού 2. Δηλαδή, συμπεραίνουμε ότι P 1 > P 2 .

Παράδειγμα υπολογισμού του διαστήματος εμπιστοσύνης για δύο αναλογίες πληθυσμού

δήλωση

Ας υποθέσουμε ότι διεξήχθη μια έρευνα σε ένα τυχαίο δείγμα 250 Μεξικανών φοιτητών μηχανικών για να διαπιστωθεί ποιο ποσοστό από αυτούς κατέκτησε την έννοια των διαστημάτων εμπιστοσύνης. Τα αποτελέσματα της έρευνας έδειξαν ότι το 64,8% από αυτούς δεν την κυριαρχεί, ενώ οι υπόλοιποι την κυριαρχούν. Από την άλλη, η ίδια έρευνα πραγματοποιήθηκε σε δείγμα 180 Ισπανών φοιτητών μηχανικών, στους οποίους 54 φοιτητές απάντησαν ότι είχαν κατακτήσει την έννοια των διαστημάτων εμπιστοσύνης.

Υπάρχει διαφορά μεταξύ των αναλογιών Ισπανών και Μεξικανών μαθητών που κατέχουν την έννοια των διαστημάτων εμπιστοσύνης, σε επίπεδο σημαντικότητας 0,05;

Λύση

Όπως μπορούμε να δούμε από την ερώτηση, αυτό που θέλουμε είναι να προσδιορίσουμε εάν υπάρχει ή όχι διαφορά μεταξύ των αναλογιών δύο διαφορετικών πληθυσμών. Το ποσοστό ενδιαφέροντος αποτελείται από το ποσοστό των μαθητών που κατακτούν την έννοια των διαστημάτων εμπιστοσύνης, έτσι ώστε, στην περίπτωση αυτή, η καταφατική απάντηση στην έρευνα αντιπροσωπεύει επιτυχία από την άποψη του διωνυμικού πειράματος.

Για τον πληθυσμό των Μεξικανών μαθητών, το δείγμα ήταν 250 μαθητές και αναφέρουν ότι το ποσοστό των μαθητών που δεν κατακτούν το εν λόγω μάθημα είναι 64,8%. Δεν είναι όμως αυτή η αναλογία που θέλουμε, αφού το να μην κατακτήσεις το θέμα είναι αποτυχία. Επομένως, αυτή η αναλογία αντιστοιχεί στο συμπλήρωμα q . Λαμβάνοντας υπόψη αυτό, το ποσοστό των επιτυχιών, p, για το δείγμα των Μεξικανών μαθητών είναι:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Από την άλλη πλευρά, στην περίπτωση του δείγματος των Ισπανών μαθητών, έχουμε τον αριθμό των επιτυχιών και το συνολικό μέγεθος του δείγματος, επομένως το ποσοστό των επιτυχιών θα είναι:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Αυτά τα αποτελέσματα συνοψίζονται στον παρακάτω πίνακα.

Μεξικανοί φοιτητές Ισπανοί φοιτητές
n MEX = 250 nESP = 180
p MEX = 0,352 p ESP = 0,300

Όπως μπορούμε να δούμε, και τα δύο μεγέθη δειγμάτων είναι σημαντικά μεγαλύτερα από 30, επομένως θεωρούνται μεγάλα δείγματα. Επιπλέον, ούτε η αναλογία των Μεξικανών μαθητών ούτε αυτή των Ισπανών φοιτητών πλησιάζει σημαντικά το 0 ή 1. Τέλος, παρά το γεγονός ότι η δήλωση δεν το προσδιορίζει, μπορούμε να υποθέσουμε ότι και τα δύο δείγματα είναι ανεξάρτητα το ένα από το άλλο.

Υπό αυτές τις συνθήκες, μπορούμε να πούμε ότι τόσο οι αναλογίες δείγματος και των δύο πληθυσμών όσο και η διαφορά στις αναλογίες του δείγματος θα ακολουθήσουν μια κανονική κατανομή. Επομένως, μπορούμε να χρησιμοποιήσουμε την προηγούμενη εξίσωση για να προσδιορίσουμε το διάστημα εμπιστοσύνης, το οποίο θα είναι:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Σημειώστε ότι, για να καθορίσουμε το διάστημα εμπιστοσύνης, χρειαζόμαστε την τιμή του Z για το μισό του δεδομένου επιπέδου σημαντικότητας, που σε αυτή την περίπτωση είναι α = 0,05. Δηλαδή πρέπει να βρούμε Z α/2 = Z 0,05/2 = Z 0,025 . Αυτή η τιμή μπορεί να βρεθεί σε έναν τυπικό πίνακα κανονικής διανομής, χρησιμοποιώντας μια εφαρμογή στατιστικών στοιχείων για κινητά ή χρησιμοποιώντας ένα υπολογιστικό φύλλο όπως το Excel για Windows ή το Numbers για MacOS.

Σε αυτήν την περίπτωση, Z 0,025 = 1,959964. Έτσι, το διάστημα εμπιστοσύνης θα είναι:

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού

Όπως μπορούμε να δούμε, το διάστημα εμπιστοσύνης που υπολογίζεται με αυτόν τον τρόπο περιέχει μηδέν, γι’ αυτό και συμπεραίνεται, με επίπεδο εμπιστοσύνης 95%, ότι δεν υπάρχει σημαντική διαφορά μεταξύ των αναλογιών των Μεξικανών και Ισπανών μαθητών που κατέχουν την έννοια των διαστημάτων αξιόπιστος.

βιβλιογραφικές αναφορές

Cetinkaya-Rundel, M. (2012, 13 Μαρτίου). Διάλεξη 14: Μεγάλο και μικρό δείγμα συμπερασμάτων για αναλογίες . Τμήμα Στατιστικής Επιστήμης στο Πανεπιστήμιο Duke. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

del Rio, AQ (2019, 1 Σεπτεμβρίου). 7.8 Διάστημα εμπιστοσύνης για τη διαφορά στις αναλογίες. | Βασικές στατιστικές με γλυκόζη . Κάντε κράτηση. https://bookdown.org/aquintela/EBE/ trust-interval-for-the-difference-of-proportions-.html

Holmes, A., Illowsky, B., & Dean, S. (2017, 29 Νοεμβρίου). 10.4 Σύγκριση δύο ανεξάρτητων αναλογιών πληθυσμού – Εισαγωγικές στατιστικές επιχειρήσεων . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020, 7 Μαΐου). RPubs – Διαστήματα εμπιστοσύνης για τη διαφορά δύο αναλογιών πληθυσμού . RPubs. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

Στατολόγοι. (ν). Διάστημα εμπιστοσύνης για τη διαφορά αναλογιών . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/

-Διαφήμιση-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados