Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Στην περιγραφική στατιστική υπάρχει μια σειρά από μέτρα που μας επιτρέπουν να παρατηρούμε διαφορετικές γενικές πτυχές των δεδομένων ενός πληθυσμού. Ορισμένα χρησιμοποιούνται για τη μέτρηση της κεντρικής τάσης των δεδομένων, ενώ άλλα επιδιώκουν να δώσουν μια ιδέα για τη μεταβλητότητα ή τη διασπορά των δεδομένων, δηλαδή τον τρόπο με τον οποίο τα δεδομένα κατανέμονται γύρω από την εν λόγω κεντρική τάση.

Δύο σημαντικά μέτρα μεταβλητότητας ή διασποράς είναι η διακύμανση και η τυπική απόκλιση. Αυτά τα δύο μέτρα συνδέονται στενά μεταξύ τους, ωστόσο, υπάρχουν δύο εκδοχές της διακύμανσης και δύο αντίστοιχες εκδοχές της τυπικής απόκλισης, δηλαδή ο πληθυσμός και το δείγμα.

Πληθυσμός έναντι δειγμάτων στατιστικών περιλήψεων

Αξίζει να σημειωθεί ένα γεγονός μεγάλης σημασίας και αυτό είναι ότι, στις στατιστικές, υπάρχουν γενικά δύο εκδοχές καθενός από τα μέτρα που συνοψίζουν τη συμπεριφορά μιας σειράς δεδομένων και που χρησιμοποιούνται σε διαφορετικά πλαίσια.

Αρχικά, πρέπει να διακρίνουμε τα δεδομένα από έναν πληθυσμό (ή δεδομένα πληθυσμού) και τα δεδομένα από ένα υποσύνολο αυτού του πληθυσμού, που ονομάζεται δείγμα. Αν και τα δεδομένα του πληθυσμού και τα δεδομένα του δείγματος είναι μαθηματικά δυσδιάκριτα, εννοιολογικά είναι πολύ διαφορετικά.

απογραφές πληθυσμού

Τα δεδομένα πληθυσμού είναι δεδομένα που λαμβάνονται μέσω στατιστικής απογραφής, δηλαδή μέτρησης ή ανάλυσης κάθε στοιχείου ή ατόμου που συνθέτει έναν πληθυσμό (εφόσον είναι πεπερασμένο, φυσικά). Όταν υπολογίζουμε μέτρα κεντρικής τάσης ή διασποράς για δεδομένα πληθυσμού, λαμβάνουμε μέτρα που συνοψίζουν τη γενική συμπεριφορά του πληθυσμού, που ονομάζουμε παραμέτρους πληθυσμού και τα οποία είναι σταθερές τιμές για έναν πληθυσμό (δηλαδή, ένας πληθυσμός έχει μόνο έναν μέσο όρο , μία λειτουργία, μία τυπική απόκλιση, κ.λπ. σε μια δεδομένη στιγμή). Σε αυτήν την περίπτωση, χρησιμοποιούμε περιγραφικά στατιστικά στοιχεία .

Δειγματοληψία

Από την άλλη πλευρά, σε πολλές διαφορετικές καταστάσεις πραγματοποιούμε μια διαδικασία δειγματοληψίας για να αναλύσουμε μόνο ορισμένα στοιχεία του πληθυσμού, λαμβάνοντας έτσι δειγματοληπτικά δεδομένα. Σε αυτές τις περιπτώσεις, μπορούμε επίσης να χρησιμοποιήσουμε τα εργαλεία περιγραφικής στατιστικής για να παρατηρήσουμε τη γενική συμπεριφορά αυτών των δεδομένων, ωστόσο, στην πραγματικότητα δεν κάνουμε περιγραφικές στατιστικές για τον πληθυσμό, μόνο για το δείγμα.

Οι αριθμητικές περιλήψεις του δείγματος δεν είναι παράμετροι, αλλά ονομάζονται στατιστικές (αν και κάποιοι τις ονομάζουν και στατιστικές). Σε αντίθεση με τις παραμέτρους, τα στατιστικά στοιχεία διαφέρουν από δείγμα σε δείγμα , ακόμα κι αν τα δείγματα προέρχονται από τον ίδιο πληθυσμό. Αυτό συμβαίνει επειδή, κατά την επιλογή ενός υποσυνόλου του πληθυσμού, υπάρχουν πολλοί πιθανοί συνδυασμοί στοιχείων που μπορούν να αποτελέσουν το δείγμα. Για το λόγο αυτό, σε γενικές γραμμές, τα δείγματα αποτελούνται από διαφορετικά υποκείμενα, άτομα ή στοιχεία, γεγονός που οδηγεί σε διαφορετικά στατιστικά στοιχεία.

Ο απώτερος στόχος του υπολογισμού αυτών των στατιστικών στο δείγμα είναι να μπορέσουμε να τις χρησιμοποιήσουμε ως εκτιμητές των αντίστοιχων παραμέτρων του πληθυσμού. Αυτή η διαδικασία συναγωγής ή εκτίμησης της συμπεριφοράς των δεδομένων πληθυσμού από δειγματοληπτικά δεδομένα είναι αυτή για την οποία ευθύνονται οι στατιστικές συμπερασμάτων . Αυτό κάνει τον πληθυσμό και τις διακυμάνσεις του δείγματος και τις τυπικές αποκλίσεις ουσιαστικά διαφορετικές.

Τι είναι όμως ακριβώς η διακύμανση και η τυπική απόκλιση;

Ποια είναι η διακύμανση;

Η διακύμανση είναι ένα μέτρο διασποράς από το μέσο όρο ενός συνόλου δεδομένων. Ορίζεται ως ο μέσος όρος των τετραγωνικών αποκλίσεων όλων των δεδομένων από τον μέσο όρο. Όντας μέσος όρος τετραγωνικών διαφορών, είναι πάντα θετική ποσότητα.

Ποια είναι η τυπική απόκλιση;

Από την άλλη πλευρά, η τυπική απόκλιση είναι απλώς η θετική τετραγωνική ρίζα της διακύμανσης. Μετρά επίσης τη διασπορά γύρω από τον μέσο όρο, μόνο που το κάνει ως προς τις ίδιες μονάδες των δεδομένων και το μέσο όρο. Αυτό καθιστά ευκολότερη την κατανόηση και την ερμηνεία από τη διακύμανση.

Εφόσον η τυπική απόκλιση υπολογίζεται ως η τετραγωνική ρίζα της διακύμανσης, δεν έχει νόημα να μιλάμε για τον πληθυσμό και την τυπική απόκλιση του δείγματος χωρίς να μιλάμε για τη διακύμανση του πληθυσμού και του δείγματος.

Οι πιο σημαντικές διαφορές μεταξύ αυτών των κοινών μέτρων διασποράς γύρω από τον μέσο όρο θα περιγραφούν λεπτομερώς στις επόμενες ενότητες.

Διαφορά 1: Ο πληθυσμός και οι τυπικές αποκλίσεις και οι αποκλίσεις του δείγματος αντιπροσωπεύονται με διαφορετικά σύμβολα

Η πρώτη διαφορά που πρέπει να ληφθεί υπόψη κατά τη σύγκριση του πληθυσμού και της διακύμανσης του δείγματος και της τυπικής απόκλισης πληθυσμού και δείγματος είναι το σύμβολο που χρησιμοποιείται για την αναπαράστασή τους. Στις στατιστικές, οι αριθμητικές περιλήψεις ή οι παράμετροι του πληθυσμού συνήθως αντιπροσωπεύονται με ελληνικά γράμματα , ενώ οι δειγματοληπτικές ή στατιστικές εκδόσεις αντιπροσωπεύονται με τα ισοδύναμα γράμματα του λατινικού αλφαβήτου .

Υπό αυτή την έννοια, η διακύμανση και η τυπική απόκλιση του πληθυσμού συνδέονται και τα δύο με το πεζό ελληνικό γράμμα σίγμα, ενώ οι εκδόσεις του δείγματος αντιπροσωπεύονται από το γράμμα s . Δηλαδή η διακύμανση του πληθυσμού είναι σ 2 και η τυπική απόκλιση πληθυσμού είναι σ , ενώ η διακύμανση του δείγματος αντιπροσωπεύεται από το s 2 και η τυπική απόκλιση του δείγματος με το s .

Διαφορά 2: Υπολογίζονται με διαφορετικούς τύπους

Τόσο ο πληθυσμός όσο και η τυπική απόκλιση του δείγματος υπολογίζονται ως η θετική τετραγωνική ρίζα της αντίστοιχης διακύμανσης, δηλαδή:

Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Ωστόσο, ο πληθυσμός και οι διακυμάνσεις του δείγματος υπολογίζονται χρησιμοποιώντας ελαφρώς διαφορετικούς τύπους. Στην περίπτωση της διακύμανσης του πληθυσμού, αυτή υπολογίζεται ως ο μέσος όρος των τετραγωνικών αποκλίσεων κάθε δεδομένου ως προς τον μέσο όρο του πληθυσμού. Δηλαδή, υπολογίζεται με μία από τις ακόλουθες ισοδύναμες εκφράσεις:

Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Όπου το x i αντιπροσωπεύει την τιμή κάθε στοιχείου δεδομένων στον πληθυσμό, το μ αντιπροσωπεύει τον μέσο όρο του πληθυσμού και το N είναι το μέγεθος του πληθυσμού. Επομένως, η τυπική απόκλιση πληθυσμού υπολογίζεται ως:

Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Αντίθετα, αντί να διαιρεθεί με τον αριθμό των σημείων δεδομένων, n , όπως θα αναμενόταν, η διακύμανση του δείγματος υπολογίζεται διαιρώντας το άθροισμα των τετραγώνων αποκλίσεων από τη μέση τιμή του δείγματος με n – 1 . Με άλλα λόγια, η διακύμανση του δείγματος υπολογίζεται ως εξής:

Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Όπου το x i αντιπροσωπεύει την τιμή κάθε στοιχείου δεδομένων στο δείγμα, το x αντιπροσωπεύει τον μέσο όρο του δείγματος και το n είναι το μέγεθος του δείγματος. Με βάση τα παραπάνω, η τυπική απόκλιση του δείγματος υπολογίζεται ως:

Διαφορές μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Αιτιολόγηση διαίρεσης με n – 1 αντί για n

Ένα κοινό ερώτημα που προκύπτει κατά τη σύγκριση των τυπικών αποκλίσεων πληθυσμού και δείγματος είναι γιατί να διαιρέσουμε με n – 1 και όχι με n ; Ο λόγος είναι πολύ απλός.

Όπως αναφέρθηκε προηγουμένως, ο υπολογισμός στατιστικών όπως η τυπική απόκλιση του δείγματος επιδιώκει να καθορίσει εκτιμητές που να είναι όσο το δυνατόν πιο κοντά στις αντίστοιχες παραμέτρους του πληθυσμού. Αυτό σημαίνει ότι η τυπική απόκλιση του δείγματος θα πρέπει να υπολογίζεται με τέτοιο τρόπο ώστε το αποτέλεσμα να είναι όσο το δυνατόν πιο κοντά στην τυπική απόκλιση του πληθυσμού.

Αυτό υποδηλώνει ότι πρέπει να υπολογίζονται με ισοδύναμους τύπους, αλλά αυτό δεν συμβαίνει πάντα. Το πρόβλημα είναι ότι η τυπική απόκλιση του δείγματος μετρά την εξάπλωση γύρω από τη μέση τιμή του δείγματος, όχι τη μέση τιμή του πληθυσμού. Αν και ο μέσος όρος του δείγματος είναι μια στατιστική που χρησιμοποιείται ως εκτιμητής του μέσου όρου του πληθυσμού, δεν είναι ακριβώς ίσος με αυτόν. Αυτό έχει ως αποτέλεσμα οι μεμονωμένες τιμές σε κάθε δείγμα να είναι πιο κοντά στον μέσο όρο του δείγματος (που είναι, στην πραγματικότητα, το μέτρο της κεντρικής τάσης για αυτά τα δεδομένα) παρά στο μέσο όρο του πληθυσμού. Λόγω,

Για να διορθωθεί αυτή η απόκλιση, αφαιρείται μία μονάδα από τον παρονομαστή για να γίνει η τυπική απόκλιση του δείγματος μεγαλύτερη και επομένως πιο κοντά στην τυπική απόκλιση του πληθυσμού.

Διαφορά 3: Σπάνια είναι ίδια

Ανεξάρτητα από τις διορθώσεις που μπορούν να γίνουν στην τυπική απόκλιση του δείγματος, σπάνια είναι ίση με την τυπική απόκλιση του πληθυσμού. Αυτό συμβαίνει επειδή, μέσα σε έναν πληθυσμό, τα δεδομένα μπορεί να διαφέρουν τυχαία, επομένως διαφορετικά δείγματα θα έχουν ως αποτέλεσμα διαφορετικές τυπικές αποκλίσεις του δείγματος. Στην πραγματικότητα, υπάρχει μια ολόκληρη κατανομή των πιθανών τιμών των τυπικών αποκλίσεων του δείγματος ανάλογα με το μέγεθος του δείγματος.

Διαφορά 4: Η τυπική απόκλιση του δείγματος μπορεί πάντα να είναι γνωστή ή να προσδιοριστεί, ενώ η τυπική απόκλιση πληθυσμού δεν είναι σχεδόν ποτέ γνωστή με βεβαιότητα.

Μια άλλη σημαντική διαφορά μεταξύ αυτών των δύο μέτρων διασποράς είναι ότι η τυπική απόκλιση πληθυσμού (και μάλιστα οποιαδήποτε παράμετρος πληθυσμού) είναι σπάνια γνωστή. Αυτό οφείλεται, σε ορισμένες περιπτώσεις, σε τεχνικούς ή οικονομικούς περιορισμούς, καθώς είναι πολύ ακριβό και, επιπλέον, είναι απίθανο να είναι σε θέση να μετρήσει απολύτως όλα τα δεδομένα ενός πληθυσμού. Σε άλλες περιπτώσεις, ο προσδιορισμός των παραμέτρων πληθυσμού είναι απλώς αδύνατος, είτε επειδή ο πληθυσμός είναι άπειρος, είτε απλώς επειδή δεν έχουμε πρόσβαση σε όλα τα στοιχεία που τον αποτελούν.

Με άλλα λόγια, σχεδόν ποτέ δεν γνωρίζουμε όλες τις τιμές N του x i σε έναν πληθυσμό, καθιστώντας αδύνατο τον υπολογισμό του μέσου όρου του πληθυσμού, της διακύμανσης και, κατ’ επέκταση, της τυπικής απόκλισης. Το καλύτερο που μπορούμε να μάθουμε είναι μια σημειακή εκτίμηση μιας παραμέτρου όπως η τυπική απόκλιση ή ένα διάστημα τιμών μέσα στο οποίο έχουμε κάποιο επίπεδο εμπιστοσύνης ότι βρίσκεται η τυπική απόκλιση ή άλλη παράμετρος πληθυσμού.

Στην περίπτωση των δειγμάτων, από την άλλη πλευρά, γνωρίζουμε όλα τα δεδομένα, επομένως μπορούμε πάντα να υπολογίζουμε την τυπική απόκλιση οποιουδήποτε δείγματος, ανεξάρτητα από το μέγεθός του.

Σύνοψη διαφορών μεταξύ τυπικών αποκλίσεων πληθυσμού και δείγματος

Ο παρακάτω πίνακας συνοψίζει τις διαφορές μεταξύ της τυπικής απόκλισης πληθυσμού και της τυπικής απόκλισης του δείγματος που συζητήθηκε στις προηγούμενες ενότητες:

Χαρακτηριστικό γνώρισμα Τυπική απόκλιση πληθυσμού Δείγμα τυπικής απόκλισης
Σύμβολο σ Ναί
Υπολογίζεται για πληθυσμιακά δεδομένα δειγμα δεδομένων
Κλάδος στατιστικών στον οποίο χρησιμοποιείται Περιγραφικά στατιστικά επαγωγική στατιστική
Είδος μέτρου Παράμετρος Στατιστικός
Τύπος Διαιρέστε με το N, το μέγεθος του πληθυσμού Διαιρέστε με n – 1, όπου n είναι το μέγεθος του δείγματος
Μεταβλητότητα Είναι σταθερό για έναν δεδομένο πληθυσμό σε μια δεδομένη στιγμή Διαφέρει από δείγμα σε δείγμα, ανεξάρτητα από το αν τα δείγματα είναι του ίδιου μεγέθους και προέρχονται από τον ίδιο πληθυσμό
Βεβαιότητα στην αξία του Γενικά είναι άγνωστο. Μόνο μια εκτίμηση του είναι διαθέσιμη. Είναι γνωστό για κάθε δείγμα

βιβλιογραφικές αναφορές

κοινοτικά κέντρα μάθησης. (ν). Η Τυπική Απόκλιση . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R. (sf). Ποια είναι η διαφορά μεταξύ της τυπικής απόκλισης του δείγματος και του πληθυσμού . Η φωνή. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, 1 Ιανουαρίου). Διακύμανση και τυπική απόκλιση, παραδείγματα και ασκήσεις . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Μολίνα, Μ. (2016, 27 Ιανουαρίου). Γιατί να διαθέσω ένα; Εκτίμηση παραμέτρων πληθυσμού . Καθιστώ αναίσθητο. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26 Οκτωβρίου). Τυπική ή τυπική απόκλιση . Universe Formulas. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Διαφήμιση-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados