Ποια είναι η σύνοψη πέντε αριθμών στα στατιστικά;

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Η περιγραφική στατιστική μας επιτρέπει να συνοψίσουμε ένα σύνολο δεδομένων σε μικρό αριθμό αριθμών ή μετρήσεων που χρησιμεύουν για να περιγράψουν τον τρόπο διανομής αυτών των δεδομένων. Υπάρχουν διάφορα μέτρα που χρησιμεύουν για την περιγραφή της κεντρικής τάσης των δεδομένων, της διασποράς τους και του σχήματος των καμπυλών κατανομής, μερικά από τα οποία βρίσκονται στην πενταριθμητική περίληψη.

Ποια είναι η περίληψη των πέντε αριθμών;

Με βάση τα παραπάνω, η σύνοψη πέντε αριθμών μπορεί να οριστεί ως ένα σύνολο πέντε μέτρων ή στατιστικών που σχετίζονται με ένα σύνολο δεδομένων που επιτρέπουν την περιγραφή με πολύ απλό τρόπο του πλάτους του συνόλου, της διασποράς του. Παρέχει επίσης ένα μέτρο της κεντρικής του τάσης. Επιπλέον, η σύνοψη των πέντε αριθμών μπορεί επίσης να αναπαρασταθεί γραφικά, καθιστώντας εύκολη την οπτικοποίηση αυτών των χαρακτηριστικών ενός συνόλου δεδομένων, ενώ επιτρέπει την εύκολη σύγκριση με άλλα σχετικά σύνολα δεδομένων.

Ποιοι είναι οι πέντε αριθμοί και τι σημαίνουν;

Η σύνοψη πέντε αριθμών αποτελείται από την ελάχιστη τιμή, τα τρία τεταρτημόρια και τη μέγιστη τιμή μιας σειράς στατιστικών δεδομένων. Τα τεταρτημόρια είναι εκείνα τα δεδομένα ή οι τιμές που διαιρούν το ταξινομημένο σύνολο όλων των δεδομένων σε τέσσερις υποομάδες με τον ίδιο αριθμό στοιχείων . Έτσι, εάν έχουμε ένα σύνολο 100 δεδομένων, τα τεταρτημόρια είναι εκείνα τα δεδομένα ή οι τιμές που χωρίζουν το σύνολο σε 4 υποσύνολα των 25 δεδομένων το καθένα.

Τα τεταρτημόρια ονομάζονται με τη σειρά με την οποία εμφανίζονται, από το χαμηλότερο προς το υψηλότερο, όπως το πρώτο, το δεύτερο και το τρίτο τεταρτημόριο. Επιπλέον, αντιπροσωπεύονται με το κεφαλαίο γράμμα Q ακολουθούμενο από τον αριθμό που υποδηλώνει τη σειρά τους. Με τον ορισμό του, το δεύτερο τεταρτημόριο, το Q2, είναι επίσης γνωστό ως διάμεσος ή μέσος των δεδομένων . Δεν πρέπει να συγχέεται με τον μέσο όρο, που είναι ο αριθμητικός μέσος όρος των δεδομένων.

Εκτός από τα τρία τεταρτημόρια (Q1, Q2 και Q3), η σύνοψη με πέντε αριθμούς περιλαμβάνει επίσης την ελάχιστη τιμή των δεδομένων, με σειρά από το μικρότερο προς το μεγαλύτερο, και τη μέγιστη τιμή. Με άλλα λόγια, οι πέντε αριθμοί σε αυτήν την περίληψη είναι:

  • Ελάχιστο.– Είναι η πρώτη τιμή ενός συνόλου στατιστικών δεδομένων ταξινομημένων από το χαμηλότερο στο υψηλότερο. Είναι τα δεδομένα χαμηλότερης τιμής.
  • Q1 ή πρώτο τεταρτημόριο.– Είναι τα δεδομένα ή η τιμή που διαιρεί το σύνολο δεδομένων, αφήνοντας το 25% (ή το ένα τέταρτο) από αυτά κάτω και το άλλο 75% πάνω.
  • Q2 ή δεύτερο τεταρτημόριο.– Είναι τα δεδομένα ή η τιμή που χωρίζει το σύνολο δεδομένων σε δύο ίσες ομάδες. Δηλαδή, είναι η τιμή που αφήνει το 50% των δεδομένων τόσο κάτω όσο και πάνω από αυτό, άρα αντιπροσωπεύει και τη διάμεσο ή το μέσο των δεδομένων.
  • Q3 ή τρίτο τεταρτημόριο.– Αυτά είναι τα δεδομένα ή η τιμή που αφήνει το 75% ή τα τρία τέταρτα των δεδομένων παρακάτω και το άλλο 25% πάνω.
  • Maximum.– Όπως υποδηλώνει το όνομά του, είναι τα δεδομένα με την υψηλότερη τιμή από ολόκληρη τη σειρά δεδομένων. Δηλαδή, είναι τα τελευταία δεδομένα όταν ταξινομούνται από το χαμηλότερο στο υψηλότερο.

Κατά την ερμηνεία της σύνοψης πέντε αριθμών, η διαφορά μεταξύ της ελάχιστης και της μέγιστης τιμής παρέχει αυτό που είναι γνωστό ως πλάτος της σειράς δεδομένων. Από την άλλη πλευρά, η διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου, που ονομάζεται Interquartile Range (RIC), μας δείχνει πόσο διασκορπισμένα είναι τα δεδομένα, αφού υποδεικνύει το εύρος τιμών που περιέχει το 50% των κεντρικών δεδομένων.

Από την άλλη πλευρά, το δεύτερο τεταρτημόριο ή διάμεσος είναι ένα μέτρο της κεντρικής τάσης που μπορεί να χρησιμοποιηθεί για να αναπαραστήσει την τιμή όλων των δεδομένων της σειράς σε έναν μόνο αριθμό. Αν και ο μέσος όρος χρησιμοποιείται συχνά ως μέτρο της κεντρικής τάσης σε πολλές καταστάσεις, ο διάμεσος προσφέρει το πλεονέκτημα ότι δεν είναι ευαίσθητος σε ακραίες τιμές (πολύ υψηλές ή πολύ χαμηλές).

Πλαίσια γραφήματα: η γραφική αναπαράσταση της περίληψης πέντε αριθμών

Ένας πρακτικός τρόπος για να απεικονίσετε μια σύνοψη πέντε αριθμών είναι μέσω αυτού που ονομάζεται διάγραμμα πλαισίου ή Διάγραμμα πλαισίου . Σε αυτόν τον τύπο αναπαράστασης, το διατεταρτημόριο (IQR) αναπαρίσταται ως ένα ορθογώνιο ή πλαίσιο που εκτείνεται από το Q1 έως το Q3 και διαιρείται στα δύο με μια γραμμή κάθετη στον άξονα μέτρησης που βρίσκεται στο Q2, δηλαδή στη διάμεσο.

Τέλος, σε κάθε πλευρά του κιβωτίου σχεδιάζονται γραμμές παράλληλες με τον άξονα μέτρησης που εκτείνονται από το ελάχιστο έως το Q1 και από το Q3 στο μέγιστο, εφόσον το ελάχιστο και το μέγιστο δεν υπερβαίνουν το 1,5.RIC απόστασης προς τα αριστερά και δικαίωμα του Q1 και του Q3, αντίστοιχα. Αυτές οι πλευρικές γραμμές είναι γνωστές ως τα μουστάκια του κουτιού. Εάν υπάρχουν δεδομένα εκτός του εύρους που οριοθετείται από Q1 – 1.5.RIC και Q3 + 1.5.RIC, τότε οι πλευρές (μερικές φορές ονομάζονται μουστάκια) επεκτείνονται μέχρι τα δεδομένα που βρίσκονται πιο μακριά από το πλαίσιο που βρίσκεται μέσα σε αυτό το εύρος και οι υπόλοιπες σημειώνονται ως ακραίες τιμές.

Παράδειγμα προετοιμασίας της περίληψης πέντε αριθμών για μια σειρά δεδομένων

Στη συνέχεια, παρουσιάζεται, βήμα προς βήμα, η διαδικασία για την επεξεργασία μιας περίληψης πέντε αριθμών από ένα σύνολο στατιστικών δεδομένων. Επιπλέον, εξηγεί πώς να δημιουργήσετε την γραφική παράσταση πλαισίου για την απεικόνιση αυτής της περίληψης σε γραφική μορφή.

Τα δεδομένα αντιστοιχούν στον αριθμό των ειδών που πωλήθηκαν στο γυναικείο τμήμα ενός πολυκαταστήματος κατά τη διάρκεια μιας περιόδου 10 εβδομάδων. Τα αποτελέσματα της μελέτης παρουσιάζονται παρακάτω:

Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σάββατο Κυριακή
Εβδομάδα 1 158 145 156 156 164 167 147
εβδομάδα 2 161 146 157 152 162 160 153
Εβδομάδα 3 152 150 157 155 164 166 152
εβδομάδα 4 150 149 153 162 169 162 149
εβδομάδα 5 157 152 154 155 168 161 155
εβδομάδα 6 157 145 160 164 164 168 149
εβδομάδα 7 160 152 151 152 168 163 145
εβδομάδα 8 157 152 155 156 162 169 155
εβδομάδα 9 160 148 157 150 164 170 154
εβδομάδα 10 158 146 163 158 165 169 150

Βήμα 1: Ταξινομήστε όλα τα δεδομένα από το μικρότερο στο μεγαλύτερο και αντιστοιχίστε τους ένα ευρετήριο που ξεκινά από το 1.

Το αποτέλεσμα αυτού του βήματος παρουσιάζεται παρακάτω:

Δείκτης Αξία Δείκτης Αξία Δείκτης Αξία Δείκτης Αξία
1 145 22 152 43 158 64 168
2 145 23 153 44 160 65 168
3 145 24 153 Τέσσερα πέντε 160 66 168
4 146 25 154 46 160 67 169
5 146 26 154 47 160 68 169
6 147 27 155 48 161 69 169
7 148 28 155 49 161 70 170
8 149 29 155 πενήντα 162
9 149 30 155 51 162
10 149 31 155 52 162
έντεκα 150 32 156 53 162
12 150 33 156 54 163
13 150 3. 4 156 55 163
14 150 35 157 56 164
δεκαπέντε 151 36 157 57 164
16 152 37 157 58 164
17 152 38 157 59 164
18 152 39 157 60 164
19 152 40 157 61 165
είκοσι 152 41 158 62 166
είκοσι ένα 152 42 158 63 167

Βήμα 2: Προσδιορίστε τα τεταρτημόρια Q1 και Q3

Για να προσδιορίσουμε τα τεταρτημόρια Q1, Q2 και Q3, ξεκινάμε με τον υπολογισμό ενός δείκτη για τα δεδομένα που αντιστοιχούν σε κάθε τεταρτημόριο. Ο τύπος είναι ο εξής:

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Όπου N είναι ο συνολικός αριθμός δεδομένων. Αυτός ο υπολογισμός μπορεί να είναι ακέραιος ή όχι, επομένως η διαδικασία χωρίζεται σε δύο περιπτώσεις:

Περίπτωση 1: Ακέραιο αποτέλεσμα

Εάν το αποτέλεσμα είναι ακέραιος, τότε το αντίστοιχο τεταρτημόριο θα είναι η τιμή των δεδομένων στα οποία αντιστοιχεί ο δείκτης. Για παράδειγμα, εάν ο δείκτης του Q1 δίνει 10, αυτό σημαίνει ότι το Q1 θα είναι η τιμή του αριθμού δεδομένων 10 (149 στο παράδειγμά μας).

Περίπτωση 2: Δεκαδικό αποτέλεσμα

Εάν ο δείκτης είναι δεκαδικός αριθμός, τότε το τεταρτημόριο δεν θα αντιστοιχεί ακριβώς σε κανένα από τα δεδομένα που υπάρχουν στη σειρά. Σε αυτήν την περίπτωση, το αποτέλεσμα στρογγυλοποιείται προς τα κάτω και το τεταρτημόριο υπολογίζεται από αυτά τα δεδομένα και αυτό που το ακολουθεί, χρησιμοποιώντας τον ακόλουθο τύπο:

Περίληψη Πέντε Αριθμών

Όπου d αντιπροσωπεύει το δεκαδικό μέρος του δείκτη, x i είναι τα δεδομένα με τον δείκτη στρογγυλοποιημένο προς τα κάτω και x i+1 είναι το επόμενο σημείο δεδομένων.

Στην περίπτωση του παραδείγματός μας, αυτό είναι το αποτέλεσμα του υπολογισμού των δεικτών των τριών τεταρτημορίων:

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Σε όλες τις περιπτώσεις το αποτέλεσμα ήταν ένας δεκαδικός αριθμός, οπότε τώρα εφαρμόζουμε τον τύπο από την περίπτωση 2 για να προσδιορίσουμε την τιμή κάθε τεταρτημορίου:

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Βήμα 3: Προσδιορίστε τους πέντε αριθμούς

Τώρα που έχουμε ταξινομήσει τα δεδομένα και προσδιορίσαμε επίσης τις τιμές των τριών τεταρτημορίων, η σύνοψη των πέντε αριθμών είναι:

Ελάχιστο: 145
Ε1: 152
Q2 ή διάμεσος: 157
Ε3: 162,25
Ανώτατο όριο: 170

Βήμα 4: Κατασκευάστε το πλαίσιο

Έχουμε ήδη όλα τα απαραίτητα για την κατασκευή του boxplot εκτός από το RIC. Με βάση το αποτέλεσμα που λήφθηκε στο προηγούμενο βήμα, η διαφορά μεταξύ Q3 και Q1 είναι:

Περίληψη Πέντε Αριθμών

Για να προσδιορίσουμε αν υπάρχουν ακραίες τιμές, υπολογίζουμε το Q1 – 1,5 IQR και το Q3 + 1,5 IQR και συγκρίνουμε με το ελάχιστο και το μέγιστο:

Περίληψη Πέντε Αριθμών

Περίληψη Πέντε Αριθμών

Όπως μπορούμε να δούμε, δεν υπάρχουν ακραίες τιμές αφού το ελάχιστο, 140, είναι μεγαλύτερο από 136.625. Επίσης, δεν υπάρχουν ακραίες τιμές, καθώς το μέγιστο, 170, είναι μικρότερο από 177.625.

Το παρακάτω σχήμα δείχνει το αποτέλεσμα της κατασκευής του τετραγώνου που αντιστοιχεί στο παράδειγμα:

Περίληψη Πέντε Αριθμών

βιβλιογραφικές αναφορές

Πώς να συγκεντρώσετε μια πενταψήφια περίληψη ενός στατιστικού δείγματος . (ν). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html

McAdams, D. (2009, 4 Μαρτίου). Σύνοψη πέντε αριθμών. Η ζωή είναι μια ιστορία Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html

Serra, BR (2020, 22 Νοεμβρίου). διάμεσος . Universe Formulas. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo

Serra, BR (2021, 4 Αυγούστου). τεταρτημόρια . Universe Formulas. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example

Zentica Global. (ν). Brutalk – Πώς να υπολογίσετε την περίληψη 5 αριθμών για τα δεδομένα σας στην Python . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56

-Διαφήμιση-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados