Tabla de Contenidos
Statistik deskriptif memungkinkan kita untuk meringkas kumpulan data dalam sejumlah kecil angka atau ukuran yang berfungsi untuk menggambarkan bagaimana data tersebut didistribusikan. Ada ukuran berbeda yang berfungsi untuk menggambarkan kecenderungan sentral data, penyebarannya, dan bentuk kurva distribusi, beberapa di antaranya ditemukan dalam ringkasan lima angka.
Apa ringkasan lima angka?
Berdasarkan hal di atas, ringkasan lima angka dapat didefinisikan sebagai sekumpulan lima ukuran atau statistik yang terkait dengan kumpulan data yang memungkinkan untuk menggambarkan amplitudo himpunan, dispersinya dengan cara yang sangat sederhana. Ini juga menyediakan ukuran tendensi sentralnya. Selain itu, ringkasan lima angka juga dapat direpresentasikan secara grafis, membuatnya mudah untuk memvisualisasikan karakteristik kumpulan data ini, sekaligus memungkinkannya untuk dengan mudah dibandingkan dengan kumpulan data terkait lainnya.
Apa saja lima angka tersebut dan apa artinya?
Ringkasan lima angka terdiri dari nilai minimum, tiga kuartil, dan nilai maksimum dari serangkaian data statistik. Kuartil adalah data atau nilai yang membagi kumpulan terurut dari semua data menjadi empat subgrup dengan jumlah elemen yang sama . Jadi, jika kita memiliki kumpulan 100 data, kuartil adalah data atau nilai yang membagi kumpulan tersebut menjadi 4 subkumpulan yang masing-masing terdiri dari 25 data.
Kuartil diberi nama sesuai urutan kemunculannya, dari terendah ke tertinggi, seperti kuartil pertama, kedua, dan ketiga. Selain itu, mereka diwakili oleh huruf kapital Q diikuti dengan angka yang menunjukkan posisi ordinalnya. Berdasarkan definisinya, kuartil kedua, Q2, juga dikenal sebagai median atau titik tengah data . Jangan bingung dengan rata-rata, yang merupakan rata-rata aritmatika dari data.
Selain tiga kuartil (Q1, Q2, dan Q3), ringkasan lima angka juga mencakup nilai minimum data, diurutkan dari yang terkecil hingga terbesar, dan nilai maksimum. Dengan kata lain, lima angka dalam ringkasan ini adalah:
- Minimum.– Ini adalah nilai pertama dari sekumpulan data statistik yang diurutkan dari terendah ke tertinggi. Ini adalah data nilai terendah.
- Q1 atau kuartil pertama.– Ini adalah data atau nilai yang membagi kumpulan data, menyisakan 25% (atau seperempat) di bawah dan 75% lainnya di atas.
- Q2 atau kuartil kedua.– Ini adalah data atau nilai yang membagi kumpulan data menjadi dua kelompok yang sama. Artinya, nilai yang menyisakan 50% data baik di bawah maupun di atasnya, sehingga juga mewakili median atau titik tengah data.
- Q3 atau kuartil ketiga.– Ini adalah data atau nilai yang menyisakan 75% atau tiga perempat dari data di bawah dan 25% lainnya di atas.
- Maksimum.– Seperti namanya, ini adalah data dengan nilai tertinggi dari seluruh rangkaian data. Artinya, ini adalah data terakhir yang diurutkan dari terendah ke tertinggi.
Saat menafsirkan ringkasan lima angka, perbedaan antara nilai minimum dan maksimum memberikan apa yang dikenal sebagai lebar seri data. Di sisi lain, perbedaan antara kuartil ketiga dan pertama, yang disebut Rentang Interkuartil (RIC), menunjukkan kepada kita seberapa tersebarnya data, karena ini menunjukkan rentang nilai yang mengandung 50% dari data pusat.
Di sisi lain, kuartil kedua atau median adalah ukuran tendensi sentral yang dapat digunakan untuk mewakili nilai semua data dalam deret dalam satu angka. Meskipun mean sering digunakan sebagai ukuran tendensi sentral dalam banyak situasi, median menawarkan keuntungan karena tidak sensitif terhadap nilai ekstrem (terlalu tinggi atau terlalu rendah).
Plot kotak: representasi grafis dari ringkasan lima angka
Cara praktis untuk memvisualisasikan rangkuman lima angka adalah dengan menggunakan apa yang disebut petak kotak atau Box Plot . Dalam jenis representasi ini, rentang interkuartil (IQR) direpresentasikan sebagai persegi panjang atau kotak yang memanjang dari Q1 ke Q3, dan dibagi dua oleh garis tegak lurus terhadap sumbu pengukuran yang terletak di Q2, yaitu di median.
Terakhir, pada setiap sisi kotak garis ditarik sejajar dengan sumbu pengukuran yang memanjang dari minimum ke Q1 dan dari Q3 ke maksimum, asalkan jarak minimum dan maksimum tidak lebih dari 1,5.RIC jarak ke kiri dan kanan Q1 dan Q3, masing-masing. Gurat sisi inilah yang dikenal sebagai kumis kotak. Jika ada data di luar rentang yang dibatasi oleh Q1 – 1.5.RIC dan Q3 + 1.5.RIC, maka sisi (kadang disebut kumis) meluas ke data terjauh dari kotak yang ada di dalam rentang tersebut, dan sisanya diberi tanda sebagai outlier.
Contoh penyusunan rangkuman lima angka untuk satu deret data
Selanjutnya, prosedur disajikan, langkah demi langkah, untuk penjabaran ringkasan lima angka dari satu set data statistik. Selain itu, dijelaskan juga bagaimana membangun plot kotak untuk visualisasi ringkasan ini dalam bentuk grafik.
Data sesuai dengan jumlah barang yang dijual di departemen wanita dari department store selama periode 10 minggu. Hasil penelitian disajikan di bawah ini:
Senin | Selasa | Rabu | Kamis | Jumat | Sabtu | Minggu | |
Minggu 1 | 158 | 145 | 156 | 156 | 164 | 167 | 147 |
minggu 2 | 161 | 146 | 157 | 152 | 162 | 160 | 153 |
MINGGU 3 | 152 | 150 | 157 | 155 | 164 | 166 | 152 |
minggu 4 | 150 | 149 | 153 | 162 | 169 | 162 | 149 |
minggu 5 | 157 | 152 | 154 | 155 | 168 | 161 | 155 |
minggu 6 | 157 | 145 | 160 | 164 | 164 | 168 | 149 |
minggu 7 | 160 | 152 | 151 | 152 | 168 | 163 | 145 |
minggu 8 | 157 | 152 | 155 | 156 | 162 | 169 | 155 |
minggu 9 | 160 | 148 | 157 | 150 | 164 | 170 | 154 |
minggu 10 | 158 | 146 | 163 | 158 | 165 | 169 | 150 |
Langkah 1: Urutkan semua data dari yang terkecil hingga yang terbesar dan beri mereka indeks yang dimulai dengan 1.
Hasil dari langkah ini disajikan di bawah ini:
Indeks | Bernilai | Indeks | Bernilai | Indeks | Bernilai | Indeks | Bernilai |
1 | 145 | 22 | 152 | 43 | 158 | 64 | 168 |
2 | 145 | 23 | 153 | 44 | 160 | 65 | 168 |
3 | 145 | 24 | 153 | Empat.Lima | 160 | 66 | 168 |
4 | 146 | 25 | 154 | 46 | 160 | 67 | 169 |
5 | 146 | 26 | 154 | 47 | 160 | 68 | 169 |
6 | 147 | 27 | 155 | 48 | 161 | 69 | 169 |
7 | 148 | 28 | 155 | 49 | 161 | 70 | 170 |
8 | 149 | 29 | 155 | lima puluh | 162 | ||
9 | 149 | 30 | 155 | 51 | 162 | ||
10 | 149 | 31 | 155 | 52 | 162 | ||
sebelas | 150 | 32 | 156 | 53 | 162 | ||
12 | 150 | 33 | 156 | 54 | 163 | ||
13 | 150 | 3. 4 | 156 | 55 | 163 | ||
14 | 150 | 35 | 157 | 56 | 164 | ||
limabelas | 151 | 36 | 157 | 57 | 164 | ||
16 | 152 | 37 | 157 | 58 | 164 | ||
17 | 152 | 38 | 157 | 59 | 164 | ||
18 | 152 | 39 | 157 | 60 | 164 | ||
19 | 152 | 40 | 157 | 61 | 165 | ||
dua puluh | 152 | 41 | 158 | 62 | 166 | ||
dua puluh satu | 152 | 42 | 158 | 63 | 167 |
Langkah 2: Tentukan kuartil Q1 dan Q3
Untuk menentukan kuartil Q1, Q2, dan Q3, kita mulai dengan menghitung indeks untuk data yang sesuai dengan masing-masing kuartil. Rumusnya adalah sebagai berikut:
Dimana N adalah jumlah total data. Perhitungan ini bisa bilangan bulat atau tidak, sehingga prosedurnya dibagi menjadi dua kasus:
Kasus 1: Hasil bilangan bulat
Jika hasilnya bilangan bulat, maka masing-masing kuartil akan menjadi nilai data yang sesuai dengan indeks. Misalnya, jika indeks Q1 memberikan 10, ini berarti Q1 akan menjadi nilai data nomor 10 (149 dalam contoh kita).
Kasus 2: Hasil desimal
Jika indeks adalah angka desimal, maka kuartil tidak akan sama persis dengan data mana pun yang ada dalam deret. Dalam hal ini, hasilnya dibulatkan ke bawah dan kuartil dihitung dari data ini dan yang mengikutinya, menggunakan rumus berikut:
Di mana d mewakili bagian desimal dari indeks, x i adalah data dengan indeks dibulatkan ke bawah, dan x i+1 adalah titik data berikutnya.
Dalam contoh kita, ini adalah hasil penghitungan indeks dari tiga kuartil:
Dalam semua kasus, hasilnya adalah angka desimal, jadi sekarang kami menerapkan rumus dari kasus 2 untuk menentukan nilai setiap kuartil:
Langkah 3: Identifikasi lima angka
Sekarang setelah data diurutkan dan kami juga telah menentukan nilai dari tiga kuartil, ringkasan dari lima angka adalah:
Minimum: | 145 |
Q1: | 152 |
Q2 atau Median: | 157 |
Q3: | 162.25 |
Maksimum: | 170 |
Langkah 4: Bangun plot kotak
Kami sudah memiliki semua yang diperlukan untuk membangun boxplot kecuali RIC. Berdasarkan hasil yang diperoleh pada langkah sebelumnya, perbedaan antara Q3 dan Q1 adalah:
Untuk menentukan apakah ada outlier, kami menghitung Q1 – 1,5 IQR dan Q3 + 1,5 IQR dan membandingkannya dengan minimum dan maksimum:
Seperti yang bisa kita lihat, tidak ada outlier sejak minimum, 140, lebih besar dari 136.625. Juga tidak ada outlier karena maksimumnya, 170, kurang dari 177.625.
Gambar berikut menunjukkan hasil pembuatan plot kotak sesuai dengan contoh:
Referensi
Cara menyusun ringkasan lima angka dari sampel statistik . (td). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html
McAdams, D. (2009, 4 Maret). Ringkasan lima angka. Hidup adalah Cerita Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html
Serra, BR (2020, 22 November). median . Formula Alam Semesta. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo
Serra, BR (2021, 4 Agustus). kuartil . Formula Alam Semesta. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#contoh
Zentika Global. (td). Brutalk – Cara menghitung ringkasan 5 angka untuk data Anda dengan Python . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56