Apa ringkasan lima angka dalam statistik?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Statistik deskriptif memungkinkan kita untuk meringkas kumpulan data dalam sejumlah kecil angka atau ukuran yang berfungsi untuk menggambarkan bagaimana data tersebut didistribusikan. Ada ukuran berbeda yang berfungsi untuk menggambarkan kecenderungan sentral data, penyebarannya, dan bentuk kurva distribusi, beberapa di antaranya ditemukan dalam ringkasan lima angka.

Apa ringkasan lima angka?

Berdasarkan hal di atas, ringkasan lima angka dapat didefinisikan sebagai sekumpulan lima ukuran atau statistik yang terkait dengan kumpulan data yang memungkinkan untuk menggambarkan amplitudo himpunan, dispersinya dengan cara yang sangat sederhana. Ini juga menyediakan ukuran tendensi sentralnya. Selain itu, ringkasan lima angka juga dapat direpresentasikan secara grafis, membuatnya mudah untuk memvisualisasikan karakteristik kumpulan data ini, sekaligus memungkinkannya untuk dengan mudah dibandingkan dengan kumpulan data terkait lainnya.

Apa saja lima angka tersebut dan apa artinya?

Ringkasan lima angka terdiri dari nilai minimum, tiga kuartil, dan nilai maksimum dari serangkaian data statistik. Kuartil adalah data atau nilai yang membagi kumpulan terurut dari semua data menjadi empat subgrup dengan jumlah elemen yang sama . Jadi, jika kita memiliki kumpulan 100 data, kuartil adalah data atau nilai yang membagi kumpulan tersebut menjadi 4 subkumpulan yang masing-masing terdiri dari 25 data.

Kuartil diberi nama sesuai urutan kemunculannya, dari terendah ke tertinggi, seperti kuartil pertama, kedua, dan ketiga. Selain itu, mereka diwakili oleh huruf kapital Q diikuti dengan angka yang menunjukkan posisi ordinalnya. Berdasarkan definisinya, kuartil kedua, Q2, juga dikenal sebagai median atau titik tengah data . Jangan bingung dengan rata-rata, yang merupakan rata-rata aritmatika dari data.

Selain tiga kuartil (Q1, Q2, dan Q3), ringkasan lima angka juga mencakup nilai minimum data, diurutkan dari yang terkecil hingga terbesar, dan nilai maksimum. Dengan kata lain, lima angka dalam ringkasan ini adalah:

  • Minimum.– Ini adalah nilai pertama dari sekumpulan data statistik yang diurutkan dari terendah ke tertinggi. Ini adalah data nilai terendah.
  • Q1 atau kuartil pertama.– Ini adalah data atau nilai yang membagi kumpulan data, menyisakan 25% (atau seperempat) di bawah dan 75% lainnya di atas.
  • Q2 atau kuartil kedua.– Ini adalah data atau nilai yang membagi kumpulan data menjadi dua kelompok yang sama. Artinya, nilai yang menyisakan 50% data baik di bawah maupun di atasnya, sehingga juga mewakili median atau titik tengah data.
  • Q3 atau kuartil ketiga.– Ini adalah data atau nilai yang menyisakan 75% atau tiga perempat dari data di bawah dan 25% lainnya di atas.
  • Maksimum.– Seperti namanya, ini adalah data dengan nilai tertinggi dari seluruh rangkaian data. Artinya, ini adalah data terakhir yang diurutkan dari terendah ke tertinggi.

Saat menafsirkan ringkasan lima angka, perbedaan antara nilai minimum dan maksimum memberikan apa yang dikenal sebagai lebar seri data. Di sisi lain, perbedaan antara kuartil ketiga dan pertama, yang disebut Rentang Interkuartil (RIC), menunjukkan kepada kita seberapa tersebarnya data, karena ini menunjukkan rentang nilai yang mengandung 50% dari data pusat.

Di sisi lain, kuartil kedua atau median adalah ukuran tendensi sentral yang dapat digunakan untuk mewakili nilai semua data dalam deret dalam satu angka. Meskipun mean sering digunakan sebagai ukuran tendensi sentral dalam banyak situasi, median menawarkan keuntungan karena tidak sensitif terhadap nilai ekstrem (terlalu tinggi atau terlalu rendah).

Plot kotak: representasi grafis dari ringkasan lima angka

Cara praktis untuk memvisualisasikan rangkuman lima angka adalah dengan menggunakan apa yang disebut petak kotak atau Box Plot . Dalam jenis representasi ini, rentang interkuartil (IQR) direpresentasikan sebagai persegi panjang atau kotak yang memanjang dari Q1 ke Q3, dan dibagi dua oleh garis tegak lurus terhadap sumbu pengukuran yang terletak di Q2, yaitu di median.

Terakhir, pada setiap sisi kotak garis ditarik sejajar dengan sumbu pengukuran yang memanjang dari minimum ke Q1 dan dari Q3 ke maksimum, asalkan jarak minimum dan maksimum tidak lebih dari 1,5.RIC jarak ke kiri dan kanan Q1 dan Q3, masing-masing. Gurat sisi inilah yang dikenal sebagai kumis kotak. Jika ada data di luar rentang yang dibatasi oleh Q1 – 1.5.RIC dan Q3 + 1.5.RIC, maka sisi (kadang disebut kumis) meluas ke data terjauh dari kotak yang ada di dalam rentang tersebut, dan sisanya diberi tanda sebagai outlier.

Contoh penyusunan rangkuman lima angka untuk satu deret data

Selanjutnya, prosedur disajikan, langkah demi langkah, untuk penjabaran ringkasan lima angka dari satu set data statistik. Selain itu, dijelaskan juga bagaimana membangun plot kotak untuk visualisasi ringkasan ini dalam bentuk grafik.

Data sesuai dengan jumlah barang yang dijual di departemen wanita dari department store selama periode 10 minggu. Hasil penelitian disajikan di bawah ini:

Senin Selasa Rabu Kamis Jumat Sabtu Minggu
Minggu 1 158 145 156 156 164 167 147
minggu 2 161 146 157 152 162 160 153
MINGGU 3 152 150 157 155 164 166 152
minggu 4 150 149 153 162 169 162 149
minggu 5 157 152 154 155 168 161 155
minggu 6 157 145 160 164 164 168 149
minggu 7 160 152 151 152 168 163 145
minggu 8 157 152 155 156 162 169 155
minggu 9 160 148 157 150 164 170 154
minggu 10 158 146 163 158 165 169 150

Langkah 1: Urutkan semua data dari yang terkecil hingga yang terbesar dan beri mereka indeks yang dimulai dengan 1.

Hasil dari langkah ini disajikan di bawah ini:

Indeks Bernilai Indeks Bernilai Indeks Bernilai Indeks Bernilai
1 145 22 152 43 158 64 168
2 145 23 153 44 160 65 168
3 145 24 153 Empat.Lima 160 66 168
4 146 25 154 46 160 67 169
5 146 26 154 47 160 68 169
6 147 27 155 48 161 69 169
7 148 28 155 49 161 70 170
8 149 29 155 lima puluh 162
9 149 30 155 51 162
10 149 31 155 52 162
sebelas 150 32 156 53 162
12 150 33 156 54 163
13 150 3. 4 156 55 163
14 150 35 157 56 164
limabelas 151 36 157 57 164
16 152 37 157 58 164
17 152 38 157 59 164
18 152 39 157 60 164
19 152 40 157 61 165
dua puluh 152 41 158 62 166
dua puluh satu 152 42 158 63 167

Langkah 2: Tentukan kuartil Q1 dan Q3

Untuk menentukan kuartil Q1, Q2, dan Q3, kita mulai dengan menghitung indeks untuk data yang sesuai dengan masing-masing kuartil. Rumusnya adalah sebagai berikut:

Rangkuman Lima Angka

Rangkuman Lima Angka

Rangkuman Lima Angka

Dimana N adalah jumlah total data. Perhitungan ini bisa bilangan bulat atau tidak, sehingga prosedurnya dibagi menjadi dua kasus:

Kasus 1: Hasil bilangan bulat

Jika hasilnya bilangan bulat, maka masing-masing kuartil akan menjadi nilai data yang sesuai dengan indeks. Misalnya, jika indeks Q1 memberikan 10, ini berarti Q1 akan menjadi nilai data nomor 10 (149 dalam contoh kita).

Kasus 2: Hasil desimal

Jika indeks adalah angka desimal, maka kuartil tidak akan sama persis dengan data mana pun yang ada dalam deret. Dalam hal ini, hasilnya dibulatkan ke bawah dan kuartil dihitung dari data ini dan yang mengikutinya, menggunakan rumus berikut:

Rangkuman Lima Angka

Di mana d mewakili bagian desimal dari indeks, x i adalah data dengan indeks dibulatkan ke bawah, dan x i+1 adalah titik data berikutnya.

Dalam contoh kita, ini adalah hasil penghitungan indeks dari tiga kuartil:

Rangkuman Lima Angka

Rangkuman Lima Angka

Rangkuman Lima Angka

Dalam semua kasus, hasilnya adalah angka desimal, jadi sekarang kami menerapkan rumus dari kasus 2 untuk menentukan nilai setiap kuartil:

Rangkuman Lima Angka

Rangkuman Lima Angka

Rangkuman Lima Angka

Langkah 3: Identifikasi lima angka

Sekarang setelah data diurutkan dan kami juga telah menentukan nilai dari tiga kuartil, ringkasan dari lima angka adalah:

Minimum: 145
Q1: 152
Q2 atau Median: 157
Q3: 162.25
Maksimum: 170

Langkah 4: Bangun plot kotak

Kami sudah memiliki semua yang diperlukan untuk membangun boxplot kecuali RIC. Berdasarkan hasil yang diperoleh pada langkah sebelumnya, perbedaan antara Q3 dan Q1 adalah:

Rangkuman Lima Angka

Untuk menentukan apakah ada outlier, kami menghitung Q1 – 1,5 IQR dan Q3 + 1,5 IQR dan membandingkannya dengan minimum dan maksimum:

Rangkuman Lima Angka

Rangkuman Lima Angka

Seperti yang bisa kita lihat, tidak ada outlier sejak minimum, 140, lebih besar dari 136.625. Juga tidak ada outlier karena maksimumnya, 170, kurang dari 177.625.

Gambar berikut menunjukkan hasil pembuatan plot kotak sesuai dengan contoh:

Rangkuman Lima Angka

Referensi

Cara menyusun ringkasan lima angka dari sampel statistik . (td). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html

McAdams, D. (2009, 4 Maret). Ringkasan lima angka. Hidup adalah Cerita Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html

Serra, BR (2020, 22 November). median . Formula Alam Semesta. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo

Serra, BR (2021, 4 Agustus). kuartil . Formula Alam Semesta. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#contoh

Zentika Global. (td). Brutalk – Cara menghitung ringkasan 5 angka untuk data Anda dengan Python . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56

-Iklan-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados