Perbedaan antara standar deviasi sampel dan populasi

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Tabla de Contenidos


Dalam menghitung standar deviasi, dua situasi harus dipertimbangkan: standar deviasi populasi atau sekumpulan nilai, dan standar deviasi sampel.

Mari kita ingat, sebelum melanjutkan dalam dua definisi, bahwa standar deviasi σ adalah parameter yang memungkinkan mengevaluasi dispersi dari satu set nilai . Jika rata-rata dari sekumpulan nilai dihitung, standar deviasi mengevaluasi perbedaan nilai dalam kumpulan dari rata-rata. Dan rata-rata dari sekumpulan n nilai didefinisikan sebagai jumlah dari semuanya dibagi dengan jumlah n nilai . Rumus umum yang digunakan untuk menghitung simpangan baku σ ditunjukkan di bawah ini; terdiri dari pengurangan dari setiap nilai himpunan yang kita analisis, yang kita catat dengan subskrip i, rata-rata dari semua nilai; kita kuadratkan setiap perbedaan ini dan menjumlahkannya; Kami membagi hasilnya dengan jumlah nilai dalam himpunan dikurangi 1, dan menghitung akar kuadrat dari nilai ini.

Standar deviasi σ sampel.
Standar deviasi σ sampel.

Meskipun kedua definisi deviasi standar menilai variabilitas, ada perbedaan konseptual antara menghitung populasi dan sampel. Perbedaannya berkaitan dengan perbedaan antara variabel statistik dan parameter matematika. Jika data dikumpulkan dari semua anggota populasi atau kumpulan data yang ditentukan dipelajari, ini adalah perhitungan standar deviasi suatu populasi. Jika Anda menganalisis data yang mewakili sampel dari populasi yang lebih besar, ini adalah perhitungan standar deviasi sampel. Gambar di bawah ini secara grafis menggambarkan perbedaannya. Deviasi standar suatu populasi adalah parameter matematika dengan nilai pasti; Standar deviasi sampel adalah parameter statistik yang mengevaluasi sekumpulan data yang hasilnya diproyeksikan ke kumpulan yang lebih besar. Evaluasi ini tergantung pada sampel, itu bukan nilai yang pasti, seperti dalam kasus populasi.

Populasi dan sampel.
Populasi dan sampel.

Secara kualitatif perbedaan definisi menyiratkan perhitungan yang sedikit berbeda; Dalam kasus simpangan baku suatu sampel, selisih antara setiap nilai dan rata-rata kuadrat dibagi dengan jumlah nilai dikurangi 1 ( n – 1), seperti yang ditunjukkan pada rumus sebelumnya. Dalam kasus standar deviasi suatu populasi dibagi dengan n .

Contoh

Mari kita lihat contoh untuk memperbaiki ide. Mari kita ambil satu set nilai dan hitung standar deviasi menurut dua definisi tersebut. Grup tersebut adalah sebagai berikut, dan berisi 5 nilai ( n = 5), yaitu sebagai berikut:

1, 2, 4, 5, 8

Rata-rata dari nilai-nilai ini memiliki ekspresi berikut

(1 + 2 + 4 + 5 + 8)/5 = 20/5 = 4

Selisih masing-masing nilai dan kuadrat rata-rata direpresentasikan dengan urutan sebagai berikut

(1 – 4) 2 = 9

(2 – 4) 2 = 4

(4 – 4) 2 = 0

(5 – 4) 2 = 1

(8 – 4) 2 = 16

Jumlah dari kelima nilai tersebut adalah 30.

Dalam kasus penghitungan standar deviasi populasi, nilai ini harus dibagi dengan n , 5 dalam contoh ini dan hasilnya adalah 6 . Dalam kasus simpangan baku sampel, perlu membagi antara n – 1; 4 dalam hal ini dan hasilnya adalah 7,5 . Untuk menyelesaikan perhitungan kita harus mendapatkan akar kuadrat; sekitar 2,4495 jika itu adalah populasi, dan sekitar 2,7386 jika itu adalah sampel.

Air mancur

Yadolah Dodge. Ensiklopedia Statistik Ringkas . New York: Springer, 2010.

-Iklan-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados