Jaka jest różnica między wariancją a odchyleniem standardowym?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Wariancja i odchylenie standardowe to dwa terminy o ogromnym znaczeniu, zarówno w statystyce, jak i we wszystkich gałęziach nauki i inżynierii. Oba są miarami rozproszenia w odniesieniu do wartości centralnej, ale w zależności od kontekstu, w jakim są używane, można je definiować na różne sposoby.

W dziedzinie statystyki i prawdopodobieństwa wariancja i odchylenie standardowe mierzą, jak bardzo wartości zmiennej losowej (prawie zawsze reprezentowanej przez literę X) różnią się od jej wartości średniej.

Jednakże, gdy te terminy są używane w nauce lub inżynierii, wariancja i odchylenie standardowe odnoszą się do rozproszenia serii danych, całej populacji lub próbki, wokół średniej populacji lub próbki. Odchylenie standardowe serii powtarzalnych pomiarów przy użyciu tego samego przyrządu pomiarowego jest również często używane, aby dać wyobrażenie o poziomie precyzji tego przyrządu.

Odchylenie standardowe serii powtarzalnych pomiarów daje wyobrażenie o poziomie precyzji przyrządu pomiarowego.

W pierwszym przypadku wariancja i odchylenie standardowe mierzą zmienność zmiennej losowej, podczas gdy w drugim przypadku mierzą rozproszenie danych eksperymentalnych. W obu przypadkach wariancja lub odchylenie standardowe równe zero wskazuje na całkowity brak zmienności (zmienna losowa jest w rzeczywistości stała lub wszystkie dane są dokładnie takie same), podczas gdy wysoka wartość wskazuje na coś przeciwnego.

Te dwa terminy są ze sobą blisko spokrewnione i czasami można je ze sobą pomylić, jednak istnieją między nimi kluczowe różnice, które omówimy od razu.

Różnice między wariancją a odchyleniem standardowym

1. Mają różne definicje

Pierwszą różnicą między tymi dwoma terminami statystycznymi jest ich definicja:

Definicja wariancji

W statystyce wariancja jest definiowana jako oczekiwana wartość kwadratu różnicy między wartością zmiennej losowej a jej wartością średnią.

Matematycznie jest to zapisane jako:

Statystyczna definicja wariancji

W nieco mniej formalny sposób można ją również zdefiniować jako średnią kwadratów różnic między poszczególnymi danymi serii danych (populacji lub próby) a jej wartością średnią.

Definicja odchylenia standardowego

Niezależnie od kontekstu, w jakim jest używane, odchylenie standardowe, znane również jako odchylenie standardowe, jest definiowane jako dodatni pierwiastek kwadratowy z wariancji.

Matematycznie jest to zapisane jako:

Statystyczna definicja odchylenia standardowego.

2. Są one przedstawiane za pomocą różnych symboli

Wariancja i odchylenie standardowe są reprezentowane na różne sposoby zarówno w tekstach statystycznych, jak i we wzorach i równaniach:

Zmienność:

  • σ 2 w odniesieniu do wariancji populacji
  • S 2 w odniesieniu do wariancji próbki
  • Var(X) w odniesieniu do wariancji zmiennej losowej, w tym przypadku X.

Odchylenie standardowe:

  • σ w odniesieniu do odchylenia standardowego populacji
  • S w odniesieniu do odchylenia standardowego próbki
  • SD(X) w odniesieniu do odchylenia standardowego zmiennej losowej, w tym przypadku X.

3. Mają różne formuły

Zarówno dla wariancji, jak i odchylenia standardowego istnieją dwa wzory, w zależności od tego, czy serie danych, dla których obliczana jest wariancja lub odchylenie standardowe, pochodzą z populacji czy z próby.

Wzór na wariancję populacji (σ 2 )

Wzory na wariancję wariancji populacji

W każdym z dwóch wzorów na wariancję populacji, μ reprezentuje średnią populacji, X i reprezentuje i-tą wartość danych populacji, a N reprezentuje wielkość populacji lub całkowitą liczbę punktów danych.

Przykładowy wzór na wariancję (S 2 )

wzory na wariancję próby

Tutaj słupek x reprezentuje średnią danych próbki (średnia próbki), x i reprezentuje wartość i-tych danych próbki, a n reprezentuje rozmiar lub całkowitą liczbę danych w próbce.

Wzór na odchylenie standardowe populacji (σ)

W przypadku odchylenia standardowego można je obliczyć na trzy różne sposoby:

Wzór na odchylenie standardowe populacji.

Inny wzór na odchylenie standardowe populacji

Praktyczny wzór na odchylenie standardowe populacji.

Przykładowy wzór na odchylenie standardowe

Tutaj również można zastosować jeden z trzech różnych sposobów:

Wzór na odchylenie standardowe próbki.

Inny wzór na odchylenie standardowe próbki.

Praktyczny wzór na odchylenie standardowe próbki.

Należy poczynić uwagę w odniesieniu do dwóch ostatnich wzorów. Powszechne jest, że przy obliczaniu odchylenia standardowego najpierw obliczana jest wariancja, a następnie pierwiastek kwadratowy. Odchylenie standardowe jest rzadko określane przy użyciu tych ostatnich równań bez uprzedniego obliczenia wariancji, więc to pierwsze prawie zawsze poprzedza drugie.

4. Mają różne jednostki

Zarówno jednostki wariancji, jak i odchylenie standardowe zależą od charakteru i jednostek danych lub zmiennej losowej, do której się odnoszą, jednak w każdym przypadku jednostki te są inne.

Odchylenie standardowe ma te same jednostki, co oryginalne dane lub zmienna losowa, podczas gdy wariancja jest wyrażona w tych jednostkach do kwadratu.

Przykład:

Jeśli masz dane o wagach w kilogramach (kg) próby uczniów klas 8 w pewnej instytucji edukacyjnej, to wariancja tych danych będzie miała jednostki kg 2, podczas gdy odchylenie standardowe będzie w kg .

5. Różnią się interpretacją

Zarówno dla wariancji, jak i odchylenia standardowego interpretacja jest taka sama, jak już wspomniano: jeśli są one warte zero, to nie ma rozproszenia i wszystkie dane są sobie dokładnie równe; jeśli są to małe wartości, rozproszenie będzie niewielkie, a jeśli będą duże, rozproszenie będzie duże.

interpretacja wariancji i odchylenia standardowego.

Jednak przy zrozumieniu, co to znaczy być dużą lub małą wartością, wartości odchylenia standardowego są znacznie łatwiejsze do interpretacji niż wartości wariancji, ponieważ są w tych samych jednostkach co dane. W przypadku wariancji nie jest to takie proste.

6. Różnią się wrażliwością na skrajne wartości

Jako miary dyspersji, zarówno wariancja, jak i odchylenie standardowe cierpią z powodu wrażliwości na istnienie wartości ekstremalnych (bardzo wysokich lub bardzo niskich). Oznacza to, że podczas opisywania serii danych, w której wszystkie dane są bardzo podobne, z wyjątkiem jednej, która jest znacznie większa lub mniejsza od pozostałych, ani wariancja, ani odchylenie standardowe nie będą dobrze reprezentować rozrzutu danych (oba dadzą wartości duże pomimo faktu, że zdecydowana większość danych wykazuje bardzo małe rozproszenie).

Jednak porównując wariancję z odchyleniem standardowym, wariancja jest znacznie bardziej wrażliwa na te wartości odstające, ponieważ wszystkie odchylenia są podniesione do kwadratu, podczas gdy odchylenie standardowe nie.

7. Różnią się właściwościami matematycznymi

Ostatnia różnica, której się przyjrzymy, w rzeczywistości obejmuje kilka znacznie głębszych różnic, które są ważne przede wszystkim dla statystyków (lub osób studiujących statystyki).

Jako funkcje matematyczne, wariancja i odchylenie standardowe różnią się pod względem efektu mnożenia danych przez stałą, efektu dodawania stałych, sumowania zmiennych losowych, podnoszenia do potęg i tak dalej.

Różnice te wykraczają jednak poza zakres tego artykułu.

Przykład obliczenia wariancji i odchylenia standardowego

Załóżmy, że zważono próbkę 12 byków od lokalnego producenta. Wagi w kilogramach przedstawiono poniżej:

507 497 510 508 491 510
500 509 496 491 505 503

Zostaniesz poproszony o określenie wariancji i odchylenia standardowego tej próbki.

ROZWIĄZANIE

Jak wspomniano powyżej, mając serię danych, wygodnie jest najpierw określić wariancję, a następnie odchylenie standardowe.

Obliczanie wariancji próbki (S 2 )

Użyjemy drugiej formuły wariancji próbki, ponieważ jest ona bardziej praktyczna. W tym celu wykonuje się następujące kroki:

  • Krok 1: Tworzona jest pionowa lista wszystkich danych
  • Krok 2: Kwadrat każdej danych jest obliczany i zapisywany obok niej w nowej kolumnie.
  • Krok 3: Wszystkie dane są dodawane, a wynik jest zapisywany na końcu pierwszej kolumny.
  • Krok 4: Dodaj wszystkie kwadraty i zapisz wynik na końcu drugiej kolumny.

Te pierwsze 5 kroków podsumowano w poniższej tabeli:

Xi_ _ x ja 2
500 250000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi _ ∑X i 2
6027 3027615
  • Krok 5: Formuła służy do obliczenia wariancji:
Przykład obliczenia wariancji

Tak więc wariancja próbki wynosi w przybliżeniu S 2 = 50 kg 2 .

Obliczanie odchylenia standardowego próbki (S)

Teraz, gdy mamy wariancję, obliczenie odchylenia standardowego jest tak proste, jak wyciągnięcie pierwiastka kwadratowego z pierwszego:

Przykładowy przykład obliczenia odchylenia standardowego

Jak widać, porównanie odchylenia standardowego, które wynosi 7 kilogramów, ze średnią wagą buhajów, która wynosi 502,25 kilograma (liczona oddzielnie), pozwala stwierdzić, że próbka ta ma niski rozrzut, gdyż wynosi tylko 1,4% średniej wagi buhajów.

Bibliografia

Espinoza, CI i Echecopar, AL (2020). Aplikacje statystyczne wykorzystujące MS Excel z przykładami krok po kroku (wydanie hiszpańskie) ( wyd . 1). Lima, Peru: Luis Felipe Arizmendi Echecopar i Duo Negocios SAC.

Inwestopedia. (2021, 16 kwietnia). Dowiedz się, jak określa się odchylenie standardowe za pomocą wariancji. Pobrano 24 lipca 2021 r. z https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18 listopada 2017). Wariancja . Pobrane z https://economipedia.com/definiciones/varianza.html

Narodowy Instytut Standardów i Technologii. (nd). Podstawowe definicje niepewności. Pobrano 24 lipca 2021 r. z https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statystyka stosowana w biznesie i gospodarce (wydanie hiszpańskie) . Toronto, Kanada: Irwin Professional Publishing.

-Reklama-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

zmienne zależne