Was ist der Unterschied zwischen Varianz und Standardabweichung?

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Die Varianz und die Standardabweichung sind zwei Begriffe von großer Bedeutung, sowohl in der Statistik als auch in allen Bereichen der Natur- und Ingenieurwissenschaften. Beide sind Streuungsmaße in Bezug auf einen zentralen Wert, können aber je nach Kontext, in dem sie verwendet werden, unterschiedlich definiert werden.

In den Bereichen Statistik und Wahrscheinlichkeit messen Varianz und Standardabweichung, wie weit die Werte einer Zufallsvariablen (fast immer repräsentiert durch den Buchstaben X) von ihrem Mittelwert abweichen.

Wenn diese Begriffe jedoch in Wissenschaft oder Technik verwendet werden, beziehen sich Varianz und Standardabweichung auf die Streuung einer Datenreihe, entweder einer gesamten Grundgesamtheit oder einer Stichprobe, um den Grundgesamtheits- oder Stichprobenmittelwert. Die Standardabweichung einer Reihe sich wiederholender Messungen mit demselben Messgerät wird auch oft verwendet, um eine Vorstellung von der Genauigkeit des besagten Instruments zu geben.

Die Standardabweichung einer Reihe sich wiederholender Messungen gibt Aufschluss über die Genauigkeit des Messgeräts.

Im ersten Fall messen die Varianz und die Standardabweichung die Variabilität einer Zufallsvariablen, während sie im zweiten Fall die Streuung experimenteller Daten messen. In beiden Fällen zeigt eine Varianz oder Standardabweichung von Null überhaupt keine Variation an (die Zufallsvariable ist tatsächlich konstant oder die Daten sind alle genau gleich), während ein hoher Wert das Gegenteil anzeigt.

Diese beiden Begriffe sind eng miteinander verwandt und können manchmal miteinander verwechselt werden, es gibt jedoch wesentliche Unterschiede zwischen den beiden, auf die wir gleich eingehen werden.

Unterschiede zwischen Varianz und Standardabweichung

1. Sie haben unterschiedliche Definitionen

Der erste Unterschied zwischen diesen beiden statistischen Begriffen ist ihre Definition:

Definition von Varianz

In der Statistik wird Varianz als Erwartungswert des Quadrats der Differenz zwischen dem Wert einer Zufallsvariablen und ihrem Mittelwert definiert.

Mathematisch schreibt man das so:

Statistische Definition der Varianz

Etwas weniger formal kann sie auch als Mittelwert der Quadrate der Differenzen zwischen den Einzeldaten einer Datenreihe (Grundgesamtheit oder Stichprobe) und ihrem Mittelwert definiert werden.

Definition der Standardabweichung

Unabhängig vom Kontext, in dem sie verwendet wird, ist die Standardabweichung, auch Standardabweichung genannt, als positive Quadratwurzel der Varianz definiert.

Mathematisch schreibt man das so:

Statistische Definition der Standardabweichung.

2. Sie werden mit unterschiedlichen Symbolen dargestellt

Varianz und Standardabweichung werden sowohl in Statistiktexten als auch in Formeln und Gleichungen auf unterschiedliche Weise dargestellt:

Abweichung:

  • σ 2 in Bezug auf die Populationsvarianz
  • S 2 in Bezug auf die Stichprobenvarianz
  • Var(X) bezieht sich auf die Varianz einer Zufallsvariablen, in diesem Fall X.

Standardabweichung:

  • σ in Bezug auf die Standardabweichung der Grundgesamtheit
  • S bei Bezugnahme auf die Stichproben-Standardabweichung
  • SD(X) bezieht sich auf die Standardabweichung einer Zufallsvariablen, in diesem Fall X.

3. Sie haben unterschiedliche Formeln

Sowohl für die Varianz als auch für die Standardabweichung gibt es zwei Formeln, je nachdem, ob die Datenreihe, für die die Varianz oder Standardabweichung berechnet wird, Daten aus einer Grundgesamtheit oder aus einer Stichprobe sind.

Populationsvarianzformel (σ 2 )

Formeln für die Varianz der Populationsvarianz

In jeder der beiden Formeln für die Varianz der Grundgesamtheit stellt μ den Mittelwert der Grundgesamtheit dar, X i stellt den i-ten Wert der Grundgesamtheitsdaten dar und N stellt die Größe der Grundgesamtheit oder die Gesamtzahl der Datenpunkte dar.

Beispielvarianzformel (S 2 )

Formeln für die Stichprobenvarianz

Hier stellt x-bar den Mittelwert der Stichprobendaten (Stichprobenmittelwert) dar, x i stellt den Wert der i-ten Stichprobendaten dar und n stellt die Größe oder Gesamtzahl der Daten in der Stichprobe dar.

Populations-Standardabweichungsformel (σ)

Im Falle der Standardabweichung kann diese auf drei verschiedene Arten berechnet werden:

Formel für die Populationsstandardabweichung.

Eine andere Formel für die Populationsstandardabweichung

Praktische Formel für die Populationsstandardabweichung.

Beispielformel(en) für die Standardabweichung

Auch hier kann einer von drei verschiedenen Wegen genutzt werden:

Formel für die Standardabweichung der Stichprobe.

Eine andere Formel für die Standardabweichung der Stichprobe.

Praktische Formel für die Stichproben-Standardabweichung.

Zu den letzten beiden Formeln muss eine Anmerkung gemacht werden. Üblicherweise wird bei der Berechnung der Standardabweichung zuerst die Varianz berechnet und dann die Quadratwurzel gezogen. Die Standardabweichung wird selten mit den letzteren Gleichungen bestimmt, ohne zuerst die Varianz zu berechnen, so dass die erstere fast immer der letzteren vorausgeht.

4. Sie haben unterschiedliche Einheiten

Sowohl die Einheiten der Varianz als auch der Standardabweichung hängen von Art und Einheit der Daten bzw. der Zufallsvariablen ab, auf die sie sich beziehen, jedoch sind die Einheiten jeweils unterschiedlich.

Die Standardabweichung hat dieselben Einheiten wie die Originaldaten oder die Zufallsvariable, während die Varianz in diesen Einheiten zum Quadrat angegeben wird.

Beispiel:

Wenn Sie die Daten der Gewichte in Kilogramm (kg) einer Stichprobe von Schülern der 8. Klasse in einer bestimmten Bildungseinrichtung haben, dann hat die Varianz dieser Daten Einheiten von kg 2, während die Standardabweichung in kg angegeben wird .

5. Sie unterscheiden sich in ihrer Interpretation

Sowohl für die Varianz als auch für die Standardabweichung ist die Interpretation die gleiche wie die bereits erwähnte: Wenn sie Null wert sind, dann gibt es keine Streuung und alle Daten sind einander genau gleich; Wenn es sich um kleine Werte handelt, wird es wenig Streuung geben, und wenn sie groß sind, wird es eine Menge Streuung geben.

Interpretation von Varianz und Standardabweichung.

Wenn man jedoch versteht, was es bedeutet, ein großer oder kleiner Wert zu sein, sind Standardabweichungswerte viel einfacher zu interpretieren als Varianzwerte, da sie in denselben Einheiten wie die Daten vorliegen. Bei Varianz ist das nicht so einfach.

6. Sie unterscheiden sich in ihrer Empfindlichkeit gegenüber Extremwerten

Als Streuungsmaße leiden sowohl die Varianz als auch die Standardabweichung an der Empfindlichkeit gegenüber dem Vorhandensein von Extremwerten (entweder sehr hoch oder sehr niedrig). Dies bedeutet, dass bei der Beschreibung einer Datenreihe, in der alle Daten sehr ähnlich sind, außer einer, die viel größer oder kleiner als die anderen ist, weder die Varianz noch die Standardabweichung die Streuung der Daten gut darstellen (beide ergeben große Werte trotz der Tatsache, dass die überwiegende Mehrheit der Daten eine sehr geringe Streuung aufweist).

Beim Vergleich der Varianz mit der Standardabweichung reagiert die Varianz jedoch viel empfindlicher auf diese Ausreißer, da alle Abweichungen quadriert werden, die Standardabweichung jedoch nicht.

7. Sie unterscheiden sich in ihren mathematischen Eigenschaften

Der letzte Unterschied, den wir uns ansehen werden, umfasst tatsächlich mehrere viel tiefere Unterschiede, die hauptsächlich für Statistiker (oder diejenigen, die Statistik studieren) wichtig sind.

Als mathematische Funktionen unterscheiden sich Varianz und Standardabweichung in Bezug auf den Effekt der Multiplikation der Daten mit einer Konstanten, den Effekt der Addition von Konstanten, der Addition von Zufallsvariablen, der Potenzierung und so weiter.

Diese Unterschiede liegen jedoch außerhalb des Rahmens dieses Artikels.

Beispiel für die Berechnung von Varianz und Standardabweichung

Angenommen, eine Stichprobe von 12 Bullen eines lokalen Erzeugers wurde gewogen. Die Gewichte in Kilo sind unten angegeben:

507 497 510 508 491 510
500 509 496 491 505 503

Sie werden gebeten, die Varianz und die Standardabweichung dieser Stichprobe zu bestimmen.

LÖSUNG

Wie oben erwähnt, ist es bei einer Datenreihe praktisch, zuerst die Varianz und dann die Standardabweichung zu bestimmen.

Berechnung der Stichprobenabweichung (S 2 )

Wir werden die zweite Stichprobenvarianzformel verwenden, da sie praktischer ist. Dazu werden die folgenden Schritte befolgt:

  • Schritt 1: Aus allen Daten wird eine vertikale Liste erstellt
  • Schritt 2: Das Quadrat aller Daten wird berechnet und daneben in eine neue Spalte geschrieben.
  • Schritt 3: Alle Daten werden addiert und das Ergebnis am Ende der ersten Spalte festgehalten.
  • Schritt 4: Addiere alle Quadrate und notiere das Ergebnis am Ende der zweiten Spalte.

Diese ersten 5 Schritte sind in der folgenden Tabelle zusammengefasst:

Xi _ x ich 2
500 250000
509 259081
496 246016
491 241081
505 255025
503 253009
507 257049
497 247009
510 260100
508 258064
491 241081
510 260100
∑Xi_ _ ∑X ich 2
6027 3027615
  • Schritt 5: Die Formel wird verwendet, um die Varianz zu berechnen:
Beispiel für die Berechnung der Stichprobenabweichung

Die Stichprobenvarianz beträgt also etwa S 2 = 50 kg 2 .

Berechnung der Stichproben-Standardabweichung (S)

Jetzt, da wir die Varianz haben, ist die Berechnung der Standardabweichung so einfach wie das Ziehen der Quadratwurzel aus der ersten:

Beispiel für die Berechnung der Standardabweichung

Wie zu sehen ist, lässt der Vergleich der Standardabweichung von 7 kg mit dem Durchschnittsgewicht der Bullen von 502,25 kg (separat berechnet) den Schluss zu, dass diese Stichprobe eine geringe Streuung aufweist, da dies nur der Fall ist 1,4 % des Durchschnittsgewichts der Bullen.

Verweise

Espinoza, CI, & Echecopar, AL (2020). Statistische Anwendungen mit MS Excel mit schrittweisen Beispielen (spanische Ausgabe) (1. Aufl .). Lima, Peru: Luis Felipe Arizmendi Echecopar und Duo Negocios SAC.

Investopedia. (2021, 16. April). Erfahren Sie, wie die Standardabweichung mithilfe der Varianz bestimmt wird. Abgerufen am 24. Juli 2021 von https://www.investopedia.com/ask/answers/021215/what-difference-between-standard-deviation-and-variance.asp

Lopez, JF (18. November 2017). Varianz . Abgerufen von https://economipedia.com/definiciones/varianza.html

Nationales Institut für Standards und Technologie. (nd). Grundlegende Definitionen von Unsicherheit. Abgerufen am 24. Juli 2021 von https://physics.nist.gov/cuu/Uncertainty/basic.html

Webster, A. (2001). Statistik für Unternehmen und Wirtschaft (spanische Ausgabe) . Toronto, Kanada: Irwin Professional Publishing.

-Werbung-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados