Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


In der deskriptiven Statistik gibt es eine Reihe von Maßen, die es uns ermöglichen, verschiedene allgemeine Aspekte der Daten einer Bevölkerung zu betrachten. Einige werden verwendet, um die zentrale Tendenz der Daten zu messen, während andere versuchen, eine Vorstellung von der Variabilität oder Streuung der Daten zu geben, dh der Art und Weise, wie die Daten um diese zentrale Tendenz verteilt sind.

Zwei wichtige Maße der Variabilität oder Streuung sind die Varianz und die Standardabweichung. Diese beiden Maße sind eng miteinander verbunden, es gibt jedoch zwei Versionen der Varianz und zwei entsprechende Versionen der Standardabweichung, nämlich die Grundgesamtheit und die Stichprobe.

Statistische Zusammenfassungen der Bevölkerung vs. der Stichprobe

Es ist erwähnenswert, dass eine Tatsache von großer Bedeutung ist, nämlich dass es in der Statistik im Allgemeinen zwei Versionen von jedem der Maße gibt, die das Verhalten einer Reihe von Daten zusammenfassen und die in unterschiedlichen Kontexten verwendet werden.

Zunächst müssen wir zwischen Daten aus einer Grundgesamtheit (oder Grundgesamtheitsdaten) und Daten aus einer Teilmenge dieser Grundgesamtheit, die als Stichprobe bezeichnet wird, unterscheiden. Obwohl Bevölkerungsdaten und Stichprobendaten mathematisch nicht zu unterscheiden sind, sind sie konzeptionell sehr unterschiedlich.

Volkszählungen

Bevölkerungsdaten sind Daten, die durch eine statistische Zählung gewonnen werden, d. h. durch Messen oder Analysieren jedes Elements oder Individuums, aus dem eine Bevölkerung besteht (solange es natürlich endlich ist). Wenn wir Maße der zentralen Tendenz oder Streuung für Populationsdaten berechnen, erhalten wir Maße, die das allgemeine Verhalten der Population zusammenfassen, die wir Populationsparameter nennen und die feste Werte für eine Population sind (d. h. eine Population hat nur einen Mittelwert , ein Modus, eine Standardabweichung usw. zu einem bestimmten Zeitpunkt). In diesem Fall verwenden wir deskriptive Statistiken .

Probenahme

Andererseits führen wir in vielen verschiedenen Situationen einen Stichprobenprozess durch, um nur einige Elemente der Bevölkerung zu analysieren und so Stichprobendaten zu erhalten. In diesen Fällen können wir auch die Werkzeuge der deskriptiven Statistik verwenden, um das allgemeine Verhalten dieser Daten zu beobachten, aber wir machen eigentlich keine deskriptive Statistik über die Bevölkerung, sondern nur über die Stichprobe.

Numerische Zusammenfassungen der Stichprobe sind keine Parameter, sondern werden als Statistiken bezeichnet (obwohl manche sie auch als Statistiken bezeichnen). Im Gegensatz zu Parametern variieren Statistiken von Stichprobe zu Stichprobe , selbst wenn die Stichproben aus derselben Grundgesamtheit gezogen werden. Dies liegt daran, dass es bei der Auswahl einer Teilmenge der Grundgesamtheit viele mögliche Kombinationen von Elementen gibt, aus denen die Stichprobe bestehen kann. Aus diesem Grund bestehen die Stichproben im Allgemeinen aus unterschiedlichen Themen, Personen oder Elementen, was zu unterschiedlichen Statistiken führt.

Das ultimative Ziel der Berechnung dieser Statistiken über die Stichprobe besteht darin, sie als Schätzer für die jeweiligen Populationsparameter verwenden zu können. Für diesen Prozess der Ableitung oder Schätzung des Verhaltens von Bevölkerungsdaten aus Stichprobendaten ist die Inferenzstatistik zuständig . Dadurch unterscheiden sich die Varianzen und Standardabweichungen der Grundgesamtheit und der Stichprobe wesentlich.

Aber was genau sind Varianz und Standardabweichung?

Was ist die Varianz?

Die Varianz ist ein Maß für die Streuung vom Mittelwert eines Datensatzes. Er ist definiert als der Durchschnitt der quadrierten Abweichungen aller Daten vom Mittelwert. Da es sich um einen Durchschnitt quadrierter Differenzen handelt, ist es immer eine positive Größe.

Was ist die Standardabweichung?

Andererseits ist die Standardabweichung einfach die positive Quadratwurzel der Varianz. Es misst auch die Streuung um den Mittelwert herum, nur dass dies in Bezug auf die gleichen Einheiten der Daten und des Mittelwerts geschieht. Dies macht es einfacher zu verstehen und zu interpretieren als die Varianz.

Da die Standardabweichung als Quadratwurzel der Varianz berechnet wird, ist es nicht sinnvoll, über die Grundgesamtheit und die Stichprobenstandardabweichung zu sprechen, ohne über die Grundgesamtheit und die Stichprobenvarianz zu sprechen.

Die wichtigsten Unterschiede zwischen diesen gebräuchlichen Streuungsmaßen um den Mittelwert werden in den folgenden Abschnitten ausführlich beschrieben.

Unterschied 1: Populations- und Stichprobenstandardabweichungen und -varianzen werden durch unterschiedliche Symbole dargestellt

Der erste zu berücksichtigende Unterschied beim Vergleich der Populations- und Stichprobenvarianz und der Populations- und Stichprobenstandardabweichung ist das Symbol, das zu ihrer Darstellung verwendet wird. In der Statistik werden numerische Zusammenfassungen oder Parameter der Bevölkerung normalerweise mit griechischen Buchstaben dargestellt , während Stichproben- oder statistische Versionen durch die entsprechenden Buchstaben des lateinischen Alphabets dargestellt werden .

In diesem Sinne werden sowohl die Varianz als auch die Grundgesamtheits-Standardabweichung mit dem griechischen Kleinbuchstaben Sigma assoziiert, während die Stichprobenversionen durch den Buchstaben s dargestellt werden . Das heißt , die Populationsvarianz ist σ 2 und die Populationsstandardabweichung ist σ , während die Stichprobenvarianz durch s 2 und die Stichprobenstandardabweichung durch s dargestellt wird .

Unterschied 2: Sie werden mit unterschiedlichen Formeln berechnet

Sowohl die Populations- als auch die Stichproben-Standardabweichung werden als positive Quadratwurzel der jeweiligen Varianz berechnet, d. h.:

Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Die Populations- und Stichprobenvarianzen werden jedoch mit etwas anderen Formeln berechnet. Im Fall der Populationsvarianz wird diese als Mittelwert der quadrierten Abweichungen jedes Datums in Bezug auf den Populationsmittelwert berechnet. Das heißt, es wird durch einen der folgenden äquivalenten Ausdrücke berechnet:

Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Dabei stellt x i den Wert jedes Datenelements in der Grundgesamtheit dar, μ stellt den Mittelwert der Grundgesamtheit dar und N ist die Größe der Grundgesamtheit. Daher wird die Populationsstandardabweichung wie folgt berechnet:

Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Anstatt wie erwartet durch die Anzahl der Datenpunkte n zu dividieren , wird die Stichprobenvarianz stattdessen berechnet, indem die Summe der quadrierten Abweichungen vom Stichprobenmittelwert durch n – 1 dividiert wird . Mit anderen Worten, die Stichprobenvarianz wird wie folgt berechnet:

Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Wobei x i den Wert jedes Datenelements in der Stichprobe darstellt, x̄ den Stichprobenmittelwert darstellt und n die Stichprobengröße ist. In Anbetracht des oben Gesagten wird die Standardabweichung der Stichprobe wie folgt berechnet:

Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Begründung für die Division durch n – 1 statt n

Eine häufig gestellte Frage beim Vergleich der Standardabweichungen von Grundgesamtheiten und Stichproben lautet: Warum durch n – 1 dividieren und nicht durch n ? Der Grund ist sehr einfach.

Wie bereits erwähnt, versucht die Berechnung von Statistiken wie der Stichprobenstandardabweichung, Schätzer zu ermitteln, die den jeweiligen Parametern der Grundgesamtheit so nahe wie möglich kommen. Das bedeutet, dass die Standardabweichung der Stichprobe so berechnet werden sollte, dass das Ergebnis so nah wie möglich an der Standardabweichung der Grundgesamtheit liegt.

Dies würde nahelegen, dass sie mit äquivalenten Formeln berechnet werden sollten, aber dies ist nicht immer der Fall. Das Problem besteht darin, dass die Standardabweichung der Stichprobe die Streuung um den Stichprobenmittelwert misst, nicht den Mittelwert der Grundgesamtheit. Obwohl der Stichprobenmittelwert eine Statistik ist, die als Schätzwert für den Mittelwert der Grundgesamtheit verwendet wird, entspricht er diesem nicht genau. Dies führt dazu, dass die individuellen Werte in jeder Stichprobe näher am Stichprobenmittelwert liegen (der tatsächlich das Maß der zentralen Tendenz für diese Daten ist) als am Populationsmittelwert. Fällig,

Um diese Diskrepanz zu korrigieren, wird eine Einheit vom Nenner subtrahiert, um die Standardabweichung der Stichprobe größer und damit näher an der Standardabweichung der Grundgesamtheit zu machen.

Unterschied 3: Sie sind selten gleich

Unabhängig von den Korrekturen, die an der Standardabweichung der Stichprobe vorgenommen werden können, entspricht sie selten der Standardabweichung der Grundgesamtheit. Dies liegt daran, dass Daten innerhalb einer Grundgesamtheit zufällig variieren können, sodass unterschiedliche Stichproben zu unterschiedlichen Standardabweichungen der Stichprobe führen. Tatsächlich gibt es je nach Größe der Stichprobe eine ganze Verteilung möglicher Werte der Stichproben-Standardabweichungen.

Unterschied 4: Die Standardabweichung der Stichprobe kann immer bekannt oder bestimmt werden, während die Standardabweichung der Grundgesamtheit fast nie mit Sicherheit bekannt ist.

Ein weiterer wichtiger Unterschied zwischen diesen beiden Streuungsmaßen besteht darin, dass die Populationsstandardabweichung (und tatsächlich jeder Populationsparameter) selten bekannt ist. Dies liegt teilweise an technischen oder wirtschaftlichen Einschränkungen, da es sehr teuer ist und zudem wahrscheinlich nicht alle Daten einer Population messen kann. In anderen Fällen ist die Bestimmung der Populationsparameter einfach unmöglich, entweder weil die Population unendlich ist oder weil wir einfach keinen Zugang zu allen Elementen haben, aus denen sie besteht.

Mit anderen Worten, wir kennen fast nie alle N Werte von x i in einer Grundgesamtheit, was es unmöglich macht, den Mittelwert, die Varianz und damit die Standardabweichung der Grundgesamtheit zu berechnen. Das Beste, was wir erfahren können, ist eine Punktschätzung eines Parameters wie der Standardabweichung oder eines Intervalls von Werten, innerhalb dessen wir ein gewisses Maß an Vertrauen haben, dass die Standardabweichung oder ein anderer Populationsparameter liegt.

Bei Stichproben hingegen kennen wir alle Daten, sodass wir immer die Standardabweichung jeder Stichprobe berechnen können, unabhängig von ihrer Größe.

Zusammenfassung der Unterschiede zwischen Populations- und Stichproben-Standardabweichungen

Die folgende Tabelle fasst die Unterschiede zwischen der Grundgesamtheits-Standardabweichung und der Stichproben-Standardabweichung zusammen, die in den vorangegangenen Abschnitten besprochen wurden:

Charakteristisch Bevölkerungsstandardabweichung Stichproben-Standardabweichung
Symbol σ Ja
Berechnet wird für Bevölkerungsdaten Beispieldaten
Zweig der Statistik, in dem es verwendet wird Beschreibende Statistik Inferenzstatistik
Art der Maßnahme Parameter Statistisch
Formel Teilen Sie durch N, die Größe der Bevölkerung Teilen Sie durch n – 1, wobei n die Stichprobengröße ist
Variabilität Es ist für eine bestimmte Population zu einem bestimmten Zeitpunkt festgelegt Variiert von Stichprobe zu Stichprobe, unabhängig davon, ob die Stichproben dieselbe Größe haben und aus derselben Population stammen
Gewissheit in seinem Wert Es ist im Allgemeinen unbekannt. Es liegt nur eine Schätzung vor. Sie ist für jede Probe bekannt

Verweise

Gemeinschaftliche Lernzentren. (nd). Die Standardabweichung . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R. (sf). Was ist der Unterschied zwischen der Stichprobe und der Standardabweichung der Grundgesamtheit ? Die Stimme. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, 1. Januar). Varianz und Standardabweichung, Beispiele und Übungen . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, 27. Januar). Warum einen verschonen? Populationsparameter schätzen . Betäuben. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, 26. Oktober). Typische oder Standardabweichung . Universelle Formeln. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Werbung-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados