Wie man ein Konfidenzintervall eines Bevölkerungsanteils konstruiert

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Das Konfidenzintervall eines statistischen Parameters ist der geschätzte Wertebereich, den dieser Parameter annehmen kann; Mit anderen Worten, es handelt sich um zwei Werte, zwischen denen dieser Parameter mit einem gewissen Maß an Vertrauen variieren kann. Die Berechnung des Konfidenzintervalls ist Teil der Bestimmung eines statistischen Parameters einer Grundgesamtheit; der Wert des Parameters wird an einer Stichprobe der Grundgesamtheit bestimmt und im selben Berechnungsprozess wird das Konfidenzintervall des erhaltenen Werts des Parameters bestimmt. Ein Parametertyp, der unter Verwendung von Inferenzstatistik geschätzt werden kann, ist ein Anteil einer Bevölkerung.

Beispielsweise kann gefragt werden, wie viel Prozent der Bevölkerung eines Landes ein bestimmtes Gesetz unterstützt. Bei dieser Art von Fragen ist es notwendig, ein Konfidenzintervall für den ermittelten Wert festzulegen. Wir werden weiter unten sehen, wie das Konfidenzintervall eines Teils einer Population konstruiert wird, wodurch ein Teil seiner theoretischen Grundlage offengelegt wird.

Wie bereits erwähnt, ist das Konfidenzintervall eines statistischen Parameters definiert als zwei Werte, zwischen denen dieser Parameter mit einem bestimmten Konfidenzniveau variieren kann; der Parameterschätzer liegt in der Mitte dieses Bereichs. Somit hat ein Konfidenzintervall die Form

Schätzer +/- Unsicherheit

Daher müssen zwei Zahlen bestimmt werden: die Schätzung des Parameters, den wir untersuchen, und die Unsicherheit oder Fehlerspanne.

Berechnungsvoraussetzungen

Zur Durchführung einer statistischen Berechnung ist es erforderlich, dass bestimmte Prämissen erfüllt sind, die für diese spezifische Bestimmung definiert wurden. Im Fall der Bestimmung eines Konfidenzintervalls zur Bewertung eines Anteils einer Grundgesamtheit gelten die folgenden Prämissen.

1. Eine zufällig gezogene Stichprobe aus einer signifikant großen Grundgesamtheit muss ausgewertet werden. Die Stichprobe enthält eine Anzahl von Fällen n .

2. Die Mitglieder der Stichprobe sind unabhängig voneinander auszuwählen.

3. Es müssen mindestens 15 Erfolge und 15 Fehler in der Stichprobe der Größe n vorliegen .

Anteil von Stichprobe und Grundgesamtheit

Betrachten wir das Verfahren zur Schätzung eines Anteils in einer Population. So wie ein Stichprobenmittelwert zum Schätzen eines Populationsmittelwerts verwendet wird, kann ein Stichprobenanteil auch zum Schätzen eines Populationsanteils verwendet werden. Der Bevölkerungsanteil ist der unbekannte Parameter, er ist der zu bestimmende Wert. Zur Berechnung dieses Parameters werden die in der Stichprobe registrierten Erfolge addiert und das Ergebnis der Summe durch n dividiert , die Gesamtzahl der Fälle in der Stichprobe. wir werden p anrufenzum Parameter der zu untersuchenden Bevölkerung der Anteil der Bevölkerung, der ein bestimmtes Kriterium erfüllt. Auf die gleiche Weise haben wir den Anteil in der Stichprobe, den wir, um ihn vom Anteil der Bevölkerung zu unterscheiden, eine Linie darüber setzen, wie in den folgenden Formeln gezeigt. Der Anteil in der Stichprobe ist der Schätzer des Anteils an der Grundgesamtheit.

Um das Konfidenzintervall eines Teils einer Grundgesamtheit zu bestimmen, muss man seine statistische Verteilung kennen, wie in der folgenden Abbildung dargestellt.

Statistische Verteilung des Bevölkerungsanteils.
Statistische Verteilung des Bevölkerungsanteils.

Mit der statistischen Verteilung ist es möglich, den Schätzer und die Standardabweichung SE zu bestimmen , Werte, die das Konfidenzintervall darstellen

Konfidenzintervall

mit einem Konfidenzniveau

Vertrauensniveau

Bei diesen statistischen Problemen hat die Standardabweichung SE ein binomiales Verhalten als Funktion des Schätzers von p , dem Anteil positiver Fälle in der Stichprobe der Größe n der Grundgesamtheit, wie die folgende Formel zeigt.

Standardabweichung

Die allgemeine Definition verwendet den p- Wert in der Formel für die Standardabweichung, die ein unbekannter Wert ist, also wird der Standardfehler verwendet, wobei p für seinen Schätzer eingesetzt wird, wie die vorherige Formel zeigt.

Ein weiterer zu berücksichtigender Aspekt ist, dass unter den drei aufgestellten Prämissen die Binomialverteilung durch die Standardnormalverteilung angenähert werden kann.

Auf diese Weise erhält man die Formel zur Bestimmung des Konfidenzintervalls eines Bevölkerungsanteils.

Konfidenzintervall eines Anteils einer Bevölkerung.

Das Konfidenzniveau wird als Prozentsatz bestimmt, der in der Standardnormalverteilung zu berücksichtigen ist, wie in der vorherigen Abbildung gezeigt; Je größer die Fläche, desto höher ist das Konfidenzniveau für das Konfidenzintervall. Die folgende Tabelle zeigt die Werte des Parameters für die verschiedenen Werte des Konfidenzniveaus, die das abzudeckende Verbreitungsgebiet ausdrücken.

Vertrauensniveau.

Beispiel zur Bestimmung eines Konfidenzintervalls für einen Bevölkerungsanteil

Angenommen, wir möchten den Prozentsatz der Wähler in einer Stadt, die sich mit einer bestimmten politischen Partei identifizieren, mit 95 %iger Sicherheit wissen. Wir sammeln die Informationen in einer einfachen Zufallsstichprobe von 100 Personen in dieser Stadt und stellen fest, dass sich 64 von ihnen mit der politischen Partei identifizieren.

Zunächst prüfen wir, ob die drei von uns aufgestellten Prämissen erfüllt sind. Die Meinung der Bevölkerung einer Stadt, einer signifikant großen Bevölkerung, wird ausgewertet und die Stichprobe wird zufällig gezogen. In diesem Fall ist n gleich 100. Die Informationen für einen gegebenen der 100 Fälle wurden unabhängig gesammelt. Sowohl die positiven Antworten auf die Konsultation, dh die Erfolge, als auch die negativen Antworten, dh die Misserfolge, überschreiten 15 Fälle.

Der Wert des Anteils der Stichprobe, der Schätzer des Parameters, den wir bestimmen wollen, also der Anteil der Bevölkerung der Stadt, der sich mit der betreffenden politischen Partei identifiziert, wird als Quotient aus den positiven Fällen und ermittelt die Anzahl von n , aus denen die Stichprobe besteht; 64 geteilt durch 100, 0,64. Dies ist der Wert des Schätzers und der Mittelpunkt des Konfidenzintervalls.

In der Formel zur Bewertung der Unsicherheit gibt es zwei Faktoren. Der erste Faktor ist das Konfidenzniveau, das mit 95 % bestimmt wurde, für das der Faktor 1,96 beträgt. Um den zweiten Faktor auszuwerten, müssen die Werte 0,64 und 100 in die Formel eingesetzt werden, und es ergibt sich, dass der Wert des zweiten Faktors 0,048 beträgt. Mit dem Produkt beider Faktoren erhält man die Unsicherheit; 0,094. Das Konfidenzintervall in diesem Beispiel ist also

0,640 +/- 0,094

Dieses Konfidenzintervall kann dahingehend interpretiert werden, dass bei einer Konfidenz von 95 %, d. h. dass die Ergebnisse 95 % der Gesamtbevölkerung repräsentieren, der Anteil der Menschen in der betreffenden Stadt, die sich mit der politischen Partei identifizieren, zwischen 54,6 % und liegt 73,4 %.

Verwandte statistische Konzepte

Es gibt eine Reihe von Ideen und statistischen Problemen, die bei der Bestimmung dieser Art von Konfidenzintervallen eine Rolle spielen. Beispielsweise könnten wir einen Hypothesentest in Bezug auf den Wert des Bevölkerungsanteils durchführen. Wir könnten auch zwei Proportionen aus zwei verschiedenen Populationen vergleichen.

Quellen

Stimmung, Alexander; Graybill, Franklin A.; Boes, Duane C. Einführung in die Theorie der Statistik . Dritte Ausgabe, McGraw-Hill, 1974.

Hypothesentest . Statistische Inferenz. Nationale Autonome Universität von Mexiko. Zugriff Oktober 2021.

Westfall, Peter H. Fortgeschrittene statistische Methoden verstehen . Boca Raton, FL: CRC Press, 2013.

-Werbung-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados