Jak skonstruować przedział ufności proporcji populacji

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Przedział ufności parametru statystycznego to zakres wartości, jakie szacuje się, że ten parametr może przyjąć; Innymi słowy, są to dwie wartości, pomiędzy którymi ten parametr może zmieniać się z pewnym poziomem pewności. Obliczanie przedziału ufności jest częścią określania parametru statystycznego populacji; wartość parametru określa się na próbie populacji iw tym samym procesie obliczeniowym wyznacza się przedział ufności uzyskanej wartości parametru. Jednym z typów parametrów, które można oszacować za pomocą statystyki wnioskowania, jest odsetek populacji.

Na przykład pytanie, które można zadać, brzmi: jaki jest procent populacji kraju, który popiera określone prawo. W tego typu pytaniach konieczne jest wyznaczenie przedziału ufności dla wyznaczanej wartości. Zobaczymy poniżej, jak skonstruowany jest przedział ufności części populacji, odsłaniając część jego podstaw teoretycznych.

Jak już wspomniano, przedział ufności parametru statystycznego definiuje się jako dwie wartości, pomiędzy którymi ten parametr może zmieniać się z pewnym poziomem ufności; estymator parametru znajduje się w środku tego przedziału. Zatem przedział ufności będzie miał postać

estymator +/- niepewność

Dlatego należy określić dwie liczby: oszacowanie badanego parametru oraz niepewność lub margines błędu.

Przesłanki obliczeniowe

Do przeprowadzenia obliczeń statystycznych konieczne jest spełnienie pewnych przesłanek określonych dla tego konkretnego określenia. W przypadku wyznaczania przedziału ufności do oceny odsetka populacji przesłanki są następujące.

1. Należy ocenić próbkę pobraną losowo z populacji o znacznie większej liczebności. Próbka będzie miała liczbę przypadków n .

2. Członkowie próby muszą być wybrani niezależnie od siebie.

3. W próbie o wielkości n musi być co najmniej 15 sukcesów i 15 porażek .

Proporcja próby i populacji

Przyjrzyjmy się procedurze szacowania proporcji w populacji. Podobnie jak średnia z próby służy do oszacowania średniej populacji, proporcja próby może być również wykorzystana do oszacowania proporcji populacji. Proporcja populacji jest nieznanym parametrem, jest to wartość do ustalenia. Sposób obliczenia tego parametru polega na dodaniu sukcesów zarejestrowanych w próbie i podzieleniu wyniku sumy przez n , czyli całkowitą liczbę przypadków w próbie. zadzwonimy do pdo parametru populacji, która ma być badana, proporcja populacji, która spełnia określone kryterium. W ten sam sposób będziemy mieli proporcję w próbie, którą, aby odróżnić ją od proporcji populacji, umieścimy nad nią linię, jak pokazano w poniższych wzorach. Odsetek w próbie jest estymatorem odsetka w populacji.

Aby określić przedział ufności części populacji, należy wiedzieć, jaki jest jej rozkład statystyczny, jak pokazano na poniższym rysunku.

Rozkład statystyczny odsetka populacji.
Rozkład statystyczny odsetka populacji.

Za pomocą rozkładu statystycznego możliwe jest wyznaczenie estymatora i odchylenia standardowego SE , wartości stanowiących przedział ufności

przedział ufności

z poziomem ufności

poziom zaufania

W tych problemach statystycznych odchylenie standardowe SE zachowuje się dwumianowo jako funkcja estymatora p , odsetka przypadków dodatnich w próbie o wielkości n populacji, jak pokazano za pomocą następującego wzoru.

Odchylenie standardowe

Ogólna definicja wykorzystuje wartość p we wzorze na odchylenie standardowe, które jest nieznaną wartością, więc stosuje się błąd standardowy, zastępując jego estymator p , jak pokazuje poprzedni wzór.

Innym aspektem do rozważenia jest to, że przy trzech ustalonych przesłankach rozkład dwumianowy można przybliżyć za pomocą standardowego rozkładu normalnego.

W ten sposób uzyskuje się wzór na wyznaczenie przedziału ufności części populacji.

Przedział ufności części populacji.

Poziom ufności jest określany jako procent, który należy uwzględnić w standardowym rozkładzie normalnym, jak pokazano na poprzednim rysunku; im większy obszar, tym wyższy poziom ufności w przedziale ufności. Poniższa tabela przedstawia wartości parametru dla różnych wartości poziomu ufności, które wyrażają obszar rozkładu, który ma zostać pokryty.

Poziom zaufania.

Przykład wyznaczania przedziału ufności dla proporcji populacji

Załóżmy, że chcemy wiedzieć z 95% pewnością, jaki procent elektoratu w mieście identyfikuje się z daną partią polityczną. Zbieramy informacje na prostej próbie losowej składającej się ze 100 osób w tym mieście i stwierdzamy, że 64 z nich identyfikuje się z partią polityczną.

Najpierw sprawdzamy, czy trzy ustalone przez nas przesłanki są spełnione. Ocenia się opinię ludności miasta, która jest istotnie liczną populacją, a próba jest pobierana losowo. W tym przypadku n jest równe 100. Informacje dla danego jednego ze 100 przypadków zostały zebrane niezależnie. Zarówno pozytywne odpowiedzi na konsultacje, czyli sukcesy, jak i negatywne, czyli porażki, przekraczają 15 przypadków.

Wartość odsetka próby, estymatora parametru, który chcemy wyznaczyć, czyli odsetka ludności miasta identyfikującego się z daną partią polityczną, wyznacza się jako iloraz przypadków dodatnich i liczba n składających się na próbę; 64 podzielone przez 100, 0,64. Jest to wartość estymatora i środek przedziału ufności.

We wzorze oceniającym niepewność występują dwa czynniki. Pierwszym czynnikiem jest poziom ufności, który ustalono na 95%, dla którego współczynnik wyniesie 1,96. Aby ocenić drugi czynnik, we wzorze należy podstawić wartości 0,64 i 100 i otrzymuje się, że wartość drugiego czynnika wynosi 0,048. Z iloczynu obu czynników otrzymuje się niepewność; 0,094. Więc przedział ufności w tym przykładzie wynosi

0,640 +/- 0,094

Ten przedział ufności można interpretować w ten sposób, że przy poziomie ufności 95%, to znaczy, że wyniki reprezentują 95% całej populacji, odsetek osób w danym mieście, które identyfikują się z partią polityczną, wyniesie od 54,6% do 73,4%.

Powiązane pojęcia statystyczne

Istnieje wiele pomysłów i zagadnień statystycznych związanych z określaniem tego typu przedziału ufności. Na przykład możemy przeprowadzić test hipotezy związanej z wartością proporcji populacji. Moglibyśmy również porównać dwie proporcje z dwóch różnych populacji.

Źródła

Nastrój, Aleksander; Graybill, Franklin A.; Boes, Duane C. Wprowadzenie do teorii statystyki . Wydanie trzecie, McGraw-Hill, 1974.

Test hipotezy . Wnioskowanie statystyczne. Narodowy Autonomiczny Uniwersytet Meksyku. Dostęp w październiku 2021 r.

Westfall, Peter H. Zrozumienie zaawansowanych metod statystycznych . Boca Raton, Floryda: CRC Press, 2013.

-Reklama-

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados

zmienne zależne