Przedziały ufności dla różnicy dwóch proporcji populacji

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Przedziały ufności (CI) są wykorzystywane w statystyce wnioskowania jako narzędzie do szacowania wartości parametru populacji. Zapewniają one większą ilość informacji o prawdziwej wartości parametru niż estymatory punktowe, ponieważ reprezentują przedział wartości o skończonej szerokości, w którym mamy pewien stopień pewności, że prawdziwa wartość parametru będzie się mieścić. To ostatnie jest czymś, czego estymatory punktowe nie zapewniają.

Przedziały ufności dla dwóch populacji

Kiedy jesteśmy zainteresowani porównaniem dwóch różnych populacji, często interesuje nas, czy określony parametr jednej z nich jest większy, mniejszy lub równy odpowiadającemu parametrowi drugiej. Na przykład, porównując osiągi dwóch silników elektrycznych, możemy być zainteresowani ustaleniem, czy moment obrotowy silnika A jest większy niż silnika B. W tym przypadku porównujemy dwie średnie z populacji.

Jednak często jesteśmy zainteresowani porównaniem nie średnich wartości parametru, ale proporcji populacji , która spełnia lub nie spełnia określonego warunku. W tym przypadku potrzebne jest ustalenie przedziału ufności, aby oszacować wartość różnicy między dwiema proporcjami populacji.

Wnioskowanie o różnicy dwóch proporcji populacyjnych P 1 -P 2

Istnieje wiele różnych sytuacji, w których możemy być zainteresowani różnicą między dwiema proporcjami populacji. Jak wspomnieliśmy wcześniej, ta różnica pozwala nam porównać równoważne proporcje w dwóch różnych populacjach. Poniżej przedstawiono kilka przykładów problemów badawczych wymagających ustalenia przedziału ufności dla różnicy między dwiema proporcjami populacji :

  • W badaniach klinicznych nowego leczenia szczególnie ważne jest porównanie odsetka osób wykazujących poprawę stanu zdrowia w populacji otrzymującej leczenie z takim samym odsetkiem w grupie osób otrzymujących samo placebo.
  • Kiedy chcemy porównać odsetek kobiet i mężczyzn, którzy zgadzają się lub nie zgadzają się z określonym środkiem rządowym.
  • W biznesie często interesuje nas porównanie jakości procesu produkcyjnego na dwóch różnych liniach produkcyjnych. W tym przypadku można porównać proporcje sztuk wadliwych lub niezgodnych wyprodukowanych przez obie linie produkcyjne w zadanym okresie czasu.
  • W dziedzinie mikrobiologii może nas interesować porównanie odsetka kolonii bakteryjnych, które przeżywają po potraktowaniu różnymi chemicznymi środkami dezynfekującymi.
  • Marketerzy często przeprowadzają testy A/B, aby określić, jakie treści na stronie internetowej najskuteczniej przekształcają potencjalnych klientów w kupujących. W tym celu połowie osób, które uzyskują dostęp do witryny, wyświetla się treść (A), a drugiej połowie treść alternatywną (B), aby następnie porównać proporcje odwiedzających, którzy faktycznie kupili sugerowany produkt lub usługę.

Od porównania P 1 i P 2 do różnicy P 1 – P 2

Przykładów sytuacji, w których możemy być zainteresowani porównaniem proporcji dwóch różnych populacji, jest znacznie więcej. Możemy dokonać tego porównania na różne sposoby. Na przykład możemy chcieć wiedzieć, czy:

  • Obie proporcje są równe (P 1 = P 2 )
  • Proporcja 1 jest większa niż proporcja 2 (P 1 > P 2 )
  • Proporcja 1 jest mniejsza niż proporcja 2 (P 1 < P 2 )

W każdym z tych przypadków stwierdzenia te można przepisać pod względem różnicy między proporcjami:

  • Jeśli jesteśmy zainteresowani ustaleniem, czy P 1 = P 2 , jest to równoważne z ustaleniem, czy P 1 – P 2 = 0
  • Jeśli jesteśmy zainteresowani ustaleniem, czy P 1 > P 2 , jest to równoważne określeniu, czy P 1 – P 2 > 0
  • Jeśli jesteśmy zainteresowani ustaleniem, czy P 1 < P 2 , jest to równoważne z ustaleniem, czy P 1 – P 2 < 0

Dlatego każde porównanie między proporcjami populacji można rozwiązać, znajdując przedział ufności dla różnicy między proporcjami populacji, a następnie przeprowadzając odpowiednią analizę wyniku.

Ale jak ustala się te przedziały ufności?

Osiąga się to poprzez analizę próbek z każdej populacji i wykorzystanie narzędzi statystyki inferencyjnej. Ta procedura zależy od tego, czy pracujemy z dużymi, czy małymi próbkami.

Przedział ufności Oszacowanie różnicy dwóch proporcji populacji z dużych prób (n ≥ 30)

Przedział ufności dla różnicy w proporcjach populacji można rozwiązać jako przedłużenie przedziału ufności dla proporcji dwumianowej w populacji. W przypadku proporcji dwumianowych (tj. wynikiem eksperymentu lub obserwacji jest sukces lub porażka, a P oznacza prawdopodobieństwo sukcesu), rozkład proporcji w dużej próbie ( p ) ma w przybliżeniu rozkład normalny ze średnią P (odsetek populacji) i wariancja P(1 – P)/n , o ile prawdopodobieństwo sukcesu nie jest zbyt wysokie lub zbyt niskie (tj. nie jest zbyt bliskie odpowiednio 1 lub 0).

W przypadku różnicy między dwiema proporcjami populacji P 1 – P 2 możemy wyznaczyć granice przedziału ufności z dwóch niezależnych prób o proporcjach p 1 i p 2 . Jeżeli próbki te spełniają te same warunki co powyżej (próby n 1 i n 2 duże, a proporcje p 1 i p 2 dalekie od 1 i 0) i dlatego mają rozkłady normalne, różnica będzie również podlegać rozkładowi normalnemu ze średnią P 1 – P 2 i wariancja p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

Biorąc pod uwagę te wyniki, przedział ufności dla różnicy dwóch proporcji populacji uzyskanych z dużych prób, z poziomem ufności 100(1 – α)%, gdzie α reprezentuje poziom istotności, jest określony wzorem:

Przedziały ufności dla różnicy dwóch proporcji populacji

W powyższym wzorze Z α/2 odpowiada wartości Z w standardowym rozkładzie normalnym, który pozostawia obszar α/2 po swojej prawej stronie.

Przedział ufności dla różnicy dwóch proporcji populacji z małych prób (n < 30)

Jeśli wielkość próby jest mniejsza niż 30 lub jeśli któraś z proporcji jest bardzo bliska 0 lub 1, Twój rozkład nie może odpowiednio przybliżać rozkładu normalnego. W tym przypadku różnica obu proporcji również nie będzie miała rozkładu normalnego, dlatego powyższy wzór na przedział ufności nie ma zastosowania.

Wnioskowanie o różnicy w proporcjach populacji na podstawie małych próbek jest dość złożone i wykracza poza zakres tego artykułu.

Interpretacja przedziału ufności dla różnicy dwóch proporcji populacji

Po obliczeniu przedziału ufności dla różnicy dwóch proporcji populacyjnych uzyskany wynik należy zinterpretować. Można podać trzy wyniki, które są różnie interpretowane.

Rozważmy dowolny przypadek, w którym uzyskuje się przedział ufności z poziomem ufności 100(1 – α)% lub po prostu z poziomem istotności α, którego dolna i górna granica to odpowiednio LI i LS. To jest do powiedzenia:

Przedziały ufności dla różnicy dwóch proporcji populacji

W zależności od znaku otrzymanych granic możemy dojść do różnych wniosków dotyczących różnicy między obiema proporcjami populacji:

  • Jeśli zarówno dolna, jak i górna granica są ujemne, możemy powiedzieć, z poziomem ufności 100(1 – α)%, że proporcja w populacji 2 jest większa niż odpowiednia proporcja w populacji 1. Oznacza to, że możemy powiedzieć że P 1 < P 2 lub że P 2 > P 1 .
  • Jeśli dolna granica jest ujemna, a górna granica jest dodatnia, a zatem przedział ufności zawiera zero, to możemy powiedzieć, z poziomem ufności 100(1 – α)%, że nie ma między nimi różnicy. . Oznacza to, że wnioskuje się, że P 1 = P 2 .
  • Wreszcie, jeśli zarówno dolna, jak i górna granica są dodatnie, to możemy powiedzieć, z poziomem ufności 100(1 – α)%, że proporcja populacji 1 jest większa niż odpowiednia proporcja populacji 2. Oznacza to, że dochodzimy do wniosku, że P 1 > P 2 .

Przykład obliczenia przedziału ufności dla dwóch proporcji populacji

oświadczenie

Załóżmy, że przeprowadzono ankietę na losowej próbie 250 meksykańskich studentów inżynierii, aby dowiedzieć się, jaki odsetek z nich opanował koncepcję przedziałów ufności. Wyniki ankiety pokazały, że 64,8% z nich nie dominuje, reszta tak. Z drugiej strony to samo badanie przeprowadzono na próbie 180 hiszpańskich studentów inżynierii, na które 54 studentów odpowiedziało, że opanowali koncepcję przedziałów ufności.

Czy istnieje różnica między proporcjami uczniów hiszpańskich i meksykańskich, którzy opanowali koncepcję przedziałów ufności, na poziomie istotności 0,05?

Rozwiązanie

Jak widać z pytania, chcemy ustalić, czy istnieje różnica między proporcjami dwóch różnych populacji. Odsetek zainteresowania składa się z odsetka uczniów, którzy opanowali koncepcję przedziałów ufności, tak więc w tym przypadku twierdząca odpowiedź na ankietę oznacza sukces z punktu widzenia eksperymentu dwumianowego.

Dla populacji studentów meksykańskich próba liczyła 250 uczniów i wskazują one, że odsetek uczniów, którzy nie opanowali przedmiotowego przedmiotu, wynosi 64,8%. Ale nie o taką proporcję nam chodzi, bo nie opanowanie tematu to porażka. Dlatego ta proporcja odpowiada dopełnieniu q . W związku z tym proporcja sukcesów, p, dla próby studentów meksykańskich wynosi:

Przedziały ufności dla różnicy dwóch proporcji populacji

Z drugiej strony w przypadku próby studentów hiszpańskich mamy liczbę sukcesów i łączną liczebność próby, więc proporcja sukcesów będzie wynosić:

Przedziały ufności dla różnicy dwóch proporcji populacji

Wyniki te podsumowano w poniższej tabeli.

meksykańscy studenci studenci hiszpańscy
n MEX = 250 nESP = 180
p MEX = 0,352 pESP = 0,300

Jak widać, obie wielkości próbek są znacznie większe niż 30, więc są uważane za duże próbki. Ponadto ani odsetek studentów meksykańskich, ani hiszpańskich nie jest znacząco zbliżony do 0 lub 1. Wreszcie, mimo że stwierdzenie tego nie precyzuje, możemy założyć, że obie próby są od siebie niezależne.

W tych warunkach możemy powiedzieć, że zarówno proporcje próbek obu populacji, jak i różnica w proporcjach próbek będą miały rozkład normalny. Dlatego możemy użyć poprzedniego równania do wyznaczenia przedziału ufności, który będzie wynosił:

Przedziały ufności dla różnicy dwóch proporcji populacji

Zauważmy, że do ustalenia przedziału ufności potrzebujemy wartości Z dla połowy danego poziomu istotności, który w tym przypadku wynosi α = 0,05. Oznacza to, że musimy znaleźć Z α/2 = Z 0,05/2 = Z 0,025 . Tę wartość można znaleźć w standardowej tabeli rozkładu normalnego, używając mobilnej aplikacji statystycznej lub arkusza kalkulacyjnego, takiego jak Excel dla Windows lub Numbers dla MacOS.

W tym przypadku Z 0,025 = 1,959964. Zatem przedział ufności będzie wynosił:

Przedziały ufności dla różnicy dwóch proporcji populacji

Przedziały ufności dla różnicy dwóch proporcji populacji

Przedziały ufności dla różnicy dwóch proporcji populacji

Jak widać, obliczony w ten sposób przedział ufności zawiera zero, dlatego przy poziomie ufności 95% stwierdza się, że nie ma istotnej różnicy między proporcjami studentów meksykańskich i hiszpańskich, którzy opanowali pojęcie przedziałów zaufany.

Bibliografia

Cetinkaya-Rundel, M. (2012, 13 marca). Wykład 14: Wnioskowanie o proporcjach z dużej i małej próby . Wydział Nauk Statystycznych na Duke University. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

del Rio, AQ (2019, 1 września). 7.8 Przedział ufności dla różnicy proporcji. | Słodzone podstawowe statystyki . Zarezerwuj. https://bookdown.org/aquintela/EBE/confidence-interval-for-the-difference-of-proportions-.html

Holmes, A., Illowsky, B. i Dean, S. (2017, 29 listopada). 10.4 Porównanie dwóch niezależnych proporcji populacji — wstępne statystyki biznesowe . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020, 7 maja). RPubs – Przedziały ufności dla różnicy dwóch proporcji populacji . Puby. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

Statolodzy. (nd). Przedział ufności dla różnicy proporcji . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/

-Reklama-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

zmienne zależne