Tabla de Contenidos
A megbízhatósági intervallumokat (CI) a következtetési statisztikákban egy populációs paraméter értékének becslésére szolgáló eszközként használják. Ezek nagyobb mennyiségű információt adnak egy paraméter valódi értékéről, mint a pontbecslők, mivel véges szélességű értékek intervallumát képviselik, amelyen belül bizonyos fokú biztonsággal megvan a paraméter valódi értéke. Ez utóbbi olyan dolog, amit a pontbecslések nem biztosítanak.
Konfidencia intervallumok két populációra
Amikor két különböző populáció összehasonlítására vagyunk kíváncsiak, gyakran az érdekel bennünket, hogy az egyik paramétere nagyobb-e, kisebb-e vagy egyenlő-e a másik megfelelő paraméterével. Például két villanymotor teljesítményének összehasonlításakor érdekelhet bennünket annak meghatározása, hogy az A motor nyomatéka nagyobb-e, mint a B motoré. Ebben az esetben két populációs átlagot hasonlítunk össze.
Sokszor azonban nem egy paraméter átlagértékeinek összehasonlítása érdekel bennünket, hanem egy adott feltételnek megfelelő vagy nem teljesítő populáció aránya . Ebben az esetben egy konfidenciaintervallum felállítása a két populációs arány különbségének becslésére.
Következtetések két népességarány P 1 -P 2 különbségére
Sok különböző helyzet van, amikor két népességarány közötti különbség érdekelhet bennünket. Mint korábban említettük, ez a különbség lehetővé teszi, hogy összehasonlítsuk az egyenértékű arányokat két különböző populációban. Az alábbiakban bemutatunk néhány példát azokra a kutatási problémákra, amelyek megkövetelik a két népességarány közötti különbség konfidenciaintervallumának meghatározását :
- Egy új gyógyászati kezelés klinikai vizsgálatai során különösen fontos összehasonlítani azon egyének arányát, akiknél javult az egészségi állapotuk a kezelésben részesült populációban, és a csak placebót kapó egyének csoportjában.
- Amikor össze akarjuk hasonlítani azon nők és férfiak arányát, akik egyetértenek vagy nem értenek egyet egy bizonyos kormányzati intézkedéssel.
- Az üzleti életben gyakran érdekel bennünket a gyártási folyamat minőségének összehasonlítása két különböző gyártósoron. Ebben az esetben összehasonlítható a mindkét gyártósoron egy adott időszakban előállított hibás vagy nem megfelelő cikkek aránya.
- A mikrobiológia területén érdekelhet bennünket a különböző kémiai fertőtlenítőszerekkel való kezelés után fennmaradó baktériumkolóniák arányának összehasonlítása.
- A marketingszakemberek gyakran végeznek A/B-teszteket, hogy meghatározzák, hogy egy weboldal mely tartalma a leghatékonyabb a potenciális ügyfelek vásárlókká történő alakításában. Ennek érdekében a webhelyet felkeresők fele tartalmat (A), a másik felének pedig alternatív tartalmat (B) jelenít meg, hogy összehasonlítsa azon látogatók arányát, akik valóban megvásárolták a javasolt terméket vagy szolgáltatást.
P 1 és P 2 összehasonlításából a P 1 – P 2 különbséghez
Számos példa van még olyan helyzetekre, amelyekben érdekelhet bennünket két különböző populáció arányának összehasonlítása. Ez az összehasonlítás többféleképpen is elvégezhető. Például érdemes tudni, ha:
- Mindkét arány egyenlő (P 1 = P 2 )
- Az 1. arány nagyobb, mint a 2. arány (P 1 > P 2 )
- Az 1. arány kisebb, mint a 2. arány (P 1 < P 2 )
Ezen esetek bármelyikében ezek az állítások átírhatók az arányok közötti különbség szempontjából:
- Ha kíváncsiak vagyunk arra, hogy P 1 = P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 = 0
- Ha kíváncsiak vagyunk arra, hogy P 1 > P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 > 0
- Ha kíváncsiak vagyunk arra, hogy P 1 < P 2 , akkor ez megegyezik annak meghatározásával, hogy P 1 – P 2 < 0
Ezért a népességarányok bármilyen összehasonlítása megoldható úgy, hogy megtaláljuk a népességarányok közötti különbség konfidencia intervallumát, majd elvégezzük az eredmény megfelelő elemzését.
De hogyan jönnek létre ezek a konfidenciaintervallumok?
Ezt az egyes sokaságokból származó minták elemzésével és a következtetési statisztika eszközeivel érik el. Ez az eljárás attól függ, hogy nagy vagy kis mintákkal dolgozunk.
Konfidenciaintervallum Két populációarány különbségének becslése nagy mintákból (n ≥ 30)
A populációs arányok különbségére vonatkozó konfidenciaintervallum megoldható a populáció binomiális arányának konfidenciaintervallumának kiterjesztéseként. Binomiális arányok esetén (azaz a kísérlet vagy megfigyelés eredménye sikeres vagy kudarc, és P a siker valószínűségét jelenti), az arány eloszlása egy nagy mintában (p ) megközelítőleg normális eloszlást követ átlaggal . P (a populáció aránya) és P(1 – P)/n variancia, mindaddig, amíg a siker valószínűsége nem túl magas vagy túl alacsony (azaz nem esik túl közel 1-hez vagy 0-hoz).
Két populációs arány különbsége, P 1 – P 2 esetén, két független, p 1 és p 2 arányú mintából állapíthatjuk meg a konfidenciaintervallum határait . Ha ezek a minták megfelelnek a fenti feltételeknek (az n 1 és n 2 minták nagyok, a p 1 és p 2 arányok távol vannak 1-től és 0-tól), és ezért normális eloszlást követnek, akkor a különbség is egy normál eloszlást követ, átlagos P 1 értékkel – P 2 és variancia p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .
Ezen eredmények ismeretében a nagy mintákból kapott két populációs arány különbségének konfidenciaintervallumát 100(1 – α)%-os konfidenciaszinttel, ahol α jelenti a szignifikancia szintet, a következőképpen adjuk meg:
A fenti képletben Z α/2 Z értékének felel meg a normál normál eloszlásban, amely α/2 területet hagy tőle jobbra.
Konfidenciaintervallum két populációarány különbségéhez kis mintákhoz képest (n < 30)
Ha bármelyik minta mérete kisebb, mint 30, vagy ha bármelyik arány nagyon közel van a 0-hoz vagy az 1-hez, akkor az eloszlása nem tudja megfelelően megközelíteni a normál eloszlást. Ebben az esetben a két arány különbsége sem fog normális eloszlást követni, ezért a fenti képlet a konfidenciaintervallumra nem érvényes.
A népességarányok különbségére a kis mintákon alapuló következtetés meglehetősen összetett, és túlmutat e cikk keretein.
Két populációs arány különbségének konfidenciaintervallumának értelmezése
A két populációs arány különbségére vonatkozó konfidenciaintervallum kiszámítása után a kapott eredményt értelmezni kell. Három eltérően értelmezett eredmény adható meg.
Tekintsünk minden olyan esetet, amikor egy konfidenciaintervallumot 100(1 – α)%-os konfidenciaszinttel vagy egyszerűen α szignifikanciaszinttel kapunk, amelynek alsó és felső határa LI, illetve LS. Vagyis:
A kapott határértékek előjelétől függően eltérő következtetésekre juthatunk a két népességarány különbségére vonatkozóan:
- Ha az alsó és a felső határ is negatív, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy a 2. sokaság aránya nagyobb, mint az 1. sokaság megfelelő aránya. hogy P 1 < P 2 vagy hogy P 2 > P 1 .
- Ha az alsó határ negatív, a felső határ pedig pozitív, és ezért a konfidenciaintervallum nullát tartalmaz, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy nincs különbség a két népességarány között. . Vagyis arra a következtetésre jutunk, hogy P 1 = P 2 .
- Végül, ha mind az alsó, mind a felső határ pozitív, akkor 100(1 – α)%-os konfidenciaszinttel azt mondhatjuk, hogy az 1. sokaság aránya nagyobb, mint a megfelelő 2. sokaság aránya. P 1 > P 2 .
Példa két populációs arány konfidenciaintervallumának kiszámítására
nyilatkozat
Tegyük fel, hogy 250 mexikói mérnökhallgatóból álló véletlenszerű mintán végeztek egy felmérést, hogy megtudják, milyen arányban sajátítják el a konfidenciaintervallum fogalmát. A felmérés eredményei azt mutatták, hogy 64,8%-uk nem uralja, míg a többiek igen. Másrészt ugyanezt a felmérést 180 spanyol mérnökhallgatóból álló mintán végezték el, amelyre 54 hallgató azt válaszolta, hogy elsajátította a konfidenciaintervallum fogalmát.
Van-e különbség azon spanyol és mexikói diákok aránya között, akik elsajátítják a konfidenciaintervallum fogalmát, 0,05-ös szignifikanciaszinten?
Megoldás
Ahogy a kérdésből láthatjuk, azt szeretnénk meghatározni, hogy van-e különbség két különböző populáció arányai között. Az érdeklődés aránya azon hallgatók arányából adódik, akik elsajátítják a konfidenciaintervallum fogalmát, így ebben az esetben a felmérésre adott igenlő válasz a binomiális kísérlet szempontjából sikert jelent.
A mexikói hallgatók körében a minta 250 diák volt, és azt jelzik, hogy a tárgyat nem sajátító hallgatók aránya 64,8%. De nem ezt az arányt szeretnénk, hiszen a tárgy el nem sajátítása kudarc. Ezért ez az arány megfelel a q komplementernek . Ennek fényében a sikeresek aránya, p, a mexikói diákok mintájában:
Ezzel szemben a spanyol diákok mintájánál megvan a sikeresek száma és a minta teljes nagysága, így a sikeresek aránya a következő lesz:
Ezeket az eredményeket az alábbi táblázat foglalja össze.
mexikói diákok | spanyol diákok |
n MEX = 250 | nESP = 180 |
p MEX = 0,352 | p ESP = 0,300 |
Amint látjuk, mindkét mintaméret jóval nagyobb, mint 30, ezért nagy mintának számítanak. Ráadásul sem a mexikói, sem a spanyol diákok aránya nem közelíti meg lényegesen a 0-t vagy az 1-et. Végül annak ellenére, hogy az állítás ezt nem határozza meg, feltételezhetjük, hogy mindkét minta független egymástól.
Ilyen körülmények között azt mondhatjuk, hogy mind a két populáció mintaaránya, mind a mintaarányok különbsége normális eloszlást fog követni. Ezért az előző egyenlet segítségével meghatározhatjuk a konfidencia intervallumot, amely a következő lesz:
Vegyük észre, hogy a konfidenciaintervallum megállapításához szükségünk van a Z értékére az adott szignifikanciaszint felénél, ami ebben az esetben α = 0,05. Vagyis meg kell találnunk a Z α/2 = Z 0,05/2 = Z 0,025 értéket . Ez az érték megtalálható egy szabványos normál eloszlási táblázatban, egy mobil statisztikai alkalmazás vagy egy táblázat használatával, például Excel for Windows vagy Numbers for MacOS használatával.
Ebben az esetben Z 0,025 = 1,959964. Tehát a konfidencia intervallum a következő lesz:
Amint látjuk, az így számított konfidenciaintervallum nullát tartalmaz, ezért 95%-os konfidenciaszinttel arra a következtetésre jutunk, hogy nincs szignifikáns különbség az intervallum fogalmát elsajátító mexikói és spanyol diákok aránya között. Megbízható.
Hivatkozások
Cetinkaya-Rundel, M. (2012, március 13.). 14. előadás: Nagy- és kismintás következtetés az arányokhoz . Statisztikai Tanszék a Duke Egyetemen. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf
del Rio, AQ (2019, szeptember 1.). 7.8. Konfidenciaintervallum az aránykülönbséghez. | Édesített alapstatisztika . Foglaljon le. https://bookdown.org/aquintela/EBE/privacy-interval-for-the-difference-of-proportions-.html
Holmes, A., Illowsky, B. és Dean, S. (2017, november 29.). 10.4 Két független népességarány összehasonlítása – Bevezető üzleti statisztikák . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions
Icedo Félix, M. (2020, május 7.). RPubs – Konfidenciaintervallumok két populációs arány különbségéhez . RPubs. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional
Statológusok. (nd). Az aránykülönbség konfidencia intervalluma . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/