Intervale de încredere pentru diferența a două proporții ale populației

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Intervalele de încredere (IC) sunt utilizate în statisticile inferențiale ca instrument de estimare a valorii unui parametru de populație. Acestea oferă o cantitate mai mare de informații despre valoarea adevărată a unui parametru decât estimatorii punctuali, deoarece reprezintă un interval de valori de lățime finită în care avem un anumit grad de încredere că se va afla adevărata valoare a parametrului. Acesta din urmă este ceva pe care estimatorii punctuali nu îl oferă.

Intervale de încredere pentru două populații

Când suntem interesați să comparăm două populații diferite, suntem adesea interesați să știm dacă un anumit parametru al uneia dintre ele este mai mare decât, mai mic sau egal cu parametrul corespunzător al celeilalte. De exemplu, atunci când comparăm performanța a două motoare electrice, putem fi interesați să stabilim dacă cuplul motorului A este sau nu mai mare decât cel al motorului B. În acest caz, comparăm două medii populaționale.

Cu toate acestea, de multe ori ne interesează să comparăm nu valorile medii ale unui parametru, ci proporția unei populații care îndeplinește sau nu o anumită condiție. În acest caz, se dorește stabilirea unui interval de încredere pentru a estima valoarea diferenței dintre două proporții ale populației.

Inferențe despre diferența dintre două proporții ale populației P 1 – P 2

Există multe situații diferite în care ne-ar putea interesa diferența dintre două proporții ale populației. După cum am menționat anterior, această diferență ne permite să comparăm proporții echivalente în două populații diferite. Câteva exemple de probleme de cercetare care necesită stabilirea unui interval de încredere pentru diferența dintre două proporții ale populației sunt prezentate mai jos:

  • În studiile clinice ale unui nou tratament medical, este de o importanță deosebită compararea proporției de indivizi care prezintă o îmbunătățire a stării lor medicale în populația care a primit tratamentul cu aceeași proporție în grupul de indivizi care au primit doar placebo.
  • Când vrem să comparăm proporția de femei și bărbați care sunt de acord sau nu cu o anumită măsură guvernamentală.
  • În afaceri, suntem adesea interesați să comparăm calitatea procesului de fabricație în două linii de producție diferite. În acest caz, se pot compara proporțiile articolelor defecte sau neconforme produse de ambele linii de producție într-o anumită perioadă de timp.
  • În domeniul microbiologiei, ne-ar putea interesa să comparăm proporția de colonii bacteriene care supraviețuiesc după ce au fost tratate cu diferiți dezinfectanți chimici.
  • Specialiștii în marketing fac adesea teste A/B pentru a determina ce conținut de pe o pagină web este cel mai eficient în conversia potențialilor în cumpărători. Pentru a face acest lucru, jumătate dintre persoanele care accesează site-ul web li se afișează conținut (A), iar cealaltă jumătate este afișat conținut alternativ (B) pentru a compara apoi proporțiile de vizitatori care au cumpărat efectiv produsul sau serviciul sugerat.

De la comparația dintre P 1 și P 2 la diferența P 1 – P 2

Există mult mai multe exemple de situații în care ne-ar putea interesa să comparăm proporțiile a două populații diferite. Această comparație poate fi făcută în moduri diferite. De exemplu, putem dori să știm dacă:

  • Ambele proporții sunt egale (P 1 = P 2 )
  • Proporția 1 este mai mare decât proporția 2 (P 1 > P 2 )
  • Proporția 1 este mai mică decât proporția 2 (P 1 < P 2 )

În oricare dintre aceste cazuri, aceste afirmații pot fi rescrise în funcție de diferența dintre proporții:

  • Dacă ne interesează să aflăm dacă P 1 = P 2 , aceasta este echivalentă cu a determina dacă P 1 – P 2 = 0
  • Dacă ne interesează să aflăm dacă P 1 > P 2 , aceasta este echivalentă cu a determina dacă P 1 – P 2 > 0
  • Dacă ne interesează să aflăm dacă P 1 < P 2 , aceasta este echivalentă cu a determina dacă P 1 – P 2 < 0

Prin urmare, orice comparație între proporțiile populației poate fi rezolvată prin găsirea unui interval de încredere pentru diferența dintre proporțiile populației și apoi efectuând o analiză adecvată a rezultatului.

Dar cum sunt stabilite aceste intervale de încredere?

Acest lucru se realizează prin analiza eșantioanelor din fiecare populație și utilizarea instrumentelor statisticii inferențiale. Această procedură depinde dacă lucrăm cu mostre mari sau mici.

Interval de încredere Estimarea diferenței a două proporții ale populației din eșantioane mari (n ≥ 30)

Intervalul de încredere pentru diferența în proporțiile populației poate fi rezolvat ca o extensie a intervalului de încredere pentru o proporție binomială dintr-o populație. În cazul proporțiilor binomiale (adică rezultatul experimentului sau al observației este un succes sau un eșec și P reprezintă probabilitatea de succes), distribuția proporției într-un eșantion mare ( p ) urmează o distribuție aproximativ normală cu medie P (proporția populației) și varianța P(1 – P)/n , atâta timp cât probabilitatea de succes nu este prea mare sau prea mică (adică nu prea aproape de 1 sau respectiv 0).

În cazul diferenței dintre două proporții ale populației, P 1 – P 2 , se pot stabili limitele intervalului de încredere din două eșantioane independente cu proporțiile p 1 și p 2 . Dacă aceste eșantioane îndeplinesc aceleași condiții ca mai sus (probele n 1 și n 2 mari, iar proporțiile p 1 și p 2 departe de 1 și 0) și, prin urmare, urmează distribuții normale, diferența va urma și o distribuție normală cu medie P 1 – P 2 și varianța p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

Având în vedere aceste rezultate, un interval de încredere pentru diferența a două proporții ale populației obținute din eșantioane mari, cu un nivel de încredere de 100(1 – α)%, unde α reprezintă nivelul de semnificație, este dat de:

Intervale de încredere pentru diferența a două proporții ale populației

În formula de mai sus, Z α/2 corespunde valorii lui Z în distribuția normală standard care lasă o zonă de α/2 în dreapta sa.

Interval de încredere pentru diferența a două proporții ale populației din eșantioane mici (n < 30)

Dacă dimensiunea eșantionului este mai mică de 30 sau dacă oricare dintre proporții este foarte aproape de 0 sau 1, distribuția dvs. nu poate aproxima în mod adecvat o distribuție normală. Nici în acest caz diferența celor două proporții nu va urma o distribuție normală, motiv pentru care nu se aplică formula de mai sus pentru intervalul de încredere.

Deducerea despre diferența în proporțiile populației pe baza unor eșantioane mici este considerabil complexă și depășește scopul acestui articol.

Interpretarea intervalului de încredere pentru diferența a două proporții ale populației

După calcularea intervalului de încredere pentru diferența a două proporții ale populației, rezultatul obținut trebuie interpretat. Pot fi date trei rezultate care sunt interpretate diferit.

Să considerăm orice caz în care se obține un interval de încredere cu un nivel de încredere de 100(1 – α)% sau, pur și simplu, un nivel de semnificație al α, ale cărui limite inferioare și superioare sunt LI și, respectiv, LS. Adică:

Intervale de încredere pentru diferența a două proporții ale populației

În funcție de semnul limitelor obținute, putem ajunge la concluzii diferite privind diferența dintre ambele proporții ale populației:

  • Dacă atât limitele inferioare, cât și cele superioare sunt negative, atunci putem spune, cu un nivel de încredere de 100(1 – α)%, că proporția în populația 2 este mai mare decât proporția respectivă în populația 1. Adică putem spune că P 1 < P 2 sau că P 2 > P 1 .
  • Dacă limita inferioară este negativă, iar limita superioară pozitivă și, prin urmare, intervalul de încredere conține zero, atunci putem spune, cu un nivel de încredere de 100(1 – α)%, că nu există nicio diferență între cele două proporții ale populației. . Adică se concluzionează că P 1 = P 2 .
  • În sfârșit, dacă atât limitele inferioare, cât și cele superioare sunt pozitive, atunci putem spune, cu un nivel de încredere de 100(1 – α)%, că proporția populației 1 este mai mare decât proporția respectivă a populației 2. Adică tragem concluzia că P 1 > P 2 .

Exemplu de calcul al intervalului de încredere pentru două proporții ale populației

afirmație

Să presupunem că a fost efectuat un sondaj pe un eșantion aleatoriu de 250 de studenți mexicani la inginerie pentru a afla ce proporție dintre ei stăpâneau conceptul de intervale de încredere. Rezultatele sondajului au arătat că 64,8% dintre ei nu o domină, în timp ce restul o domină. Pe de altă parte, același sondaj a fost realizat pe un eșantion de 180 de studenți spanioli la inginerie, cărora 54 de studenți au răspuns că au stăpânit conceptul de intervale de încredere.

Există o diferență între proporțiile studenților spanioli și mexicani care stăpânesc conceptul de intervale de încredere, la un nivel de semnificație de 0,05?

Soluţie

După cum putem vedea din întrebare, ceea ce dorim este să stabilim dacă există sau nu o diferență între proporțiile a două populații diferite. Proporția de interes constă în proporția de studenți care chiar stăpânesc conceptul de intervale de încredere, astfel încât, în acest caz, răspunsul afirmativ la sondaj reprezintă succes din punctul de vedere al experimentului binom.

Pentru populația de studenți mexicani, eșantionul a fost de 250 de studenți, iar aceștia indică faptul că proporția studenților care nu stăpânesc disciplina în cauză este de 64,8%. Dar nu aceasta este proporția pe care o dorim, deoarece a nu stăpâni subiectul este un eșec. Prin urmare, această proporție corespunde complementului q . Având în vedere acest lucru, proporția de succese, p, pentru eșantionul de studenți mexicani este:

Intervale de încredere pentru diferența a două proporții ale populației

Pe de altă parte, în cazul eșantionului de studenți spanioli, avem numărul de reușite și mărimea totală a eșantionului, deci proporția reușitelor va fi:

Intervale de încredere pentru diferența a două proporții ale populației

Aceste rezultate sunt rezumate în tabelul următor.

Studenți mexicani studenți spanioli
n MEX = 250 nESP = 180
p MEX = 0,352 p ESP = 0,300

După cum putem vedea, ambele dimensiuni ale eșantioanelor sunt considerabil mai mari decât 30, deci sunt considerate eșantioane mari. În plus, nici proporția studenților mexicani, nici cea a studenților spanioli nu este considerabil apropiată de 0 sau 1. În cele din urmă, în ciuda faptului că enunțul nu o specifică, putem presupune că ambele eșantioane sunt independente unul de celălalt.

În aceste condiții, putem spune că atât proporțiile de eșantion ale ambelor populații, cât și diferența de proporții ale eșantionului vor urma o distribuție normală. Prin urmare, putem folosi ecuația anterioară pentru a determina intervalul de încredere, care va fi:

Intervale de încredere pentru diferența a două proporții ale populației

Rețineți că, pentru a stabili intervalul de încredere, avem nevoie de valoarea lui Z pentru jumătate din nivelul de semnificație dat, care în acest caz este α = 0,05. Adică trebuie să găsim Z α/2 = Z 0,05/2 = Z 0,025 . Această valoare poate fi găsită într-un tabel de distribuție normal standard, folosind o aplicație de statistică mobilă sau folosind o foaie de calcul precum Excel pentru Windows sau Numbers pentru MacOS.

În acest caz, Z 0,025 = 1,959964. Deci, intervalul de încredere va fi:

Intervale de încredere pentru diferența a două proporții ale populației

Intervale de încredere pentru diferența a două proporții ale populației

Intervale de încredere pentru diferența a două proporții ale populației

După cum putem observa, intervalul de încredere astfel calculat conține zero, motiv pentru care se concluzionează, cu un nivel de încredere de 95%, că nu există o diferență semnificativă între proporțiile studenților mexicani și spanioli care stăpânesc conceptul de intervale. .de încredere.

Referințe

Cetinkaya-Rundel, M. (2012, 13 martie). Cursul 14: Inferența eșantionului mare și mic pentru proporții . Departamentul de Științe Statistice de la Universitatea Duke. https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

del Rio, AQ (2019, 1 septembrie). 7.8 Interval de încredere pentru diferența de proporții. | Statistici de bază îndulcite . Rezervați jos. https://bookdown.org/aquintela/EBE/confidence-interval-for-the-difference-of-proportions-.html

Holmes, A., Illowsky, B. și Dean, S. (29 noiembrie 2017). 10.4 Compararea a două proporții independente ale populației – Statistici introductive de afaceri . OpenStax. https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020, 7 mai). RPubs – Intervale de încredere pentru diferența a două proporții ale populației . RPubs. https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

Statologii. (nd). Interval de încredere pentru diferența de proporții . https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportions/

-Publicitate-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados