Как да конструираме доверителен интервал на пропорция на населението

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

Доверителният интервал на статистически параметър е диапазонът от стойности, които се оценява, че този параметър може да приеме; С други думи, това са две стойности, между които този параметър може да варира с определено ниво на увереност. Изчисляването на доверителния интервал е част от определянето на статистически параметър на популация; стойността на параметъра се определя върху извадка от популацията и в същия процес на изчисление се определя доверителният интервал на стойността на параметъра, който е получен. Един тип параметър, който може да бъде оценен с помощта на инференциална статистика, е съотношението на населението.

Например, може да се зададе въпрос какъв е процентът от населението на една страна, което подкрепя определен закон. При този тип въпроси е необходимо да се определи доверителен интервал за стойността, която се определя. По-долу ще видим как е конструиран доверителният интервал на част от населението, разкривайки част от неговата теоретична основа.

Както вече беше споменато, доверителният интервал на статистически параметър се определя като две стойности, между които този параметър може да варира с определено ниво на доверие; оценителят на параметъра се намира в центъра на този диапазон. По този начин доверителният интервал ще има формата

оценител +/- несигурност

Следователно ще има две числа, които трябва да бъдат определени: оценката на параметъра, който изучаваме, и несигурността или допустимата грешка.

Изчислителни помещения

За извършване на статистическо изчисление е необходимо да бъдат изпълнени определени предпоставки, определени за това конкретно определяне. В случай на определяне на доверителен интервал за оценка на част от популация, предпоставките са следните.

1. Извадка, взета на случаен принцип от популация, която е значително голяма по размер, трябва да бъде оценена. Извадката ще има брой случаи n .

2. Членовете на извадката трябва да бъдат избрани независимо един от друг.

3. Трябва да има поне 15 успеха и 15 неуспеха в извадката с размер n .

Съотношение на извадка и популация

Нека да разгледаме процедурата за извършване на оценка на пропорция в популация. Точно както извадковата средна стойност се използва за оценка на средната популация, пропорционалната пропорция може също да се използва за оценка на пропорцията на популацията. Делът на населението е неизвестният параметър, това е стойността, която трябва да се определи. Начинът за изчисляване на този параметър е чрез добавяне на успехите, регистрирани в извадката и разделяне на резултата от сумата на n , общия брой случаи в извадката. ще наречем pкъм параметъра на популацията, която трябва да бъде изследвана, делът на популацията, която отговаря на определен критерий. По същия начин ще имаме пропорцията в извадката, която, за да я разграничим от пропорцията на популацията, ще поставим линия над нея, както е показано в следващите формули. Делът в извадката е оценката на дела в популацията.

За да се определи доверителният интервал на част от съвкупността, е необходимо да се знае какво е нейното статистическо разпределение, както е показано на следващата фигура.

Статистическо разпределение на дела на населението.
Статистическо разпределение на дела на населението.

Със статистическото разпределение е възможно да се определи оценителят и стандартното отклонение SE , стойности, които представляват доверителния интервал

доверителен интервал

с ниво на увереност

ниво на увереност

В тези статистически проблеми стандартното отклонение SE има биномно поведение като функция на оценителя на p , делът на положителните случаи в извадката с размер n от популацията, както е показано от следната формула.

Стандартно отклонение

Общата дефиниция използва p- стойността във формулата за стандартното отклонение, което е неизвестна стойност, така че се използва стандартната грешка, замествайки p за нейния оценител, както показва предишната формула.

Друг аспект, който трябва да се има предвид, е, че при трите предпоставки, които са установени, биномното разпределение може да бъде приблизително приближено до стандартното нормално разпределение.

По този начин се получава формулата за определяне на доверителния интервал на част от съвкупността.

Доверителен интервал на част от популацията.

Нивото на достоверност се определя като процент, който трябва да се вземе предвид в стандартното нормално разпределение, както е показано на предишната фигура; колкото по-голяма е площта, толкова по-високо е нивото на доверие в доверителния интервал. Следната таблица показва стойностите на параметъра за различните стойности на нивото на достоверност, които изразяват зоната на разпространение, която трябва да бъде покрита.

Ниво на увереност.

Пример за определяне на доверителен интервал за съотношение на населението

Да предположим, че искаме да знаем с 95% увереност процента на електората в даден град, който се идентифицира с дадена политическа партия. Ние събираме информацията в проста произволна извадка, съставена от 100 души в този град и откриваме, че 64 от тях се идентифицират с политическата партия.

Първо проверяваме дали трите предпоставки, които установихме, са изпълнени. Оценява се мнението на населението на един град, значително по-голямо население, и извадката се взема на случаен принцип. В този случай n е равно на 100. Информацията за даден от 100 случая е събрана независимо. Както положителните отговори на консултацията, тоест успехите, така и отрицателните отговори, тоест неуспехите, надхвърлят 15 случая.

Стойността на пропорцията на извадката, оценката на параметъра, който искаме да определим, тоест делът на населението на града, който се идентифицира с въпросната политическа партия, се определя като частното между положителните случаи и броя на n , които съставляват извадката; 64 делено на 100, 0,64. Това е стойността на оценителя и е центърът на доверителния интервал.

Във формулата, която оценява несигурността, има два фактора. Първият фактор е нивото на доверие, което е определено на 95%, за което факторът ще бъде 1,96. За да се оцени вторият фактор, стойностите 0,64 и 100 трябва да бъдат заменени във формулата и се получава, че стойността на втория фактор е 0,048. С произведението на двата фактора се получава несигурността; 0,094. Така че доверителният интервал в този пример е

0,640 +/- 0,094

Този доверителен интервал може да се тълкува като, че с увереност от 95%, т.е. че резултатите представляват 95% от общото население, делът на хората във въпросния град, които се идентифицират с политическата партия, ще бъде между 54,6% и 73,4 %.

Свързани статистически понятия

Има редица идеи и статистически въпроси, свързани с определянето на този тип доверителен интервал. Например, можем да извършим тест на хипотеза, свързан със стойността на пропорцията на населението. Можем също да сравним две пропорции от две различни популации.

Източници

Настроение, Александър; Грейбил, Франклин А.; Boes, Duane C. Въведение в теорията на статистиката . Трето издание, McGraw-Hill, 1974 г.

Тест на хипотезата . Статистически извод. Национален автономен университет на Мексико. Достъп през октомври 2021 г.

Westfall, Peter H. Разбиране на съвременните статистически методи . Бока Ратон, Флорида: CRC Press, 2013 г.

mm
Sergio Ribeiro Guevara (Ph.D.)
(Doctor en Ingeniería) - COLABORADOR. Divulgador científico. Ingeniero físico nuclear.

Artículos relacionados