2 つの母集団比率の差の信頼区間

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


信頼区間 (CI) は、母集団パラメーターの値を推定するためのツールとして推論統計で使用されます。これらは、パラメーターの真の値が存在するというある程度の信頼がある有限幅の値の間隔を表すため、ポイント推定量よりもパラメーターの真の値に関するより多くの情報を提供します。後者は、点推定器が提供しないものです。

2 つの母集団の信頼区間

2 つの異なる母集団の比較に関心がある場合、一方の母集団の特定のパラメーターが他方の対応するパラメーターより大きいか、小さいか、または等しいかを知りたいことがよくあります。たとえば、2 つの電気モーターの性能を比較する場合、モーター A のトルクがモーター B のトルクよりも大きいかどうかを判断することに関心がある場合があります。この場合、2 つの母平均を比較しています。

ただし、多くの場合、パラメーターの平均値ではなく、特定の条件を満たすまたは満たさない母集団の割合を比較することに関心があります。この場合、信頼区間を確立して、2 つの母集団比率の差の値を推定する必要があります。

2 つの人口比率 P 1 -P 2の違いに関する推論

2 つの母集団比率の違いに関心を持つ可能性があるさまざまな状況が数多くあります。前述したように、この違いにより、2 つの異なる母集団で同等の割合を比較することができます。2 つの母集団比率の差の信頼区間を確立する必要がある研究問題の例を以下に示します。

  • 新しい医療の臨床試験では、治療を受けた集団で病状の改善を示す個人の割合と、プラセボのみを受けた個人のグループで同じ割合を比較することが特に重要です。
  • 特定の政府の措置に賛成または反対する女性と男性の割合を比較したい場合。
  • ビジネスでは、2 つの異なる生産ラインにおける製造プロセスの品質を比較することに関心があることがよくあります。この場合、一定期間内に両方の生産ラインで生産された不良品または不適合品の割合を比較できます。
  • 微生物学の分野では、さまざまな化学消毒剤で処理した後に生き残る細菌コロニーの割合を比較することに興味があるかもしれません.
  • マーケティング担当者は、Web ページのどのコンテンツが見込み客を購入者に変えるのに最も効果的かを判断するために、A/B テストを行うことがよくあります。これを行うには、Web サイトにアクセスした人の半数にコンテンツ (A) を表示し、残りの半数に代替コンテンツ (B) を表示して、提案された製品またはサービスを実際に購入した訪問者の割合を比較します。 .

P 1と P 2の比較からP 1 – P 2の違いまで

2 つの異なる母集団の割合を比較することに関心を持つ可能性がある状況の例は、他にもたくさんあります。この比較は、さまざまな方法で行うことができます。たとえば、次のことを知りたい場合があります。

  • 両方の比率が等しい (P 1 = P 2 )
  • 比率 1 が比率 2 より大きい (P 1 > P 2 )
  • 比率 1 は比率 2 より小さい (P 1 < P 2 )

これらのいずれの場合でも、これらのステートメントは、比率の違いに関して書き直すことができます。

  • P 1 = P 2かどうかを調べたい場合、これは P 1 – P 2 = 0かどうかを判断することと同じです。
  • P 1 > P 2かどうかを調べたい場合、これは P 1 – P 2 > 0かどうかを判断することと同じです。
  • P 1 < P 2かどうかを調べたい場合、これは P 1 – P 2 < 0かどうかを判断することと同じです。

したがって、母集団の比率間の比較は、母集団の比率の差の信頼区間を見つけてから、結果の適切な分析を実行することによって解決できます。

しかし、これらの信頼区間はどのように確立されるのでしょうか?

これは、各集団からのサンプルを分析し、推論統計のツールを使用することによって達成されます。この手順は、サンプルが大きいか小さいかによって異なります。

信頼区間 大規模なサンプル (n ≥ 30) からの 2 つの母集団比率の差の推定

母集団の比率の差の信頼区間は、母集団の二項比率の信頼区間の延長として解くことができます。二項比率の場合 (つまり、実験または観察の結果は成功または失敗であり、P は成功の確率を表します)、大きな標本 ( p ) の比率の分布は、平均値を含むほぼ正規分布に従います成功の確率が高すぎたり低すぎたりしない限り (つまり、それぞれ 1 または 0 に近すぎない)、P (母集団の割合) と分散 P(1 – P)/n 。

2 つの母集団比率 P 1 – P 2の差の場合、比率 p 1と p 2を持つ 2 つの独立したサンプルから信頼区間の限界を確立できます。これらのサンプルが上記と同じ条件 (サンプル n 1と n 2が大きく、比率 p 1と p 2 が1 と 0 から離れている) を満たし、したがって正規分布に従う場合、差も平均 P 1の正規分布に従います。 P 2と分散 p 1 (1 – p 1 )/n 1 + p 2(1 – p 2 )/n 2 .

これらの結果を考えると、大規模なサンプルから得られた 2 つの母集団比率の差の信頼区間は、100(1 – α)% の信頼水準 (α は有意水準を表す) で与えられます。

2 つの母集団比率の差の信頼区間

上記の式では、Z α/2 は、その右側に α/2 の領域を残す標準正規分布の Z の値に対応します。

小さなサンプルからの 2 つの母集団比率の差の信頼区間 (n < 30)

いずれかのサンプル サイズが 30 未満の場合、またはいずれかの比率が 0 または 1 に非常に近い場合、分布は正規分布を適切に近似できません。この場合、2 つの比率の差も正規分布に従わないため、上記の信頼区間の式は適用されません。

小さなサンプルに基づく人口比率の違いに関する推論はかなり複雑であり、この記事の範囲を超えています。

2 つの母比率の差の信頼区間の解釈

2 つの母集団比率の差の信頼区間を計算した後、得られた結果を解釈する必要があります。解釈の異なる 3 つの結果が得られます。

信頼区間が 100(1 – α)% の信頼水準、または単純に有意水準 α で得られ、その下限と上限がそれぞれ LI と LS である場合を考えてみましょう。つまり、次のようになります。

2 つの母集団比率の差の信頼区間

得られた極限の符号に応じて、両方の母集団比率の違いに関して異なる結論に達することができます。

  • 下限と上限の両方が負の場合、信頼水準 100(1 – α)% で、母集団 2 の割合は母集団 1 のそれぞれの割合よりも大きいと言えます。つまり、 P 1 < P 2または P 2 > P 1
  • 下限が負で上限が正で、したがって信頼区間にゼロが含まれる場合、信頼水準 100(1 – α)% で、2 つの間に差はないと言えます。 . すなわち、P=Pと結論される。
  • 最後に、下限と上限の両方が正の場合、信頼水準 100(1 – α)% で、母集団 1 の割合がそれぞれの母集団 2 の割合よりも大きいと言えます。 P 1 > P 2

2 つの母比率の信頼区間の計算例

声明

メキシコの工学系学生 250 人を無作為抽出して調査を実施し、信頼区間の概念を習得した学生の割合を調べたとします。調査の結果、64.8% が支配的ではなく、残りは支配的であることが示されました。一方、スペインの工学部の学生 180 人を対象に同様の調査を行ったところ、54 人の学生が信頼区間の概念を習得したと回答しました。

有意水準 0.05 で、信頼区間の概念を習得しているスペイン人とメキシコ人の学生の割合に違いはありますか?

解決

質問からわかるように、私たちが求めているのは、2 つの異なる母集団の比率に違いがあるかどうかを判断することです。関心の割合は、信頼区間の概念を習得している学生の割合で構成されているため、この場合、調査に肯定的に応答することは、二項実験の観点からは成功を表します。

メキシコの学生人口の場合、サンプルは 250 人の学生であり、問​​題の科目を習得していない学生の割合が 64.8% であることを示しています。しかし、主題を習得しないことは失敗であるため、これは私たちが望む比率ではありません。したがって、この比率は補数qに対応します。これを考慮すると、メキシコ人学生のサンプルの成功率 p は次のようになります。

2 つの母集団比率の差の信頼区間

一方、スペイン人学生のサンプルの場合、成功の数とサンプルの合計サイズがあるため、成功の割合は次のようになります。

2 つの母集団比率の差の信頼区間

これらの結果を次の表にまとめます。

メキシコ人留学生 スペイン人学生
n MEX = 250 nESP = 180
pMEX = 0.352 p ESP = 0.300

ご覧のとおり、どちらのサンプル サイズも 30 よりかなり大きいため、大きなサンプルと見なされます。さらに、メキシコの学生の割合もスペインの学生の割合も 0 または 1 にかなり近いものではありません。

これらの条件下では、両方の母集団のサンプル比率とサンプル比率の差の両方が正規分布に従うと言えます。したがって、前の式を使用して信頼区間を決定できます。これは次のようになります。

2 つの母集団比率の差の信頼区間

信頼区間を確立するには、指定された有意水準の半分の Z の値が必要であることに注意してください。この場合は α = 0.05 です。つまり、Z α/2 = Z 0.05/2 = Z 0.025を見つける必要があります。この値は、モバイル統計アプリケーションを使用するか、Windows の Excel や MacOS の Numbers などのスプレッドシートを使用して、標準の正規分布表で見つけることができます。

この場合、Z 0.025 = 1.959964 です。したがって、信頼区間は次のようになります。

2 つの母集団比率の差の信頼区間

2 つの母集団比率の差の信頼区間

2 つの母集団比率の差の信頼区間

ご覧のとおり、この方法で計算された信頼区間にはゼロが含まれています。そのため、信頼水準 95% で、区間の概念を習得しているメキシコの学生とスペインの学生の割合に有意差はないと結論付けられています。信頼できる。

参考文献

Cetinkaya-Rundel、M. (2012 年 3 月 13 日)。講義 14: 比率の大小標本推論. デューク大学の統計科学科。https://www2.stat.duke.edu/courses/Spring12/sta101.1/lec/lec14S.pdf

デル リオ、AQ (2019 年 9 月 1 日)。7.8 比率の差の信頼区間。| | 甘い基本統計。ブックダウン。https://bookdown.org/aquintela/EBE/confidence-interval-for-the-difference-of-proportions-.html

Holmes, A.、Illowsky, B.、および Dean, S. (2017 年 11 月 29 日)。10.4 2 つの独立した人口比率の比較 – ビジネス統計の紹介. OpenStax。https://openstax.org/books/introductory-business-statistics/pages/10-4-comparing-two-independent-population-proportions

Icedo Félix, M. (2020 年 5 月 7 日)。RPubs – 2 つの母集団比率の差の信頼区間。Rパブ。https://rpubs.com/Melanie_Icedo/Asignacion-6_Intervalo-confianza-proportion-poblacional

統計学者。(nd)。比率の差の信頼区間https://statologos.com/diferencia-de-intervalo-de-fianza-en-proportiones/

-広告-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

実数は?

確率の公理

円周の計算