모집단과 표본 표준 편차의 차이

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.

기술 통계에는 모집단 데이터의 다양한 일반적인 측면을 관찰할 수 있는 일련의 측정이 있습니다. 일부는 데이터의 중심 경향을 측정하는 데 사용되는 반면, 다른 일부는 데이터의 가변성 또는 분산, 즉 데이터가 해당 중심 경향 주위에 분포되는 방식에 대한 아이디어를 제공하려고 합니다.

변동성 또는 분산의 두 가지 중요한 척도는 분산과 표준 편차입니다. 이 두 측정값은 서로 밀접하게 관련되어 있지만 분산에는 두 가지 버전이 있고 표준 편차에는 해당하는 두 가지 버전, 즉 모집단과 표본이 있습니다.

모집단 대 샘플 통계 요약

통계에서 일반적으로 일련의 데이터의 동작을 요약하고 서로 다른 맥락에서 사용되는 각 척도에 대해 두 가지 버전이 있다는 매우 중요한 사실을 주목할 가치가 있습니다.

우선 모집단(또는 모집단 데이터)의 데이터와 해당 모집단의 하위 집합(샘플이라고 함)의 데이터를 구분해야 합니다. 모집단 데이터와 샘플 데이터는 수학적으로 구별할 수 없지만 개념적으로는 매우 다릅니다.

인구 조사

인구 데이터는 통계적 인구 조사, 즉 인구를 구성하는 각 요소나 개체를 측정하거나 분석하여 얻은 데이터입니다(물론 유한한 경우에 한함). 모집단 데이터에 대한 중심 경향 또는 분산 측정을 계산할 때 모집단 매개변수라고 하는 모집단 의 일반적인 행동을 요약하는 측정값을 얻습니다. , 주어진 시간에 하나의 모드, 하나의 표준 편차 등). 이 경우 기술 통계를 사용하고 있습니다 .

견본 추출

한편, 다양한 상황에서 우리는 모집단의 일부 요소만을 분석하기 위해 샘플링 프로세스를 수행하여 샘플 데이터를 얻습니다. 이러한 경우 기술 통계 도구를 사용하여 이러한 데이터의 일반적인 동작을 관찰할 수도 있지만 실제로는 모집단에 대한 기술 통계를 수행하지 않고 샘플에 대해서만 수행합니다.

샘플의 수치 요약은 매개변수가 아니라 통계 라고 합니다 (일부는 이를 통계라고 부르기도 함). 모수와 달리 통계는 샘플이 동일한 모집단에서 추출된 경우에도 샘플마다 다릅니다. 모집단의 하위 집합을 선택할 때 표본을 구성할 수 있는 요소의 가능한 조합이 많기 때문입니다. 이러한 이유로 일반적으로 샘플은 다른 주제, 개인 또는 요소로 구성되어 다른 통계를 생성합니다.

샘플에 대한 이러한 통계를 계산하는 궁극적인 목적은 해당 통계를 각 모집단 매개변수의 추정기로 사용할 수 있도록 하는 것입니다. 표본 데이터에서 모집단 데이터의 동작을 추론하거나 추정하는 이 프로세스는 추론 통계가 담당하는 것입니다 . 이것은 모집단과 표본 분산 및 표준 편차를 본질적으로 다르게 만듭니다.

그러나 분산과 표준 편차는 정확히 무엇입니까?

차이는 무엇입니까?

분산은 데이터 세트의 평균에서 분산을 측정한 것입니다. 평균에서 모든 데이터의 제곱 편차의 평균으로 정의됩니다. 차이 제곱의 평균이므로 항상 양수입니다.

표준 편차는 무엇입니까?

반면에 표준 편차는 단순히 분산의 양의 제곱근입니다. 또한 평균 주변의 분산을 측정하며 데이터와 평균의 동일한 단위에 대해서만 수행합니다. 이것은 분산보다 이해하고 해석하기 쉽습니다.

표준 편차는 분산의 제곱근으로 계산되기 때문에 모집단과 표본 분산에 대해 이야기하지 않고 모집단과 표본 표준 편차에 대해 이야기하는 것은 말이 되지 않습니다.

평균 주변의 이러한 일반적인 분산 측정 간의 가장 중요한 차이점은 다음 섹션에서 자세히 설명합니다.

차이점 1: 모집단과 표본 표준 편차 및 분산은 서로 다른 기호로 표시됩니다.

모집단 및 표본 분산과 모집단 및 표본 표준 편차를 비교할 때 고려해야 할 첫 번째 차이점은 이를 나타내는 데 사용되는 기호입니다. 통계에서 모집단 수치 요약 또는 매개변수는 일반적으로 그리스 문자 를 사용하여 표시되는 반면 , 샘플 또는 통계 버전은 이에 상응하는 라틴 알파벳 문자로 표시됩니다 .

이러한 의미에서 분산과 모집단 표준 편차는 모두 소문자 그리스 문자 시그마와 연관되며 샘플 버전은 문자 s 로 표시됩니다 . 즉 , 모집단 분산은 σ2 이고 모집단 표준편차는 σ 이며 , 표본 분산은 s2 로 , 표본 표준편차는 s로 표현 된다 .

차이점 2: 서로 다른 공식을 통해 계산됩니다.

모집단과 표본 표준 편차는 모두 해당 분산의 양의 제곱근으로 계산됩니다.

모집단과 표본 표준 편차의 차이

그러나 모집단과 표본 분산은 약간 다른 공식을 사용하여 계산됩니다. 모집단 분산의 경우 모집단 평균에 대한 각 데이터의 제곱 편차의 평균으로 계산됩니다. 즉, 다음 등가 식 중 하나로 계산됩니다.

모집단과 표본 표준 편차의 차이

여기서 x i는 모집단의 각 데이터 항목 값을 나타내고 μ 는 모집단 평균을 나타내며 N은 모집단의 크기입니다. 따라서 모집단 표준 편차는 다음과 같이 계산됩니다.

모집단과 표본 표준 편차의 차이

대신 예상한 대로 데이터 포인트의 수 n 으로 나누는 대신 표본 평균에서 제곱 편차의 합을 n – 1 로 나누어 표본 분산을 계산합니다 . 즉, 표본 분산은 다음과 같이 계산됩니다.

모집단과 표본 표준 편차의 차이

여기서 x i는 표본의 각 데이터 항목 값을 나타내고 x̄는 표본 평균을 나타내며 n 은 표본 크기입니다. 위의 관점에서 샘플 표준 편차는 다음과 같이 계산됩니다.

모집단과 표본 표준 편차의 차이

n 대신 n – 1로 나누는 것에 대한 정당화

모집단과 표본 표준편차를 비교할 때 발생하는 일반적인 질문은 왜 n 으로 나누지 않고 n – 1 로 나누느냐는 것입니다 . 그 이유는 매우 간단합니다.

앞에서 언급한 것처럼 표본 표준 편차와 같은 통계 계산은 각 모집단 매개변수에 가능한 한 근접한 추정치를 설정하려고 합니다. 이는 결과가 모집단 표준 편차에 최대한 근접하도록 표본 표준 편차를 계산해야 함을 의미합니다.

이는 동일한 공식으로 계산해야 함을 시사하지만 항상 그런 것은 아닙니다. 문제는 표본 표준 편차가 모집단 평균이 아니라 표본 평균 주변의 산포를 측정한다는 것입니다. 표본 평균은 모집단 평균의 추정치로 사용되는 통계량이지만 정확히 같지는 않습니다. 이로 인해 각 샘플의 개별 값이 모집단 평균보다 샘플 평균(사실상 해당 데이터의 중심 경향 측정치)에 더 가까워집니다. 로 인한,

이 불일치를 수정하기 위해 분모에서 한 단위를 빼서 표본 표준 편차를 더 크게 만들고 따라서 모집단 표준 편차에 더 가깝게 만듭니다.

차이 3: 거의 같지 않다

표본 표준 편차에 대해 수행할 수 있는 수정에 관계없이 모집단 표준 편차와 거의 같지 않습니다. 이는 모집단 내에서 데이터가 무작위로 달라질 수 있기 때문에 샘플이 다르면 샘플 표준 편차가 달라지기 때문입니다. 실제로 표본의 크기에 따라 가능한 표본 표준 편차 값의 전체 분포가 있습니다.

차이점 4: 표본 표준 편차는 항상 알려지거나 결정될 수 있는 반면 모집단 표준 편차는 거의 확실하게 알려지지 않습니다.

이 두 분산 측정 간의 또 다른 중요한 차이점은 모집단 표준 편차(및 실제로 모든 모집단 매개변수)가 거의 알려져 있지 않다는 것입니다. 이것은 어떤 경우에는 매우 비싸고 더 나아가 모집단의 모든 데이터를 절대적으로 측정할 수 없을 가능성이 있기 때문에 기술적 또는 경제적 한계 때문입니다. 다른 경우에는 모집단 매개변수를 결정하는 것이 불가능합니다. 모집단이 무한하거나 모집단을 구성하는 모든 요소에 액세스할 수 없기 때문입니다.

즉, 우리는 모집단에서 x i 의 모든 N 값을 거의 알지 못하므로 모집단 평균, 분산 및 더 나아가 표준 편차를 계산하는 것이 불가능합니다. 우리가 알 수 있는 최선은 표준 편차와 같은 매개 변수의 점 추정치 또는 표준 편차 또는 기타 모집단 매개 변수가 있다는 어느 정도의 신뢰 수준을 갖는 값의 간격입니다.

반면 샘플의 경우 모든 데이터를 알고 있으므로 크기에 관계없이 모든 샘플의 표준 편차를 항상 계산할 수 있습니다.

모집단과 표본 표준 편차 간의 차이 요약

다음 표에는 이전 섹션에서 설명한 모집단 표준 편차와 표본 표준 편차 간의 차이가 요약되어 있습니다.

특성 모집단 표준편차 샘플 표준편차
상징 σ
에 대해 계산됩니다. 인구 데이터 샘플 데이터
사용되는 통계의 분기 기술통계 추론 통계
측정 유형 모수 통계
공식 모집단의 크기인 N으로 나누기 n – 1로 나눕니다. 여기서 n은 샘플 크기입니다.
가변성 주어진 시간에 주어진 인구에 대해 고정되어 있습니다. 표본이 동일한 크기이고 동일한 모집단에서 추출되었는지 여부에 관계없이 표본마다 다릅니다.
가치의 확실성 일반적으로 알려지지 않았습니다. 추정만 가능합니다. 각 샘플에 대해 알려져 있습니다.

참조

커뮤니티 학습 센터. (일차). 표준편차 . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

레비 사핀, R. (sf). 표본과 모집단 표준 편차의 차이는 무엇입니까 ? 그 목소리. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

메이트모바일. (2021년 1월 1일). 분산 및 표준 편차, 예 및 연습 . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016년 1월 27일). 왜 하나를 아끼나요? 모집단 모수 추정 . 마취하십시오. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020년 10월 26일). 일반 또는 표준 편차 . 우주 공식. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados