Tabla de Contenidos
왜도는 분포의 평균, 중앙값 및 모드가 서로 어떻게 관련되어 있는지에 따라 결정될 수 있습니다.
대칭인 단봉 분포, 즉 최빈값이 하나만 있는 분포에서는 평균, 중앙값 및 최빈값이 일치합니다. 반면에 치우친 분포에서는 대칭성을 잃고 평균과 중앙값이 모두 다른 위치에 나타납니다.
대칭 수준이 사라지면 양의 비대칭과 음의 비대칭이 발생합니다. 이러한 측정을 통해 랜덤 변수의 확률 분포가 갖는 비대칭 정도를 설정할 수 있습니다. 비대칭은 벨 플롯에서 쉽게 볼 수 있습니다.
모드를 기준축으로 하여 비대칭의 유형은 «꼬리»라고도 하는 양쪽 데이터의 분산 정도에 따라 정의됩니다.
분포가 대칭이면 평균의 왼쪽과 오른쪽에 같은 수의 값이 있습니다.
양성 비대칭
왜곡도가 양수이면 평균 오른쪽에 더 많은 값이 있기 때문에 그래프 곡선이 오른쪽으로 기울어집니다. 여기서 평균과 중앙값은 최빈값보다 큽니다. 대부분의 경우에도 평균이 중앙값보다 큽니다.
부정적인 비대칭
왜곡도가 음수이면 그래프 곡선이 왼쪽으로 기울어집니다. 즉, 평균 왼쪽에 더 많은 값이 있습니다.
음의 왜도에서는 평균과 중앙값이 최빈값보다 작습니다. 일반적으로 평균도 중앙값보다 작습니다.
분포의 왜도를 계산하는 방법
육안으로 그래프의 왜도를 판단하기 어려울 수 있으므로 분포의 왜도 정도를 정확히 알 수 있는 왜도 측정법이 있습니다.
이를 위해 다음이 사용됩니다.
- Pearson의 첫 번째 왜도 계수: 이것은 모드에서 평균을 빼고 그 차이를 데이터의 표준 편차로 나누는 것과 관련된 왜도의 척도입니다. 주로 단봉 분포에 사용됩니다.
- 두 번째 피어슨 왜도 계수는 데이터 세트의 왜도를 결정하는 데 사용되는 또 다른 평균입니다. 이 계산을 수행하려면 모드를 중앙값에서 빼야 합니다. 그런 다음 결과에 3을 곱하고 결과를 표준 편차로 나눕니다.
- 피셔의 비대칭 계수: 이 방법은 조금 더 복잡하며 관찰된 값이 평균에 대해 나타내는 편차를 기반으로 합니다. 세 번째 모멘트를 표준 편차로 나누어 계산합니다.
- Bowley-Yule 왜도 계수: 이 계산은 중앙값과 사분위수를 기반으로 합니다. 분포가 대칭인 경우 첫 번째 및 세 번째 사분위수는 중앙값에서 같은 거리에 위치합니다. 그러면 왜도가 0이 됩니다. 반면에 왜도가 양수이면 결과가 0보다 큽니다. 음수이면 이 값이 작아집니다.
서지
- 마르티네즈 피네다, A. (2018년 4월 4일). 배포 유형. RStudio. 이용 가능: https://rstudio-pubs-static.s3.amazonaws.com/377130_08851253a31b41d18c25fd08fad316c3.html
- Spiegel, M. 확률 및 통계. (2014). 스페인. 맥그로힐 인터아메리카나.
- Mullor Ibáñez, R. 기본 통계: I. 통계 소개 . (2017). 알리칸테 대학의 간행물.