IT 이론지식

왜도(Skewness), 첨도(Kurtosis)

쥐PT 2024. 4. 1. 12:49
728x90
반응형
SMALL

왜도(Skewness)와 첨도(Kurtosis)는 통계학에서 사용되는 중요한 개념으로, 데이터의 분포를 설명하는 데 사용됩니다. 주로 분포의 대칭성과 뾰족한 정도를 측정하는 데 사용됩니다.

 

왜도 (출처 : https://communities.sas.com/t5/SAS-Tech-Tip/SAS-%ED%99%9C%EC%9A%A9-%EB%85%B8%ED%95%98%EC%9A%B0-%EC%99%9C%EB%8F%84%EC%99%80-%EC%B2%A8%EB%8F%84/ta-p/866365)

 

첨도 (출처 : https://ko.wikipedia.org/wiki/%EC%B2%A8%EB%8F%84)

  1. 왜도 (Skewness):
    • 왜도는 데이터 분포의 비대칭성을 측정하는 지표입니다.
    • 왜도는 분포가 왼쪽으로 치우쳤는지(음수), 오른쪽으로 치우쳤는지(양수), 또는 대칭인지(0)를 나타냅니다.
    • 왜도가 0에 가까울수록 분포는 대칭에 가깝습니다. 음수일 때는 왼쪽으로, 양수일 때는 오른쪽으로 비대칭성이 발생합니다.
    • 왜도가 0보다 크면 오른쪽으로 긴 꼬리를 갖는 분포이고, 0보다 작으면 왼쪽으로 긴 꼬리를 갖습니다.
  2. 첨도 (Kurtosis):
    • 첨도는 데이터 분포의 뾰족한 정도를 측정하는 지표입니다.
    • 첨도는 분포가 정규분포와 비교하여 얼마나 뾰족한지를 나타냅니다.
    • 정규분포의 첨도는 3이며, 이보다 크면 뾰족한 정도가 크고, 작으면 뾰족한 정도가 작습니다.
    • 첨도가 0보다 크면 분포가 정규분포보다 뾰족하고, 0보다 작으면 더 평탄한 모양을 갖습니다.
  3. 왜도와 첨도의 해석:
    • 왜도와 첨도는 데이터의 분포를 이해하고 모델링하는 데 도움이 됩니다.
    • 왜도와 첨도가 0에 가까울수록 정규분포와 유사한 형태를 보입니다.
    • 왜도와 첨도가 0보다 크면 분포가 뾰족한 것으로 간주됩니다.
    • 왜도와 첨도를 시각화하여 데이터의 분포를 확인하고, 이상치를 탐지하거나 모델의 적합성을 판단하는 데 활용할 수 있습니다.

따라서 왜도와 첨도는 데이터 분포의 특성을 파악하는 데 중요한 지표로 사용되며, 데이터 분석 및 모델링 과정에서 자주 활용됩니다.

728x90
반응형
LIST

'IT 이론지식' 카테고리의 다른 글

나이브 베이즈(Naive Bayes)  (0) 2024.04.01
이산확률분포, 연속확률분포  (0) 2024.04.01
탐색적 데이터 분석(Exploratory Data Analysis, EDA)  (0) 2024.04.01
결측치, 이상치  (0) 2024.04.01
귀무가설, 대립가설  (0) 2024.04.01