728x90
반응형
SMALL

통계학 4

나이브 베이즈(Naive Bayes)

나이브 베이즈(Naive Bayes)는 통계학과 머신 러닝에서 분류 문제를 해결하기 위한 간단하면서도 효과적인 확률적 분류 알고리즘 중 하나입니다. 이는 베이즈 이론을 기반으로 하며, 각 특징(Feature)이 독립적이라는 가정에 기초하여 분류를 수행합니다. 1. 베이즈 이론(Bayes' Theorem): 베이즈 이론은 조건부 확률을 계산하는 데 사용됩니다. 주어진 사건 B가 발생했을 때, 사건 A가 발생할 조건부 확률을 계산합니다. 2. 나이브 베이즈 분류(Naive Bayes Classification): 나이브 베이즈 분류는 특징들 사이의 조건부 독립 가정을 기반으로 합니다. 이는 각 특징이 주어진 클래스에 대해 조건부로 독립적이라는 가정을 함으로써 간단한 모델을 만듭니다. 이 가정은 실제 데이터에..

IT 이론지식 2024.04.01

왜도(Skewness), 첨도(Kurtosis)

왜도(Skewness)와 첨도(Kurtosis)는 통계학에서 사용되는 중요한 개념으로, 데이터의 분포를 설명하는 데 사용됩니다. 주로 분포의 대칭성과 뾰족한 정도를 측정하는 데 사용됩니다. 왜도 (Skewness): 왜도는 데이터 분포의 비대칭성을 측정하는 지표입니다. 왜도는 분포가 왼쪽으로 치우쳤는지(음수), 오른쪽으로 치우쳤는지(양수), 또는 대칭인지(0)를 나타냅니다. 왜도가 0에 가까울수록 분포는 대칭에 가깝습니다. 음수일 때는 왼쪽으로, 양수일 때는 오른쪽으로 비대칭성이 발생합니다. 왜도가 0보다 크면 오른쪽으로 긴 꼬리를 갖는 분포이고, 0보다 작으면 왼쪽으로 긴 꼬리를 갖습니다. 첨도 (Kurtosis): 첨도는 데이터 분포의 뾰족한 정도를 측정하는 지표입니다. 첨도는 분포가 정규분포와 비교..

IT 이론지식 2024.04.01

귀무가설, 대립가설

귀무가설과 대립가설은 통계학에서 중요한 개념으로, 가설 검정에 사용됩니다. 가설 검정은 어떤 가설이 사실인지를 결정하기 위해 수행되며, 이 과정에서 귀무가설과 대립가설이 사용됩니다. 귀무가설 (Null Hypothesis): 귀무가설은 일반적으로 연구자나 분석가가 주장하려는 가설이 아닌, 반대의 입장을 나타내는 가설입니다. 귀무가설은 일종의 "디폴트" 가설로, 특정한 효과나 관계가 존재하지 않는다고 가정합니다. 통계적 검증을 통해 이 귀무가설이 기각되면, 대립가설을 받아들이게 됩니다. 예를 들어, 두 집단 간의 평균이 같다는 가설은 귀무가설로 설정될 수 있습니다. 대립가설 (Alternative Hypothesis): 대립가설은 연구자나 분석가가 주장하려는 가설을 나타냅니다. 즉, 특정한 효과나 관계가 ..

IT 이론지식 2024.04.01

주성분분석(Principal Component Analysis, PCA)

주성분분석(Principal Component Analysis, PCA)은 다변량 데이터 세트의 차원을 축소하거나 데이터의 구조를 파악하기 위한 통계적 기법입니다. 주성분 분석은 고차원 데이터를 저차원 공간으로 변환함으로써 데이터의 정보를 최대한 보존하면서 더 간결하고 해석하기 쉬운 형태로 변환하는 목적을 가지고 있습니다. PCA는 다양한 분야에서 차원 축소, 데이터 시각화, 패턴 인식, 노이즈 제거 등 다양한 용도로 활용됩니다. PCA의 핵심 개념과 과정은 다음과 같습니다: 공분산 행렬 계산: PCA는 먼저 데이터의 공분산 행렬을 계산합니다. 공분산은 변수들 간의 관계를 나타내며, 변수들 사이의 상관 관계를 포함합니다. 이를 통해 데이터의 분산과 구조를 파악할 수 있습니다. 고유값 분해: 다음으로, 공..

IT 이론지식 2024.03.21
728x90
반응형
LIST