회귀 가정 검사기

데이터에 대한 네 가지 선형 회귀 가정을 모두 확인하세요. 상세한 진단을 통해 선형성, 독립성, 등분산성 및 정규성을 테스트합니다.

Regression Assumptions Diagnostics Visualization

회귀 가정 검사기

데이터에 대한 네 가지 선형 회귀 가정을 모두 확인하세요. 상세한 진단을 통해 선형성, 독립성, 등분산성 및 정규성을 테스트합니다.

데이터 포인트를 입력하세요

# X 값 Y 값

사용 방법 회귀 가정 검사기

Model Validity

Ensure your regression results are reliable and your p-values are accurate.

Automated Tests

Runs statistical tests for linearity, normality, and homoscedasticity.

Remediation

Get expert advice on how to fix violated assumptions in your dataset.

Violating assumptions can lead to biased estimates and incorrect scientific conclusions.

회귀 가정을 확인하는 이유는 무엇입니까?

📐 선형 회귀는 데이터에 대해 가우스-마르코프 조건으로 통칭되는 네 가지 주요 가정을 만듭니다. 네 가지가 모두 충족되면 일반 최소 제곱(OLS) 추정기가 최고의 선형 불편 추정기(BLUE)가 됩니다. 즉, 모든 불편 선형 추정기 중에서 분산이 가장 작습니다. 가정을 위반하면 이 보장이 손상되어 잠재적으로 편향된 계수, 신뢰할 수 없는 표준 오류, 유효하지 않은 p-값 및 부정확한 신뢰 구간이 생성됩니다. 네 가지 OLS 가정은 다음과 같습니다. (1) 선형성 — 독립 변수 X와 종속 변수 Y 간의 관계는 실제로 선형입니다. 실제 관계가 곡선이면 적합선이 체계적으로 데이터를 잘못 나타내게 되며 기울기와 절편 추정치가 모두 편향됩니다. 산점도 또는 잔차 대 적합도를 사용하여 이를 시각적으로 확인할 수 있으며 공식적으로 RESET 테스트를 통해 확인할 수 있습니다.

📊 (2) 독립성 — 잔차(오차)는 서로 독립적입니다. 이는 연속 관측값이 상관되는 경향이 있는 시계열 데이터에서 가장 자주 위반됩니다. 이러한 현상을 자기상관이라고 합니다. 자기상관은 명백한 중요성을 부풀려 관계를 실제보다 더 강하게 보이게 만듭니다. Durbin-Watson 테스트는 1차 자기상관을 탐지합니다.

📊 (3) 동분산성 — 잔차의 분산은 예측 값의 모든 수준에서 일정합니다. 분산이 변경되면(이분산성) 표준 오류를 신뢰할 수 없게 되어 신뢰 구간과 가설 검정이 무효화됩니다. 잔차 그림의 깔때기 모양은 전형적인 시각적 표시입니다. Breusch-Pagan 테스트는 이 위반 여부를 공식적으로 확인합니다.

(4) 정규성 — 잔차는 대략 정규 분포를 따릅니다. 이 가정은 작은 표본의 t-검정, F-검정 및 신뢰 구간의 유효성에 매우 중요합니다. 큰 표본(n> 30)의 경우 중심 극한 정리가 어느 정도 보호 기능을 제공하지만 작은 데이터 세트에서는 비정규성이 극적으로 잘못된 p-값으로 이어질 수 있습니다. Shapiro-Wilk 테스트와 Q-Q 플롯은 표준 진단 도구입니다. 모델을 신뢰하기 전에 가정을 확인하는 것은 많은 분석가가 건너뛰는 중요한 단계로, 잘못된 결론, 복제 실패, 잘못된 결정으로 이어집니다.

Why Check Regression Assumptions?