다중 회귀 계산기

두 개 이상의 예측 변수를 사용하여 다중 회귀 방정식을 계산합니다. 무료 온라인 통계 분석 도구를 사용하여 데이터에 가장 적합한 모델을 찾으세요.

다중 회귀 계산기

두 개 이상의 예측 변수를 사용하여 다중 회귀 방정식을 계산합니다. 무료 온라인 통계 분석 도구를 사용하여 데이터에 가장 적합한 모델을 찾으세요.

Number of Predictors

데이터 포인트를 입력하세요

사용 방법 다중 회귀 계산기

Complex Modeling

Analyze how multiple factors simultaneously influence your dependent variable.

통계 출력

Calculate partial coefficients, standard errors, and adjusted R-squared values.

Diagnostics

Built-in checks for multicollinearity and model significance.

Multiple regression helps isolate the effect of one variable while controlling for others.

다중 회귀를 계산하는 방법

📐 다중 회귀는 단순 선형 회귀를 2개 이상의 예측 변수로 확장하여 y = b₀ + b₁x₁ + b2x2 + … + bₚxₚ 등식을 생성합니다. 여기서 각 계수 bᵢ는 다른 모든 예측 변수를 일정하게 유지하면서 y에 대한 예측 변수 xᵢ의 효과를 나타냅니다.

❌ "상수 유지" 속성은 다중 회귀를 매우 강력하게 만드는 요소입니다. 이를 통해 각 예측 변수의 고유한 기여를 분리하고 결과를 왜곡할 수 있는 혼란 요인을 제어할 수 있습니다. 예를 들어, 교육이 소득에 미치는 영향을 연구하려는 경우 단순히 교육에 대한 소득 회귀를 통해 교육 효과와 경험 효과를 통합하게 됩니다. 왜냐하면 교육 수준이 높은 사람일수록 더 많은 경험을 갖는 경향이 있기 때문입니다.

📐 다중 회귀는 교육과 경험을 모두 예측 변수로 포함하여 이 문제를 해결하므로 각 계수는 해당 변수만의 실제 효과를 반영합니다. 다중 회귀는 실제 결과가 거의 항상 여러 요인에 동시에 영향을 받기 때문에 연구, 비즈니스 분석, 사회 과학, 의학 및 기계 학습에서 가장 널리 사용되는 회귀 기술입니다.

📊 단일 예측 모델은 유용할 만큼 충분한 변동을 포착하는 경우가 거의 없습니다. 관련 예측 변수를 추가하면 거의 항상 설명력이 증가하고 예측 정확도가 향상됩니다. 보고되는 주요 통계에는 R²(모든 예측 변수가 함께 설명하는 분산의 비율), 조정된 R²(모델을 실제로 개선하지 않는 예측 변수를 추가하는 경우 처벌), F-통계(전체 모델이 통계적으로 유의한지 테스트), 추정의 표준 오류(회귀 초평면에서 데이터 포인트의 평균 거리를 측정)가 포함됩니다.

📊 이러한 측정 항목을 이해하는 것은 필수적입니다. 신뢰할 수 있는 모델을 구축하고 표본 크기에 비해 너무 많은 예측 변수가 포함될 때 발생하는 과적합을 방지하기 위한 것입니다.

How Multiple Regression Works

다중 회귀의 가정

1. 선형성: 다른 예측 변수가 일정하게 유지될 때 각 예측 변수는 Y와 선형 관계를 가져야 합니다. 부분 회귀 도표(추가 변수 도표라고도 함) 및 잔차 도표로 확인하십시오. 곡선 패턴은 다항식 항 또는 변수 변환이 필요함을 나타냅니다.

2. 독립성: 잔차는 독립적이어야 하며 자기상관이 없어야 합니다. Durbin-Watson 테스트를 통해 확인하십시오(d ≒ 2는 자기상관이 없음을 의미함). 시계열 데이터는 종종 이 가정을 위반합니다. 자기 상관이 감지되면 시차 항을 추가하거나 ARIMA 모델을 사용하는 것이 좋습니다.

3. 균등성: 잔차 분산은 모든 예측 값에서 일정해야 합니다. 잔차 도표(확산은 대략 동일해야 함) 또는 Breusch-Pagan 검정으로 확인하십시오. 깔때기 모양은 이분산성을 나타내며, 이는 가중 최소 제곱 또는 로버스트 표준 오류로 해결할 수 있습니다.

4. 정규성: 잔차는 대략 정규 분포를 따라야 합니다. 히스토그램, Q-Q 플롯 또는 Jarque-Bera 테스트를 통해 확인하십시오. 큰 표본(n> 30)은 중심 극한 정리로 인해 위반에 더 강력합니다.

5. 다중 공선성 없음: 예측 변수는 서로 너무 높은 상관관계를 나타내서는 안 됩니다. 분산 팽창 요인(VIF> 5는 문제를 나타냄) 또는 예측 변수 간의 상관 행렬을 확인하십시오. 해결 방법에는 하나의 상관 예측 변수 삭제, PCA를 통한 예측 변수 결합 또는 능선 회귀 사용이 포함됩니다.

6. 대표 표본 추출: 데이터는 관심 집단의 대표 표본이어야 합니다. 편의 표본, 잘린 범위 또는 생략된 변수는 일반화되지 않는 잘못된 회귀 결과를 생성할 수 있습니다.