Проверка предположений регрессии

Проверьте все четыре предположения линейной регрессии для ваших данных. Тест на линейность, независимость, гомоскедастичность и нормальность с подробной...

Regression Assumptions Diagnostics Visualization

Проверка предположений регрессии

Проверьте все четыре предположения линейной регрессии для ваших данных. Тест на линейность, независимость, гомоскедастичность и нормальность с подробной...

Введите свои данные

# X-значения Значения Y

Как использовать Проверка предположений регрессии

Model Validity

Ensure your regression results are reliable and your p-values are accurate.

Automated Tests

Runs statistical tests for linearity, normality, and homoscedasticity.

Remediation

Get expert advice on how to fix violated assumptions in your dataset.

Violating assumptions can lead to biased estimates and incorrect scientific conclusions.

Зачем проверять предположения регрессии?

📐 Линейная регрессия делает четыре ключевых предположения о ваших данных, которые вместе называются условиями Гаусса-Маркова. Когда все четыре условия удовлетворены, обычный метод наименьших квадратов (OLS) является лучшим линейным несмещенным оценщиком (СИНИЙ) – это означает, что он имеет наименьшую дисперсию среди всех несмещенных линейных оценщиков. Нарушение любого предположения ставит под угрозу эту гарантию, потенциально создавая смещенные коэффициенты, ненадежные стандартные ошибки, неверные значения p и неточные доверительные интервалы. Четыре предположения МНК: (1) Линейность — связь между независимой переменной X и зависимой переменной Y действительно линейна. Если фактическая зависимость искривлена, подобранная линия будет систематически искажать данные, а оценки наклона и точки пересечения будут смещены. Вы можете проверить это визуально с помощью диаграммы рассеяния или графика зависимости остатков от подгонки, а также формально с помощью теста RESET.

📊 (2) Независимость — остатки (ошибки) независимы друг от друга. Чаще всего это нарушается в данных временных рядов, где последовательные наблюдения имеют тенденцию коррелировать — явление, называемое автокорреляцией. Автокорреляция преувеличивает кажущуюся значимость, делая отношения более сильными, чем они есть на самом деле. Тест Дурбина-Ватсона обнаруживает автокорреляцию первого порядка.

📊 (3) Гомоскедастичность — дисперсия остатков постоянна на всех уровнях прогнозируемых значений. Когда дисперсия изменяется (гетероскедастичность), стандартные ошибки становятся ненадежными, что делает недействительными доверительные интервалы и проверки гипотез. Воронкообразная форма на остаточном графике является классическим визуальным индикатором. Тест Бреуша-Пэгана формально проверяет это нарушение.

(4) Нормальность — остатки примерно нормально распределены. Это предположение имеет решающее значение для достоверности t-тестов, F-тестов и доверительных интервалов в небольших выборках. При больших выборках (n> 30) центральная предельная теорема обеспечивает некоторую защиту, но в небольших наборах данных ненормальность может привести к совершенно неправильным значениям p. Тест Шапиро-Уилка и графики QQ являются стандартными диагностическими инструментами. Проверка предположений прежде чем доверять модели – это важный шаг, который многие аналитики пропускают. Это приводит к ошибочным выводам, неудачному повторению и принятию неверных решений.

Why Check Regression Assumptions?