Linha de regressão de mínimos quadrados
Calcule a linha de regressão de mínimos quadrados instantaneamente. Insira seus dados para encontrar a equação de linha de melhor ajuste do OLS y = mx + b...
Linha de regressão de mínimos quadrados
Calcule a linha de regressão de mínimos quadrados instantaneamente. Insira seus dados para encontrar a equação de linha de melhor ajuste do OLS y = mx + b...
Insira seus pontos de dados
| # | X | S |
|---|
Results
Equação de regressão
Inclinação (m)
Interceptação Y (b)
R² (Coeficiente de Determinação)
Correlation (r)
Y previsto
Intermediate Calculations
| Symbol | Calcule a linha de regressão de mínimos quadrados instantaneamente. Insira seus dados para encontrar a equação de linha de melhor ajuste do OLS y = mx + b... | Value |
|---|
Statistics
| Statistic | Value |
|---|---|
| Standard Error | |
| Sample Size (n) | |
| Degrees of Freedom |
Chart
Solução passo a passo
Como usar isto Linha de regressão de mínimos quadrados
Best Fit Line
Find the unique line that minimizes the total distance from all data points.
Saída estatística
Get the full equation y = a + bx, slope, intercept, and R-squared metrics.
Residual Analysis
Understand the deviation between observed values and model predictions.
The least squares method is the gold standard for linear regression in most scientific fields.
Qual é a linha de regressão dos mínimos quadrados?
📊 A linha de regressão de mínimos quadrados (LSRL) é a linha reta que minimiza a soma das distâncias verticais quadradas entre os pontos de dados observados e a linha. Matematicamente, se tivermos n pontos de dados (x₁, y₁), (x₂, y₂),…, (xₙ, yₙ), o LSRL é a linha ŷ = mx + b que minimiza a quantidade Σ(yᵢ − ŷᵢ)², onde ŷᵢ = mxᵢ + b são os previstos valores.
🏆 Esse critério é chamado de critério de mínimos quadrados, e a linha resultante também é conhecida como linha de mínimos quadrados ordinários (OLS) ou linha de melhor ajuste. O método dos mínimos quadrados tem uma história rica que remonta a Adrien-Marie Legendre em 1805, que o publicou como uma forma de determinar as órbitas dos cometas, e a Carl Friedrich Gauss, que afirmou que o usava desde 1795 e mais tarde o desenvolveu ainda mais em sua teoria dos erros.
⚠️ O nome "mínimos quadrados" vem diretamente do objetivo matemático: entre todas as linhas possíveis, nós escolha aquele que faz com que a soma dos resíduos quadrados seja a menor possível — a menor soma dos quadrados. A quadratura dos resíduos (em vez de tomar valores absolutos) garante que erros positivos e negativos não se cancelem, e também dá mais peso a desvios maiores, o que é estatisticamente desejável.
📊 Hoje, a linha de regressão de mínimos quadrados é o método mais amplamente utilizado para ajustar uma linha reta através de pontos de dados em estatística, economia, ciências naturais, ciências sociais e engenharia. Ele serve como base para técnicas mais avançadas, incluindo regressão múltipla, modelos lineares generalizados e algoritmos de aprendizado de máquina. Cada curso introdutório à estatística ensina o LSRL como a base da análise de regressão.
O Método dos Mínimos Quadrados
- 1 Calcula a linha que minimiza a soma dos resíduos quadrados
- 2 Usa as equações normais: Σ(y) = nb + mΣ(x) e Σ(xy) = bΣ(x) + mΣ(x²)
- 3 Resolve a inclinação m = SSxy / SSxx e interceptação b = ȳ - m·x̄
- 4 Fornece R², erro padrão e todas as somas intermediárias
Quando usar a regressão de mínimos quadrados
- Análise de tendências lineares em negócios e economia
- Controle de qualidade e monitoramento de processos
- Curvas de calibração em ambientes laboratoriais
- Ensino educacional de estatística fundamental
- Qualquer situação que exija a linha reta mais adequada
Suposições de regressão de mínimos quadrados
- 1. Linearidade: A relação entre X e Y deve ser linear. Verifique com um gráfico de dispersão de Y vs. X e um gráfico residual de resíduos vs. valores previstos. Um padrão curvo em qualquer gráfico indica não linearidade.
- 2. Independência: Os resíduos devem ser independentes — sem autocorrelação. Verifique com o teste Durbin-Watson (d ≈ 2 significa sem autocorrelação). Os dados de séries temporais frequentemente violam essa suposição.
- 3. Homocedasticidade: a variância residual deve ser constante em todos os valores previstos. Verifique com um gráfico residual (a dispersão deve ser aproximadamente igual) ou com o teste de Breusch-Pagan. Um formato de funil indica heterocedasticidade.
- 4. Normalidade: Os resíduos devem ter distribuição aproximadamente normal. Verifique com um histograma, gráfico de probabilidade normal (gráfico QQ) ou teste de Jarque-Bera. Amostras grandes (n> 30) são mais robustas a violações.
- 5. Sem valores discrepantes influentes: Um único valor discrepante extremo pode mudar drasticamente a linha de regressão. Verifique com Cook os valores de distância ou alavancagem. Considere a regressão robusta se os valores discrepantes não puderem ser removidos.
- 6. Amostra representativa: Os dados devem ser uma amostra representativa da população de interesse. Amostras de conveniência ou intervalos truncados podem produzir resultados de regressão enganosos.