Retta di regressione dei minimi quadrati

Calcola istantaneamente la retta di regressione dei minimi quadrati. Inserisci i tuoi dati per trovare l'equazione della linea OLS più adatta y = mx + b...

Calcola ora

Retta di regressione dei minimi quadrati

Calcola istantaneamente la retta di regressione dei minimi quadrati. Inserisci i tuoi dati per trovare l'equazione della linea OLS più adatta y = mx + b...

Inserisci i tuoi punti dati

#	X	Y

Results

Equazione di regressione

Pendenza (m)

Intercetta Y (b)

R² (coefficiente di determinazione)

Correlation (r)

Previsto Y

For X = —

Intermediate Calculations

Symbol	Calcola istantaneamente la retta di regressione dei minimi quadrati. Inserisci i tuoi dati per trovare l'equazione della linea OLS più adatta y = mx + b...	Value

Statistics

Statistic	Value
Standard Error
Sample Size (n)
Degrees of Freedom

Chart

Soluzione passo dopo passo

Come usare questo Retta di regressione dei minimi quadrati

Best Fit Line

Find the unique line that minimizes the total distance from all data points.

Output statistico

Get the full equation y = a + bx, slope, intercept, and R-squared metrics.

Residual Analysis

Understand the deviation between observed values and model predictions.

The least squares method is the gold standard for linear regression in most scientific fields.

Qual è la retta di regressione dei minimi quadrati?

📊 La linea di regressione dei minimi quadrati (LSRL) è la linea retta che minimizza la somma delle distanze verticali al quadrato tra i punti dati osservati e la linea. Matematicamente, se abbiamo n punti dati (x₁, y₁), (x₂, y₂), …, (xₙ, yₙ), l'LSRL è la linea ŷ = mx + b che minimizza la quantità Σ(yᵢ − ŷᵢ)², dove ŷᵢ = mxᵢ + b sono i valori previsti valori.

🏆 Questo criterio è chiamato criterio dei minimi quadrati e la linea risultante è anche conosciuta come linea dei minimi quadrati ordinari (OLS) o linea di adattamento migliore. Il metodo dei minimi quadrati ha una ricca storia che risale a Adrien-Marie Legendre nel 1805, che lo pubblicò come metodo per determinare le orbite delle comete, e Carl Friedrich Gauss, che affermò di averlo utilizzato dal 1795 e in seguito lo sviluppò ulteriormente nella sua teoria degli errori.

⚠️ Il nome "minimi quadrati" deriva direttamente dall'obiettivo matematico: tra tutte le linee possibili, noi scegli quello che rende la somma dei residui quadrati più piccola possibile: la minima somma dei quadrati. La quadratura dei residui (invece di assumere valori assoluti) garantisce che gli errori positivi e negativi non si annullino a vicenda e dà anche più peso alle deviazioni più grandi, il che è statisticamente desiderabile.

📊 Oggi, la linea di regressione dei minimi quadrati è il metodo più utilizzato per adattare una linea retta attraverso i punti dati in statistica, economia, scienze naturali, scienze sociali e ingegneria. Serve come base per tecniche più avanzate tra cui regressione multipla, modelli lineari generalizzati e algoritmi di apprendimento automatico. Ogni corso introduttivo di statistica insegna l'LSRL come pietra angolare dell'analisi di regressione.

Il metodo dei minimi quadrati

1
Calcola la linea che minimizza la somma dei quadrati dei residui
2
Utilizza le equazioni normali: Σ(y) = nb + mΣ(x) e Σ(xy) = bΣ(x) + mΣ(x²)
3
Risolve la pendenza m = SSxy / SSxx e l'intercetta b = ȳ - m·x̄
4
Fornisce R², errore standard e tutte le somme intermedie

Quando utilizzare la regressione dei minimi quadrati

Analisi dei trend lineari in economia e commercio
Controllo qualità e monitoraggio del processo
Curve di calibrazione in ambienti di laboratorio
Insegnamento didattico della statistica fondamentale
Qualsiasi situazione che richieda la linea retta più adatta

Ipotesi di regressione dei minimi quadrati

1. Linearità: la relazione tra X e Y deve essere lineare. Verificare con un grafico a dispersione di Y rispetto a X e un grafico dei residui di valori residui rispetto a quelli previsti. Un modello curvo in uno dei grafici indica non linearità.
2. Indipendenza: i residui devono essere indipendenti, senza autocorrelazione. Verificare con il test di Durbin-Watson (d ≈ 2 significa assenza di autocorrelazione). I dati delle serie temporali spesso violano questo presupposto.
3. Omoschedasticità: la varianza residua deve essere costante su tutti i valori previsti. Verificare con un diagramma dei residui (lo spread dovrebbe essere più o meno uguale) o con il test di Breusch-Pagan. Una forma ad imbuto indica eteroschedasticità.
4. Normalità: i residui dovrebbero essere distribuiti approssimativamente normalmente. Verificare con un istogramma, un grafico della probabilità normale (grafico Q-Q) o il test Jarque-Bera. Campioni di grandi dimensioni (n> 30) sono più resistenti alle violazioni.
5. Nessun valore anomalo influente: un singolo valore anomalo estremo può spostare drasticamente la linea di regressione. Verificare con la distanza di Cook o i valori di leva. Considerare una regressione robusta se i valori anomali non possono essere rimossi.
6. Campione rappresentativo: i dati dovrebbero essere un campione rappresentativo della popolazione di interesse. Campioni di convenienza o intervalli troncati possono produrre risultati di regressione fuorvianti.