重回帰計算ツール

2 つ以上の予測子を使用して重回帰式を計算します。無料のオンライン統計分析ツールを使用して、データに最適なモデルを見つけます。

重回帰計算ツール

2 つ以上の予測子を使用して重回帰式を計算します。無料のオンライン統計分析ツールを使用して、データに最適なモデルを見つけます。

Number of Predictors

データポイントを入力してください

使い方重回帰計算ツール

Complex Modeling

Analyze how multiple factors simultaneously influence your dependent variable.

統計出力

Calculate partial coefficients, standard errors, and adjusted R-squared values.

Diagnostics

Built-in checks for multicollinearity and model significance.

Multiple regression helps isolate the effect of one variable while controlling for others.

重回帰の計算方法

📐 重回帰は単純な線形回帰を2 つ以上の予測子変数に拡張し、y = b₀ + b₁x₁ + b₂x₂ + … + bₚxₚ という方程式を生成します。ここで、各係数 bᵢ は、他のすべての予測子を保持しながら、y に対する予測子 xᵢ の効果を表します。定数。

❌ この「定数を保持する」特性により、重回帰が非常に強力になります。これにより、各予測変数の固有の寄与を分離し、結果を歪める可能性がある交絡因子を制御できます。たとえば、収入に対する教育の影響を研究したい場合、単純に教育に対する収入を回帰分析すると、教育の効果と経験の効果が混同されてしまいます。教育を受けた人はより多くの経験をもつ傾向があるためです。

📐 重回帰では、教育と経験の両方を予測変数として含めることでこれを解決するため、各係数はその変数のみの真の効果を反映します。重回帰は、研究、ビジネス分析、社会科学、医学、機械学習で最も広く使用されている回帰手法です。なぜなら、現実世界の結果は、ほとんどの場合、複数の要因に同時に依存するからです。

📊 単一の予測子モデルでは、有用な変動を十分に捉えることはほとんどありません。関連する予測子を追加すると、ほぼ常に説明力が向上し、予測精度が向上します。報告される主な統計には、R² (すべての予測変数を合わせて説明する分散の割合)、調整済み R² (モデルを真に改善しない予測変数の追加にペナルティを与える)、F 統計量 (モデル全体が統計的に有意であるかどうかをテストする)、推定値の標準誤差 (回帰超平面からのデータポイントの平均距離を測定する) が含まれます。

📊 これらを理解する指標は、信頼性の高いモデルを構築し、サンプルサイズに対して含まれる予測変数が多すぎる場合に発生する過剰適合を回避するために不可欠です。

How Multiple Regression Works

重回帰の仮定

1. 線形性: 他の予測子が一定に保たれる場合、各予測子は Y と線形関係を持たなければなりません。偏回帰プロット (追加変数プロットとも呼ばれます) および残差プロットで確認します。曲線パターンは、多項式項または変数変換の必要性を示します。

2. 独立性: 残差は独立している必要があります。自己相関はありません。ダービン-ワトソン検定で確認してください (d ≈ 2 は自己相関がないことを意味します)。時系列データは多くの場合、この前提に違反します。自己相関が検出された場合は、ラグ項を追加するか、ARIMA モデルを使用することを検討してください。

3. 等分散性: 残差分散はすべての予測値にわたって一定である必要があります。残差プロット (広がりはほぼ等しいはずです) または Breusch-Pagan 検定で確認してください。漏斗状は不均一分散性を示しており、重み付き最小二乗またはロバストな標準誤差で対処できます。

4. 正規性: 残差はほぼ正規分布する必要があります。ヒストグラム、Q-Q プロット、またはハルケベラテストで確認します。サンプルが大きい (n> 30) と、中心極限定理により違反に対してより堅牢になります。

5.多重共線性がない予測子間の相関が高すぎてはいけません。分散膨張係数 (VIF> 5 は問題があることを示します) または予測変数間の相関行列を使用して確認します。解決策には、相関関係のある 1 つの予測子の削除、PCA による予測子の結合、またはリッジ回帰の使用が含まれます。

6. 代表的なサンプリング: データは対象母集団の代表的なサンプルである必要があります。便宜的なサンプル、切り捨てられた範囲、または省略された変数により、一般化されない誤解を招く回帰結果が生成される可能性があります。

重回帰計算ツール