线性回归计算器

线性回归计算器

欢迎来到线性回归计算器,这是一个综合统计工具,可计算最小二乘回归线、相关系数、R平方值,并提供带有分步公式分解的交互式散点图可视化。无论您是为研究、业务预测还是学术研究进行数据分析,此计算器都能提供专业级的统计分析。

什么是线性回归?

线性回归是一种基本的统计方法,用于通过拟合线性方程到观察数据来模型化因变量(Y)和一个自变量(X)之间的关系。该方法通过最小化残差平方和(观察值和预测值之间的差异)来找到通过数据点的最佳拟合直线。

回归方程

简单线性回归模型

$$\hat{Y} = b_0 + b_1 X$$

其中:

Y(或Y-hat) = 因变量的预测值

X = 自变量(预测器)

b₀ = Y截距(当X = 0时Y的值)

b₁ = 斜率(X每个单位变化时Y的变化)

如何计算线性回归

计算斜率(b₁)

斜率公式

$$b_1 = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}$$

计算Y截距(b₀)

截距公式

$$b_0 = \bar{y} - b_1 \bar{x}$$

其中x-bar和y-bar分别是X和Y的均值。

理解相关性和R平方

相关系数(r)

相关系数衡量X和Y之间线性关系的强度和方向。其范围从-1到+1:

r值解释

0.9到1.0非常强的正相关

0.7到0.9强正相关

0.5到0.7中等正相关

0.3到0.5弱正相关

-0.3到0.3几乎无相关

-0.5到-0.3弱负相关

-0.7到-0.5中等负相关

-0.9到-0.7强负相关

-1.0到-0.9非常强的负相关

R平方(确定系数)

R平方(R²)表示Y中由X解释的方差比例。例如,R² = 0.85表示Y中85%的方差可以由X与之间的线性关系解释。

R平方公式

$$R^2 = r^2 = 1 - \frac{SS_{residual}}{SS_{total}}$$

如何使用此计算器

输入X值: 在第一个文本区中输入您的自变量数据,用逗号、空格或换行符分隔。

输入Y值: 在第二个文本区中输入您的因变量数据。Y值的数量必须与X值匹配。

预测(可选): 输入X值以使用回归方程预测相应的Y值。

设置精度: 为结果选择小数位数。

计算: 点击计算按钮以查看回归方程、散点图、相关统计和分步计算。

理解您的结果

主要结果

回归方程: 最佳拟合线方程(Y = b₀ + b₁X)

斜率(b₁): X每个单位变化时Y的变化率

截距(b₀): 当X等于零时的预测Y值

相关系数(r): 线性关系的强度和方向

R平方(R²): 模型解释的方差比例

附加统计

估计的标准误: 数据点距离回归线的平均距离

斜率的标准误: 斜率估计中的不确定性

平方和: 总的、回归的和残差平方和

残差: 观察的Y值和预测的Y值之间的差异

线性回归的应用

商业和金融

根据广告支出预测销售

从市场指标预测股票价格

根据生产量估计成本

科学和研究

分析实验中变量之间的关系

校准测量仪器

研究药理学中的剂量-反应关系

经济学

建模供给和需求关系

分析利率对投资的影响

研究收入与消费模式

社会科学

教育研究(学习时数vs测试成绩)

心理学研究(年龄vs反应时间)

人口统计学(人口vs资源消耗)

线性回归的假设

为了获得可靠的结果,线性回归假设:

线性性: X和Y之间的关系是线性的

独立性: 观察相互独立

同方差性: 残差在所有X值中有恒定的方差

正态性: 残差近似正态分布

无多重共线性:(对于多元回归)自变量之间不高度相关

常见问题

什么是线性回归?

线性回归是一种统计方法,用于通过拟合线性方程到观察数据来模型化因变量(Y)和一个自变量(X)之间的关系。方程的形式为Y = b₀ + b₁X,其中b₀是Y截距,b₁是斜率。它找到最佳拟合线,最小化观察值和预测值之间的平方差之和。

我如何解释线性回归中的斜率?

斜率(b₁)表示对于自变量X每增加一个单位,因变量Y的变化。正斜率表示当X增加时Y增加,负斜率表示当X增加时Y减少。

什么是R平方,它意味着什么?

R平方(R²)也称为确定系数,衡量回归线对数据的拟合程度。其范围从0到1,其中0表示模型不能解释任何变异性,1表示解释所有变异性。通常,R²大于0.7表示良好拟合。

相关系数(r)和R平方之间有什么区别?

相关系数(r)衡量X和Y之间线性关系的强度和方向,范围从-1到+1。R平方(R²)是r²,代表解释的方差比例。当r告诉您方向(正或负关系)时,R²只告诉您解释了多少方差。

我需要多少个数据点进行线性回归?

从技术上讲,您需要至少2个数据点来计算回归线,但这不提供任何自由度用于错误估计。为了进行有意义的统计分析,您应该至少有10-20个数据点。更多数据点通常会导致更可靠的估计。

线性回归中的残差是什么?

残差是观察的Y值和回归线预测的Y值之间的差异(残差=观察Y-预测Y)。分析残差有助于评估模型对数据的拟合程度。理想情况下,残差应该随机分散在零周围,没有明显的模式。

其他资源

线性回归 - 维基百科

确定系数 - 维基百科

皮尔逊相关系数 - 维基百科

引用此内容、页面或工具为:

"线性回归计算器" 于 https://MiniWebtool.com/zh-cn/线性回归计算器/,来自 MiniWebtool,https://MiniWebtool.com/

由 miniwebtool 团队提供。更新时间:2026年1月17日