一元线性回归模型

回归

「一元线性回归模型」是只涉及一个自变量的回归分析,因变量与自变量之间的关系可用一条直线来表示。定义为因变量 是自变量 的线性函数加上一个误差项 所构造的方程,如下

其中,线性部分反映了由于 的变化而引起 的变化。误差项 时一个随机变量,反映了 之间除了线性关系之外的其他随机因素对 的影响, 称为模型的参数。

假定误差项 是服从Gaussian 分布的随机变量,即

其中误差项 是期望值为零的随机变量,即 。对于所有的 值, 的方差 都相同,并且不同样本的误差项的协方差为零,即当 时, 相互独立

当给定一组样本数据 ,以及一元线性回归模型

需要解决如下问题:如何估计参数 ?根据样本数据确定的一元线性回归模型是否合理?如何使用该回归模型对未知样本进行预测?

参数估计

参数 必须利用样本数据去估计。将已知样本数据 ,分别代入医院回归模型,可得一系列

采用最小二乘法来估计参数 的值,使得观测值和目标值之间的误差平方和达到最小

误差

根据样本数据 计算每个样本的误差,可得误差平方和

其中

因此 是无偏估计

验证

在实际应用中,出于成本、时间等方面的考虑,通常只能利用总体中的一部分(样本)进行统计分析:回归分析。

例如:如果想了解某种产品的平均使用寿命,不可能对所有产品都进行测量,只能对其中的一部分进行抽样测量。

疑问:根据样本数据进行统计分析得到的计算结果能否反映总体的真实情况?需要通过假设检验的方法加以判断。

根据样本建立的一元线性回归模型,只是完成了统计分析中两个变量(自变量和因变量)之间关系的描述。还必须对得到的一元线性回归方程进行以下两方面的显著性检验: