回归分析与约束理论:原理、应用与实践
1. 数据区分与标准差比较
在数据分析中,我们常常需要区分不同区域的数据。例如,要区分从单元格 A12:B12 中获取的数据和从单元格 G7:H7 中获取的数据。同时,我们注意到在图 5.3 的单元格 E5 中计算得到的 Y 的标准差大于回归的标准误差(在单元格 B8 中给出,10 > 8)。回归的标准误差是给定 X 时 Y 的条件标准差。通常情况下,这种条件标准差会小于无条件标准差,因为标准差衡量的是不确定性,而了解 X 往往能减少我们对因变量 Y 的不确定性。
2. 回归分析与最小二乘法
回归分析是一种强大的统计方法,能帮助工程师理解工程变量之间的关系。下面我们以图 5.4 中单元格 B2:C11 所示的过程 1 和过程 2 的质量指数数据为例,尝试估计一个回归模型,其中过程 2 的质量指数取决于每年过程 1 的质量指数。
寻找线性函数:我们首先寻找一个线性函数来预测过程 2 的质量指数,将其作为过程 1 质量指数的函数。在图 5.4 中,单元格 A14 和 B14 的值将被解释为该线性函数的截距和系数。基于单元格 B2 中 1990 年过程 1 的质量指数,我们可以使用公式
=$A$14+$B$14*B2计算 1990 年过程 2 质量的线性估计值,并将其输入到单元格 D2 中。然后将单元格 D2 复制到 D2:D11,就得到了仅基于同一年过程 1 质量指数的过程 2 质量指数的线性估计列。误差衡量与最小化:无论我们尝试什么截距和系