最小二乘

最小二乘线性和二次模型创建一个多项式,用于计算最适合的全局数据样本近似值。

例如,对于包含两个输入参数 x1 x2 的设计研究,包含常数和线性项的预测值 y^ 的线性多项式定义为:

1. EQUATION_DISPLAY
y^(x)=β0+β1x1+β2x2
(5151 5152 5153)

包含常数、线性项、相互作用和平方项的二次多项式定义为:

2. EQUATION_DISPLAY
y^(x)=β0+β1x1+β2x2+β3x12+β4x1x2+β5x22
(5151 5152 5153)

多项式与数据点的拟合质量通过其残差 εi 测量,该残差如下定义为实际值 yi 和预测值 yi^ 之间的残差:

3. EQUATION_DISPLAY
εi=yiy^i
(5151 5152 5153)

在矩阵表示法中,方程为:

4. EQUATION_DISPLAY
ε=yy^=yXβ
(5154)

此处 X 表示设计矩阵。例如,具有来自 m 模拟的两个输入参数 x1 x2 的二次模型的设计矩阵为:

5. EQUATION_DISPLAY
X=(1x1,1x2,1x1,12x1,1x2,1x2,121x1,2x2,2x1,22x1,2x2,2x2,221x1,mx2,mx1,m2x1,mx2,mx2,m2)
(5155)

未知系数的矢量 β 为:

6. EQUATION_DISPLAY
β=(β0β1βm)
(5156)

最佳可能的拟合意味着样本数据的残余平方和 L 已经最小化:

7. EQUATION_DISPLAY
L=i=1mεi2=(y1y^1)2+(y2y^2)2++(ymy^m)2
(5157)

线性逼近形式:

8. EQUATION_DISPLAY
L=(yXβ)t(yXβ)
(5158)

展开线性逼近后:

9. EQUATION_DISPLAY
L=ytyβtXtyytXβ+βtXtXβ
(5159)

由于矢量 y β 和矩阵 X 的维度, βtXty ytXβ 为两个标量。因此, ytXβ = (βtXty)t=βtXty 。该方程可以重写为:

10. EQUATION_DISPLAY
L=yty2βtXty+βtXtXβ
(5160)

线性逼近梯度为零时,求得平方和的最小值:

11. EQUATION_DISPLAY
Lβ=2Xty+2XtXβLβ=0XtXβ=Xtyβ=(XtX)1Xty
(5161)

最小二乘替代模型通常不会直接通过采样点。它们从设计空间的采样点旁边通过,以获得最佳全局拟合。最小二乘求解可以使用矩阵 X 的奇异值分解计算。此方法对于大量样本数据有效。

计算数量

要确定未知系数的矢量 β ,建议运行两倍于矢量 β 的维度的模拟。

  • 对于线性模型, β 的维度是 n+1n 表示设计研究中输入参数的数量。
    12. EQUATION_DISPLAY
    y^=β0+i=1nβixi
    (5162)
  • 对于二次模型, β 的维度是 1+2n+n(n-1)/2n 表示设计研究中输入参数的数量。
    13. EQUATION_DISPLAY
    y^=β0+i=1nβixi+j=1nβjxj+i=1n1j=i+1nβijxixj
    (5163)