曲线拟合思想

由实验或观测提供的数据往往很多,我们希望由给定的数据 (xi,yi) (i=1,2,,n)(x_i,y_i)\ (i=1,2,\cdots,n),构造出近似函数 φ(x)\varphi(x),不要求 φ(x)\varphi(x) 完全通过所有的数据点,只要求所得的近似曲线能反映出数据的基本趋势

定义拟合函数在 (xi,yi)(x_i,y_i) 处的残差 εi=φ(xi)f(xi)\varepsilon_i=\varphi(x_i)-f(x_i),最小二乘法拟合曲线的要求便是 i=1nεi2\sum\limits_{i=1}^{n}\varepsilon_i^2 最小。

直线拟合

对于给定的数据点 (xi,yi) (i=1,2,,m)(x_i,y_i)\ (i=1,2,\cdots,m),求拟合直线 y(x)=a0+a1xy(x)=a_0+a_1x,使总误差最小。记 F(a0,a1)=i=1m(a0+a1xiyi)2F(a_0,a_1)=\sum\limits_{i=1}^m(a_0+a_1x_i-y_i)^2,令 $\left\{\begin{matrix}\frac{\partial F}{\partial a_0}=2\sum\limits_{i=1}^m(a_0+a_1x_i-y_i)=0\\\frac{\partial F}{\partial a_1}=2\sum\limits_{i=1}^m(a_0+a_1x_i-y_i)x_i=0\end{matrix}\right.$,得到方程 $\left\{\begin{matrix}a_0m+a_1\sum\limits_{i=1}^mx_i=\sum\limits_{i=1}^m y_i\\a_0\sum\limits_{i=1}^m x_i+a_1\sum\limits_{i=1}^mx_i^2=\sum\limits_{i=1}^m x_iy_i\end{matrix}\right.$,求解此方程即可求出拟合直线。

多项式拟合

有事所给数据点的分布并不一定近似地呈一条直线,这时可用多项式拟合。对于给定的数据 (xi,yi) (i=1,2,,n)(x_i,y_i)\ (i=1,2,\cdots,n),寻求次数不超过 m (m<<n)m\ (m<<n) 的多项式 y(x)=j=0majxjy(x)=\sum\limits_{j=0}^m a_jx^j,来拟合给定的数据,要求 Q=i=1n(yij=0majxij)2Q=\sum\limits_{i=1}^{n}(y_i-\sum\limits_{j=0}^ma_jx_i^j)^2 最小。