线性代数及其应用(六)-正交性和最小二乘法

1. 內积、长度和正交性

  • 如果uvRn空间中的向量,可以将uv作为n×1矩阵。向量矩阵uT是1xn矩阵且矩阵成绩uTv是一个1x1矩阵,我们将其记为一个不加括号的实数。如uTv称为uv的內积,并记做uv
  • 如果$\vec{u} = \left[
    \begin{matrix}
     u_0 \\
     u_1 \\
    \cdots \\ u_n \end{matrix}
    \right]$和$\vec{v} = \left[
    
    \begin{matrix}
     v_0 \\
     v_1 \\
    \cdots \\ v_n \end{matrix}
    \right]$,那么$\vec{u}$和$\vec{v}$的內积定义为$\left[
    
    \begin{matrix}
     u_0 & u_1 & \cdots & u_n \end{matrix}
    \right]\left[
    
    \begin{matrix}
     v_0 \\
     v_1 \\
    \cdots \\ v_n \end{matrix}
    \right] = u_0v_0 + u_1v_1 + \cdots + u_nv_n$
    
  • 向量v的长度(范数)是非负数||v||定义为||v||=vv=v21++v2n||v||2=vv
  • Rn中向量uv的距离,记作dist(u,v),表示向量uv的长度,即dist(u,v)=||uv||
  • 如果uv=0,则两个向量uv称为(相互)正交的
  • 毕达哥拉斯(勾股)定理
    • 两个向量uv正交的充分必要条件是||u+v||2=||u||2+||v||2
  • 如果向量zRn的子空间W中的任意向量都正交,则称z正交于W,与子空间W正交的向量z的全体组成的集合称为W的正交补,并记作W(读作W正交补)

2. 正交集

  • Rn中的向量集合{u1,,up}称为正交向量集,如果集合中的任意两个不同向量都正交,即当ij时,uiuj=0

  • 如果S={u1,,up}是由Rn空间中非零向量构成的正交集,那么S是线性无关集,因此构成所生成的子空间S的一组基

  • 假设{u1,,up}Rn中子空间W的正交基,对W中的每个向量y,线性组合y=c1u1++cpup中的权值可以由cj=yujujuj(j=1,,p)计算

  • 正交分解定理

    • 若W是Rn的一个子空间,那么Rn中每一个向量y可以惟一表示,y=ˆy+z,此处ˆy属于W且z属于W,实际上,如果{u1,,up}是W的任意正交基,那么ˆy=yu1u1u1u1++yupupupupz=yˆy,其中ˆy称为y在W上的正交投影,常记作projWy
  • 最佳逼近定理

    • 假设W是Rn空间中的一个子空间,yRn中的任意向量,ˆyy在W上的正交投影,那么ˆy是W中最接近y的点,也就是指||yˆy||<||yv||,对所有属于W又异于ˆyv成立
  • 格拉姆-施密特方法

    • Rn中子空间的一个基{x1,,xp},定义

      v1=x1,

      x2=x2x2v1v1v1v1,

      ,

      vp=xpxpv1v1v1v1xpv2v2v2v2xpvp1vp1vp1vp1.

      那么{v1,,vp}是W的一个正交基,此外,

      Span{v1,,vp}=Span{x1,,xk},其中1kp.

3. 最小二乘问题

  • 问题背景
    • 巨型方程组Ax=b,在实际工作中往往很难直接求解,最好的方法是寻找x,使得Ax尽可能的接近于b
  • 考虑Ax作为b的一个近似,从b到Ax的距离最小,||bAx||近似程度越好。一般的最小二乘问题就是找出使||bAx||尽量小的x
  • 如果mxn矩阵A和向量b属于RnAx=b的最小二乘解是Rn中的ˆx,使得||bAˆx||||bAx||对所有xR成立
  • 方程Ax=b的最小二乘解集和法方程ATAx=ATb的非空解集一致
  • 矩阵ATA是可逆的充分必要条件是:A的列是线性无关的。在这种情形下,方程Ax=b有惟一最小二乘解ˆx且它有下面的表示ˆx=(ATA)1ATb
  • 给定一个mxn矩阵A,且具有线性无关的列,取A = QR是A的QR分解,那么对每一个属于Rmb,矩阵Ax=b有惟一的最小二乘解,其解为ˆx=R1QTb

4. 內积空间

  • 向量空间V上的內积是一个函数,对每一对属于V的向量uv,存在一个实数<u,v>满足下面公理。对任意属于V的uvw和所有数c,

    <u,v>=<v,u>,

    <u+v,w>=<u,w>+<v,w>,

    $ = c<\bf{u}, \bf{v}>$,

    <u,v>0,且<u,v>=0u=0,

    一个赋予上面內积的向量空间称为內积空间

  • 柯西-施瓦茨不等式

    • 对空间V中任意向量uv,有|<u,v>|||u||||v||
  • 三角不等式

    • 对属于V的所有向量uv,有||u+v||||u||+||v||