1. 內积、长度和正交性
- 如果$\vec{u}$和$\vec{v}$是$R^n$空间中的向量,可以将$\vec{u}$和$\vec{v}$作为$n\times 1$矩阵。向量矩阵$\vec{u}^T$是1xn矩阵且矩阵成绩$\vec{u}^T\vec{v}$是一个1x1矩阵,我们将其记为一个不加括号的实数。如$\vec{u}^T\vec{v}$称为$\vec{u}$和$\vec{v}$的內积,并记做$\vec{u}\cdot\vec{v}$。
- 如果$\vec{u} = \left[
\begin{matrix}
\begin{matrix}u_0 \\ u_1 \\ \cdots \\ u_n \end{matrix} \right]$和$\vec{v} = \left[
\begin{matrix}v_0 \\ v_1 \\ \cdots \\ v_n \end{matrix} \right]$,那么$\vec{u}$和$\vec{v}$的內积定义为$\left[
\begin{matrix}u_0 & u_1 & \cdots & u_n \end{matrix} \right]\left[
v_0 \\ v_1 \\ \cdots \\ v_n \end{matrix} \right] = u_0v_0 + u_1v_1 + \cdots + u_nv_n$
- 向量$\vec{v}$的长度(范数)是非负数$||\vec{v}||$定义为$||\vec{v}|| = \sqrt{\vec{v}\cdot \vec{v}} = \sqrt{v_1^2 + \cdots + v_n^2}$且$||\vec{v}||^2 = \vec{v}\cdot \vec{v}$
- $R^n$中向量$\vec{u}$和$\vec{v}$的距离,记作$dist(\vec{u}, \vec{v})$,表示向量$\vec{u} - \vec{v}$的长度,即$dist(\vec{u}, \vec{v}) = ||\vec{u} - \vec{v}||$
- 如果$\vec{u}\cdot\vec{v} = 0$,则两个向量$\vec{u}$和$\vec{v}$称为(相互)正交的
- 毕达哥拉斯(勾股)定理
- 两个向量$\vec{u}$和$\vec{v}$正交的充分必要条件是$||\vec{u} + \vec{v}||^2 = ||\vec{u}||^2 + ||\vec{v}||^2$
- 如果向量$\vec{z}$与$R^n$的子空间W中的任意向量都正交,则称$\vec{z}$正交于W,与子空间W正交的向量$\vec{z}$的全体组成的集合称为W的正交补,并记作$W^\perp$(读作W正交补)
2. 正交集
$R^n$中的向量集合$\{\bf{u}_1, \cdots, \bf{u}_p\}$称为正交向量集,如果集合中的任意两个不同向量都正交,即当$i\neq j$时,$\bf{u}_i\cdot \bf{u}_j = 0$
如果$S = \{\bf{u}_1, \cdots, \bf{u}_p\}$是由$R^n$空间中非零向量构成的正交集,那么S是线性无关集,因此构成所生成的子空间S的一组基
假设$\{\bf{u}_1, \cdots, \bf{u}_p\}$是$R^n$中子空间W的正交基,对W中的每个向量$\bf{y}$,线性组合$\bf{y} = c_1\bf{u}_1 +\cdots + c_p\bf{u}_p$中的权值可以由$c_j = \frac{\bf{y}\cdot \bf{u}_j}{\bf{u}_j\cdot\bf{u}_j} (j = 1, \dots, p)$计算
正交分解定理
- 若W是$R^n$的一个子空间,那么$R^n$中每一个向量$\bf{y}$可以惟一表示,$\bf{y} = \hat{\bf{y}} + \bf{z}$,此处$\hat{\bf{y}}$属于W且$\bf{z}$属于$W^{\perp}$,实际上,如果$\{\bf{u}_1, \cdots, \bf{u}_p\}$是W的任意正交基,那么$\hat{\bf{y}} = \frac{\bf{y}\cdot\bf{u}_1}{\bf{u}_1\cdot\bf{u}_1}\bf{u}_1 + \cdots + \frac{\bf{y}\cdot\bf{u}_p}{\bf{u}_p\cdot\bf{u}_p}\bf{u}_p$且$\bf{z} = \bf{y} - \hat{\bf{y}}$,其中$\hat{\bf{y}}$称为$\bf{y}$在W上的正交投影,常记作$proj_W\bf{y}$
最佳逼近定理
- 假设W是$R^n$空间中的一个子空间,$\bf{y}$是$R^n$中的任意向量,$\hat{\bf{y}}$是$\bf{y}$在W上的正交投影,那么$\hat{\bf{y}}$是W中最接近$\bf{y}$的点,也就是指$||\bf{y} - \hat{\bf{y}}|| < ||\bf{y} - \bf{v}||$,对所有属于W又异于$\hat{\bf{y}}$的$\bf{v}$成立
格拉姆-施密特方法
对$R^n$中子空间的一个基$\{\bf{x}_1, \dots, \bf{x}_p\}$,定义
$\bf{v}_1 = \bf{x}_1$,
$\bf{x}_2 = \bf{x}_2 - \frac{\bf{x}_2\cdot\bf{v}_1}{\bf{v}_1\cdot\bf{v}_1}\bf{v}_1$,
$\cdots$,
$\bf{v}_p = \bf{x}_p - \frac{\bf{x}_p\cdot\bf{v}_1}{\bf{v}_1\cdot\bf{v}_1}\bf{v}_1 - \frac{\bf{x}_p\cdot\bf{v}_2}{\bf{v}_2\cdot\bf{v}_2}\bf{v}_2 - \cdots - \frac{\bf{x}_p\cdot\bf{v}_{p-1}}{\bf{v}_{p-1}\cdot\bf{v}_{p-1}}\bf{v}_{p-1}$.
那么$\{\bf{v}_1, \dots, \bf{v}_p\}$是W的一个正交基,此外,
$Span\{\bf{v}_1, \dots, \bf{v}_p\} = Span\{\bf{x}_1, \dots, \bf{x}_k\}$,其中$1 \leq k \leq p$.
3. 最小二乘问题
- 问题背景
- 巨型方程组$Ax = b$,在实际工作中往往很难直接求解,最好的方法是寻找x,使得Ax尽可能的接近于b
- 考虑Ax作为b的一个近似,从b到Ax的距离最小,$||\bf{b} - A\bf{x}||$近似程度越好。一般的最小二乘问题就是找出使$||\bf{b} - A\bf{x}||$尽量小的$\bf{x}$
- 如果mxn矩阵A和向量$\bf{b}$属于$R^n$,$A\bf{x} = \bf{b}$的最小二乘解是$R^n$中的$\hat{\bf{x}}$,使得$||\bf{b} - A\hat{\bf{x}}|| \leq ||\bf{b} - A\bf{x}||$对所有$\bf{x} \in R$成立
- 方程$A\bf{x} = \bf{b}$的最小二乘解集和法方程$A^TA\bf{x} = A^T\bf{b}$的非空解集一致
- 矩阵$A^TA$是可逆的充分必要条件是:A的列是线性无关的。在这种情形下,方程$A\bf{x} = \bf{b}$有惟一最小二乘解$\hat{\bf{x}}$且它有下面的表示$\hat{\bf{x}} = (A^TA)^{-1}A^T\bf{b}$
- 给定一个mxn矩阵A,且具有线性无关的列,取A = QR是A的QR分解,那么对每一个属于$R^m$的$\bf{b}$,矩阵$A\bf{x} = \bf{b}$有惟一的最小二乘解,其解为$\hat{\bf{x}} = R^{-1}Q^T\bf{b}$
4. 內积空间
向量空间V上的內积是一个函数,对每一对属于V的向量$\bf{u}$和$\bf{v}$,存在一个实数$<\bf{u}, \bf{v}>$满足下面公理。对任意属于V的$\bf{u}$,$\bf{v}$,$\bf{w}$和所有数c,
$<\bf{u}, \bf{v}> = <\bf{v}, \bf{u}>$,
$<\bf{u} + \bf{v}, \bf{w}> = <\bf{u}, \bf{w}> + <\bf{v}, \bf{w}>$,
$
= c<\bf{u}, \bf{v}>$, $<\bf{u}, \bf{v}> \geq 0$,且$<\bf{u}, \bf{v}> = 0的充分必要条件是$$\bf{u} = 0$,
一个赋予上面內积的向量空间称为內积空间
柯西-施瓦茨不等式
- 对空间V中任意向量$\bf{u}$和$\bf{v}$,有$|<\bf{u}, \bf{v}>| \leq ||\bf{u}||||\bf{v}||$
三角不等式
- 对属于V的所有向量$\bf{u}$,$\bf{v}$,有$||\bf{u} + \bf{v}|| \leq ||\bf{u}|| + ||\bf{v}||$