奇异值分解

Created: Decemenber, 1, 2020

所有矩阵都可以分解成:正交矩阵 * 对角矩阵 * 正交矩阵,这个分解叫奇异值分解

$$ A = U\Sigma V^T $$

其中A是一个m*n的矩阵,V是一个n*n的矩阵,U是一个m*m的矩阵,$\Sigma$是一个m*n的矩阵。

在一些特殊情况下,如A是对称矩阵,它的特征向量是正交的,奇异值分解退化为矩阵对角化,设Q是是A的特征向量(列向量)构成的矩阵。则有

$$ A = U\Sigma V^T = Q \Lambda Q^T $$

Intuition - 几何含义 #


当我们在做奇异值分解的时候,我们实际上是在做什么?

  • 在MIT Linear Algebra 第29讲,Strang教授给了我们一个很生动的解释。
详细解释

Revision needed

考虑两个线性空间$R^n$和$R^m$, 其中$V=[v_1,v_2,…,v_n]$是$R^n$的一组标准正交基,我们希望对这个基底做一个线性变换得到$R^m$空间的一组基底,这个基底也是正交的。

这个新基底是$R^m$空间下某个标准正交基乘上某个系数矩阵,用矩阵的语言来说,我们实际有这个等式:

$$ AV = U\Sigma $$

其中A表示线性变换,V是$R^n$的一组标准正交基,U是$R^m$的一组标准正交基,$\Sigma$是系数对角阵。

换句话说,对每一个m*n的矩阵,它其实都是其行空间$R^n$和列空间$R^m$某两个正交基底的变换矩阵,奇异值分解其实就要找到这两个基底。

求解 #


简单来说:

  • V是$A^TA$的特征向量构成的矩阵。
  • U是$AA^T$的特征向量构成的矩阵。
  • $\Sigma$是$A^TA$和$AA^T$的特征值(二者特征值一致)。
详细推导

直接求解下式,并不好求,因为它同时包含很多个未知量。

$$ A = U\Sigma V^T $$

我们知道$A^TA$具有很好的性质,考虑

$$ A^TA = V\Sigma^T U^TU\Sigma V^T = V\Sigma^T\Sigma V^T $$

我们知道$A^TA$是对称矩阵,而对称矩阵的特征向量是正交的,而我们正好要求V是一个正交矩阵!因此,我们知道$A^TA$的特征向量构成的矩阵就是(满足要求,但唯一性需要证明)我们要求的V。$\Sigma^T\Sigma$则是$A^TA$的特征值。

类似的,考虑$AA^T$,我们有

$$ AA^T = U\Sigma^T V^TV\Sigma U^T = U\Sigma^T\Sigma U^T $$

即U是$AA^T$的特征向量构成的矩阵,$\Sigma^T\Sigma$则是$AA^T$的特征值。

我们这时候其实得到了一个附属结论,那就是$AA^T$和$A^TA$的特征值是相同的。
  • 对于复矩阵(酉矩阵),只需要将转置T改成共轭转置H即可。

需要注意的是,并不是任取n个$A^TA$的两两正交单位长的特征向量都可以作为V的列向量。$V_1$和$U_1$必须要满足下面的关系才行:

$$ V_1 = A^HU_1\Delta^{-1} $$

其中$U_1$, $V_1$是非零特征值对应的特征向量组。