由一道考研线性代数题目引发的思考

由一道考研线性代数题目引发的思考

母题

上午复习线性代数的时候做到了一道很有意思的题目:

\(\boldsymbol{A}\)\(n\)阶矩阵, \(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)是\(n\)维列向量,若\(\boldsymbol{A\alpha}_{1}=\boldsymbol{\alpha}_{1}\neq\mathbf{0},\boldsymbol{A}\boldsymbol{\alpha}_2=\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_2,\boldsymbol{A}\boldsymbol{\alpha}_3=\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3\),证明向量组\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关.

一开始看到这道题,很自然地想到把题目条件写成矩阵形式进行处理。于是得到:

\[\boldsymbol{A}[\boldsymbol{\alpha}_{1}~~\boldsymbol{\alpha}_{2}~~\boldsymbol{\alpha}_{3}]=[\boldsymbol{\alpha}_{1}~~\boldsymbol{\alpha}_{2}~~\boldsymbol{\alpha}_{3}]\left[\begin{array}{lll} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{array}\right]\]

在这里,\(\boldsymbol{A\alpha}_{1}\neq\mathbf{0}\),因此\(\boldsymbol{A}\neq\boldsymbol{0}\)。但再往下,似乎难以做进一步的处理了。

题目需要证明\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关,如果记\(\boldsymbol{P}=[\boldsymbol{\alpha}_{1}~~\boldsymbol{\alpha}_{2}~~\boldsymbol{\alpha}_{3}]\),那就要说明\(\text{rank}(\boldsymbol{P})=3\),或者\(\det(\boldsymbol{P})\neq0\)

但在不知道\(\boldsymbol{A}\)的具体信息的时候,无论是通过左/右乘矩阵,还是对两边取行列式,似乎都很难得到想要的结论。题目也没有多出的条件,通过矩阵变换证明的思路似乎难以走通了。

翻看标准答案,深感巧妙。答案的思路是这样的:由于\(\boldsymbol{A\alpha}_{1}=\boldsymbol{\alpha}_{1}\neq\mathbf{0},\boldsymbol{A} \boldsymbol{\alpha}_2=\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_2, \boldsymbol{A} \boldsymbol{\alpha}_3=\boldsymbol{\alpha}_2+\boldsymbol{\alpha}_3\),则

\[(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{\alpha}_{1}=\boldsymbol{0}\]

\[(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{\alpha}_{2}=\boldsymbol{\alpha}_{1}\]

\[(\boldsymbol{A}-\boldsymbol{E})\boldsymbol{\alpha}_{3}=\boldsymbol{\alpha}_{2}\]

假设\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性相关,则存在$ k_{1},k_{2},k_{3}~~$

\[\begin{equation}k_{1}\boldsymbol{\alpha}_{1}+k_{2}\boldsymbol{\alpha}_{2}+k_{3}\boldsymbol{\alpha}_{3}=0\end{equation}\]

\(k_{1},k_{2},k_{3}\)不全为\(0\)

\((\boldsymbol{A}-\boldsymbol{E})\)左乘\((1)\)式两侧,得到

\[k_{2}\boldsymbol{\alpha}_{1}+k_{3}\boldsymbol{\alpha}_{2}=0\]

再用\((\boldsymbol{A}-\boldsymbol{E})\)左乘上式两侧,得到

\[k_{3}\boldsymbol{\alpha}_{1}=0\]

又因为\(\boldsymbol{\alpha}_{1}\neq\mathbf{0}\),因此\(k_{3}=0\)。故进一步得到\(k_{2}\boldsymbol{\alpha}_{1}=0\)\(k_{2}=0\)。同理,再次代入,得到\(k_{1}=0\)。这与\(k_{1},k_{2},k_{3}\)不全为\(0\)是矛盾的,因此向量组\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关。答案巧妙地运用了\(\boldsymbol{\alpha}_{1}\)\(\boldsymbol{A}\)的特征向量这一条件,把待证式不断简化,简化到只含有一个向量,便可以进行处理。

做到这里,这道题的解答已经完成了。但这类题的一般规律是什么呢?具体而言,如果非零向量\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)满足\(\boldsymbol{A}[\boldsymbol{\alpha}_{1}~~\boldsymbol{\alpha}_{2}~~\boldsymbol{\alpha}_{3}]=[\boldsymbol{\alpha}_{1}~~\boldsymbol{\alpha}_{2}~~\boldsymbol{\alpha}_{3}]\boldsymbol{P}\),那么当\(\boldsymbol{P}\)满足什么样的条件时,才能证明\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关呢?

带着这个问题,我尝试了数种不同的\(\boldsymbol{P}\),发现下面这些\(\boldsymbol{P}\)的取法都可以最终得到线性无关的结论:

\[\boldsymbol{P}=\left[\begin{array}{lll} -1 & 0 & 0 \\ ~~0 & 1 & 1 \\ ~~0 & 0 & 1 \end{array}\right]\]

\[\boldsymbol{P}=\left[\begin{array}{lll} 2 & ~~0 & ~~0 \\ 0 & -1 & ~~1 \\ 0 & ~~0 & -1 \end{array}\right]\]

这时,规律仍然不太明显。但回看原题的条件:“\(\boldsymbol{A\alpha}_{1}=\boldsymbol{\alpha}_{1}, \boldsymbol{A} \boldsymbol{\alpha}_2=\boldsymbol{\alpha}_1+\boldsymbol{\alpha}_2\)”,似乎与特征值有一些关联。再结合已经得到的符合要求的\(\boldsymbol{P}\)的样子,很自然地,我们可以联想到\(\text{Jordan}\)标准型。下面,我们尝试从\(\text{Jordan}\)标准型出发,试着对母题的出题背景进行分析

Jordan标准型

\(\text{Jordan}\)标准型是一个矩阵\(\boldsymbol{J}\),它除了主对角线和主对角线上方元素之外,其余都是0,且主对角线上方的对角线数若不为\(0\)则只能为\(1\)。对角矩阵是一种特殊的\(\text{Jordan}\)标准型。

\(\text{Jordan}\)标准型的意义类似于对角矩阵,它代表了任意一个方阵最多可以被简化到的程度。然而,不是所有矩阵都可以被化成对角矩阵,只有那些有\(n\)个线性无关的特征向量的矩阵可以被对角化,但所有的\(n\)阶复方阵都有对应的\(\text{Jordan}\)标准型,也就是说对于任意矩阵\(\boldsymbol{A}\),都应该存在可逆矩阵\(\boldsymbol{P}\),使得

\[\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{J}\]

因此,\(\text{Jordan}\)标准型可以被视作一种广义的对角矩阵。

一个\(\text{Jordan}\)标准型由若干个对角线上排列的\(\text{Jordan}\)块组成。一个阶数为\(n_{i}\)\(\text{Jordan}\)块定义如下:

\[\boldsymbol{J}_{n_i}(\lambda)=\left(\begin{array}{ccccc} \lambda & 1 & & & 0 \\ & \lambda & 1 & & \\ & & \ddots & & \\ & & & \lambda & 1 \\ 0 & & & & \lambda \end{array}\right)\]

因此

\[\boldsymbol{J}=\left(\begin{array}{ccc} J_{n_1}\left(\lambda_1\right) & & 0 \\ & \ddots & \\ 0 & & J_{n_k}\left(\lambda_m\right) \end{array}\right)\]

通过证明,我们能得到如下结论:

  1. 是否可对角化:如果一个矩阵的\(\text{Jordan}\)标准形是对角阵,那么这个矩阵可对角化。
  2. 本征值的代数重数与几何重数:本征值\(\lambda_{i}\)\(\text{Jordan}\)矩阵对角线上出现的总次数为\(d_{i}\)(即\(J(\lambda_{i})\)的阶数为\(d_{i}\)),则\(\lambda{i}\)的代数重数为\(d_{i}\)。本征值\(\lambda_{i}\)\(\text{Jordan}\)矩阵的\(g_{i}\)\(\text{Jordan}\)块中出现过,则\(\lambda_{i}\)的几何重数为\(g_{i}\)

由以上知识,可以得到三阶方阵的四种\(\text{Jordan}\)标准型形式:

第一种

\(\begin{aligned} & g m\left(\lambda_1\right)=1, g m\left(\lambda_2\right)=1, \operatorname{gm}\left(\lambda_3\right)=1 \\ & \operatorname{am}\left(\lambda_1\right)=1, \operatorname{am}\left(\lambda_2\right)=1, \operatorname{am}\left(\lambda_3\right)=1 \end{aligned}\)

\[\left(\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_3 \end{array}\right)\]

第二种

\(\begin{aligned} & g m\left(\lambda_1\right)=1, g m\left(\lambda_2\right)=2, \\ & \operatorname{am}\left(\lambda_1\right)=1, \operatorname{am}\left(\lambda_2\right)=2, \end{aligned}\)

\[\left(\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_2 \end{array}\right)\]

第三种

\(\begin{aligned} & g m\left(\lambda_1\right)=1, g m\left(\lambda_2\right)=1, \\ & \operatorname{am}\left(\lambda_1\right)=1, \operatorname{am}\left(\lambda_2\right)=2, \end{aligned}\)

\[\left(\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 1 \\ 0 & 0 & \lambda_2 \end{array}\right)\]

第四种

\(\begin{aligned} & g m\left(\lambda_1\right)=1 \\ & \operatorname{am}\left(\lambda_1\right)=3 \end{aligned}\)

\[\left(\begin{array}{ccc}\lambda_1 & 1 & 0 \\ 0 & \lambda_1 & 1 \\ 0 & 0 & \lambda_1\end{array}\right)\]

刚才已经提到,所有的\(n\)阶复方阵都有对应的\(\text{Jordan}\)​标准型,对于任意矩阵\(\boldsymbol{A}\),都应该存在可逆矩阵\(\boldsymbol{P}\),使得

\[\boldsymbol{P}^{-1}\boldsymbol{AP}=\boldsymbol{J}\]

也即

\[\boldsymbol{AP}=\boldsymbol{PJ}\]

这一形式与原题中的条件十分已经十分相像了呢?事实上可以发现,母题中所给出的矩阵\(\left[\begin{array}{lll} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{array}\right]\)与我们找到的符合要求的矩阵恰好符合\(\text{Jordan}\)标准型的形式。

与矩阵的相似对角化类似,如果我们把这里的\(\boldsymbol{P}\)按列分块,可以得到,\(\boldsymbol{P}\)的列向量组恰好是\(\boldsymbol{A}\)\(n\)个的广义特征向量(即满足\((\boldsymbol{A}-\lambda\boldsymbol{E})^{m}\boldsymbol{\alpha}=\boldsymbol{0}\)\(\boldsymbol{\alpha}\))。而且可以得到,\(\boldsymbol{P}\)的列向量组中的任意向量要么分别对应了不同的特征值,要么是同一个特征值下的广义特征向量链中的向量。无论是这两种情况中的哪一种,都可以证明它们是线性无关的。关于广义特征向量链的证明参考以下链接:https://zhuanlan.zhihu.com/p/30454490

再回到母题

母题的出题背景此时已经呼之欲出了。再来看答案给出的解题过程,可以看出出题人实际上是把“证明广义特征向量线性无关”这一结论做了特殊化处理,让我们来证明对于一个给定的\(\text{Jordan}\)型,它的三个广义特征向量是线性无关的。答案给出的解题过程也是完全按照一般结论的证明来进行的:不断对等式两边做\((\boldsymbol{A}-\lambda\boldsymbol{E})\)的线性变换,直到证明所有的系数均为\(0\)为止。

现在我们可以来回答一开始提出的问题了:什么样的\(\boldsymbol{P}\)才能确保\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关呢?根据上面的知识,作如下推断(只考虑\(\boldsymbol{P}\)\(\text{Jordan}\)标准形的情况):

  1. \(\boldsymbol{P}\)属于上述的第一种、第三种和第四种标准型时,可以保证\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关。在这种情况下,\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)要么是不同特征值对应的特征向量,要么是同一特征向量链下的向量,线性无关。
  2. \(\boldsymbol{P}\)属于上述的第二种标准型时,不能保证\(\boldsymbol{\alpha}_{1},\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)线性无关。如果仍然想要得到结论:需要添加条件\(\boldsymbol{\alpha}_{2},\boldsymbol{\alpha}_{3}\)是同一特征值下的两个线性无关的向量。

由一道考研线性代数题目引发的思考
https://brockshuai.github.io/2023/01/06/线代思考/
作者
神仙魚
发布于
2023年1月6日
许可协议