惯性定理的几何意义

惯性定理

引子

先看一道题：

二次型\(f(x_{1},x_{2},x_{3})=(x_{1}+x_{2})^2+(x_{2}+x_{3})^2-(x_{3}-x_{1})^2\)的正惯性指数和负惯性指数是___________.

看到题，一般而言会立刻想到惯性定理：不管选取怎样的可逆线性变换使二次型化为仅含有平方项的标准形，其中正平方项和负平方项的个数都是由所给二次型唯一确定的。于是观察题目中二次型的结构，三个括号的平方，系数两正一负，填入答案\(2,1\)。这时，所用的线性变换即为 \[ y_{1}=x_{1}+x_{2},~y_{2}=x_{2}+x_{3},~y_{3}=x_{3}-x_{1} \]

这样做对吗？错的。原因在于，惯性定理中所用到的线性变换必须是可逆线性变换。回看刚才使用的线性变换， \[ \left[\begin{aligned} y_{1}\\y_{2}\\y_{3} \end{aligned}\right]=\left[\begin{array}{lll} ~1 & 1 & 0 \\ ~0 & 1 & 1 \\ -1 & 0 & 1 \end{array}\right]\left[\begin{aligned} x_{1}\\x_{2}\\x_{3} \end{aligned}\right] \] 由于 \[ \text{r}(\left[\begin{array}{lll} ~1 & 1 & 0 \\ ~0 & 1 & 1 \\ -1 & 0 & 1 \end{array}\right])=2 \] 这显然不是一个可逆线性变换，不符合惯性定理的使用条件，不能使用定理得到结论。事实上，这道题目正确的做法应该是：

将二次型展开化简，得到： \[ f(x_{1},x_{2},x_{3})=2x_{2}^2+2x_{1}x_{2}+2x_{2}x_{3}+2x_{1}x_{3} \] 则二次型矩阵 \[ A=\left[\begin{array}{lll} 0 & 1 & 1 \\ 1 & 2 & 1 \\ 1 & 1 & 0 \end{array}\right] \] 根据公式\(|\lambda E-A|=0\)，可以得到特征值分别为\(0,-1,3\)，因此正、负惯性指数都为\(1\)。

惯性定理从几何层面上反映了：一个二次曲面经过可逆的线性变换后，其拓扑性质应该保持不变（也就是正负惯性指数不变）。如果使用了退化的线性变换，高维的几何图形便会变为低维图形，拓扑性质改变，自然也就不能保证“正负惯性指数相同”了。

从几何角度理解惯性定理

我们来考虑一个简单的例子：二次型\(x_{1}^2-4x_{1}x_{2}+x_{2}^2\)在\(1\)的等值线，也即\(x_{1}^2-4x_{1}x_{2}+x_{2}^2=1\)。

通过绘图，我们可以得出，这一等值线的形态为斜置的双曲线。

这里，二次型的矩阵为 \[ A=\left[\begin{array}{lll} ~1 & -2 \\ -2 & ~1 \end{array}\right] \] 通过正交变换法，我们容易找到正交矩阵 \[ C=\left[\begin{array}{lll} \dfrac{1}{\sqrt{2}} & -\dfrac{1}{\sqrt{2}} \\ \dfrac{1}{\sqrt{2}} & ~~\dfrac{1}{\sqrt{2}} \end{array}\right] \] 使得 \[ C^TAC=S=\left[\begin{array}{lll} -1 & 0 \\ ~~0 & 3 \end{array}\right] \] 而且\(C\)是可逆变换。

变换后的标准形是\(-y_{1}^2+3y_{2}^2=1\)。由标准形的形式可以看出，变换后的二次型在\(1\)处的等值线仍然表示双曲线。这是因为，二维平面上的线性变换的本质实际上是选取了与原先基底不同的另一组线性无关的基底，并由基底的变换对原先的图形进行了变换。从动态的角度上讲，是在保持大致形状不变的情况下对原先的图形进行了伸缩和扭转。那么自然，原来是双曲线，经过伸缩扭转后一定还是双曲线，不会变成椭圆或者抛物线。进而，正惯性指数和负惯性指数也是不会改变的。它们一旦改变，对应图形就会变成椭圆或者抛物线，这显然与刚才的推导不符。惯性定理从几何上讲是一定成立的。

要注意，上述过程成立的前提是，我们选取的一组新基底中两个向量是线性无关的，也就是惯性定理中提到的可逆线性变换，或者说非退化线性变换。从几何上讲，这一条件保证了原有的坐标平面以及图形不会被“压平”到一条直线上。这也很好理解。由于新的基底中两个向量线性无关，也就是它们不共线，那么原先在坐标平面上两个不共线的向量经过变换后依然不会共线。那现在我们来看看，如果舍弃掉这一条件又会如何呢？我们选择线性变换 \[ D=\left[\begin{array}{lll} ~1 & 0 \\ -1 & 0 \end{array}\right] \] 在这一线性变换的作用下， \[ D^TAD=\left[\begin{array}{lll} 2 & 0 \\ 0 & 0 \end{array}\right] \] 二次型变成了 \[ 2x_{1}^2=1 \] 几何上表示什么呢？一对直线。原先的双曲线由于新基底中包含了\((0,0)^T\)退化成了直线。那么我们能说，这里的正惯性指数是\(1\)，负惯性指数是\(0\)吗？不能了。现在的正负惯性指数已经不能代表图形的拓扑性质了，因而也就不再具有不变形。我们甚至选择不同的退化线性变换\(D\)，还可以得到不同的结果，比如 \[ D'=\left[\begin{array}{lll} 1 & 0 \\ 1 & 0 \end{array}\right] \] 可以得到 \[ D'^TAD'=\left[\begin{array}{lll} -2 & 0 \\ 0 & 0 \end{array}\right] \] 显然我们也不能说，这里的正惯性指数是\(0\)，负惯性指数是\(1\)。使用了一个不可逆的线性变换，得到的二次型就退化了，失真了，没有意义了。

这是应用惯性定理时一个特别需要注意的问题。

#学习 #数学

惯性定理的几何意义

https://brockshuai.github.io/2023/01/09/惯性定理/

作者

神仙魚

发布于

2023年1月9日

许可协议

Python 3.8中的新特性——海象运算符上一篇

相似矩阵知识点下一篇