数学

相似标准型

2026-06-14 #线性代数#若尔当标准型#λ-矩阵

线性代数笔记:相似标准型、λ\lambda-矩阵与若尔当标准型

一、 λ\lambda-矩阵与相似标准型

1. λ\lambda-矩阵的定义

λ-矩阵 A(λ)=(aij(λ))m×n\lambda\text{-矩阵 } A(\lambda) = \big(a_{ij}(\lambda)\big)_{m \times n}

可以表示为:

A(λ)=Amλm+Am1λm1++A1λ+A0A(\lambda) = A_m \lambda^m + A_{m-1} \lambda^{m-1} + \cdots + A_1 \lambda + A_0
其中 AiA_i 为常数矩阵(数字矩阵)。

  • 可逆的条件

    A(λ)0 且为常数.|A(\lambda)| \ne 0 \text{ 且为常数}.

2. λ\lambda-矩阵的标准型(Smith 标准型)

(d1(λ)d2(λ)dr(λ)00) \begin{pmatrix} d_1(\lambda) & & & & & \\ & d_2(\lambda) & & & & \\ & & \ddots & & & \\ & & & d_r(\lambda) & & \\ & & & & 0 & & \\ & & & & & \ddots & \\ & & & & & & 0 \end{pmatrix}

其中 di(λ)d_i(\lambda) 是首项系数为 1 的多项式,且满足整除关系:

d1(λ)d2(λ)dr(λ)d_1(\lambda) \mid d_2(\lambda) \mid \cdots \mid d_r(\lambda)
(即后一个多项式总能被前一个整除)。

3. 行列式因子 (Determinant Factors)

全部 kk 阶子式的首项系数为 1 的最大公因式 Dk(λ)D_k(\lambda) 称为 A(λ)A(\lambda)kk 阶行列式因子

  • 重要结论:行列式因子相同     \iff 矩阵相似。

4. 不变因子 (Invariant Factors)

不变因子 di(λ)d_i(\lambda) 与行列式因子 Dk(λ)D_k(\lambda) 的关系为:

d1(λ)=D1(λ),d2(λ)=D2(λ)D1(λ),,dn(λ)=Dn(λ)Dn1(λ)d_1(\lambda) = D_1(\lambda),\quad d_2(\lambda) = \frac{D_2(\lambda)}{D_1(\lambda)},\quad \cdots,\quad d_n(\lambda) = \frac{D_n(\lambda)}{D_{n-1}(\lambda)}

  • 重要结论:不变因子相同     \iff 矩阵相似。

5. 初等因子 (Elementary Divisors)

将所有非平凡的不变因子分解成首项系数为 1 的两两不同的两两互素的不可约多项式次幂的乘积,这些幂方项即为初等因子。

示例:若某矩阵的不变因子为 (λ2),(λ2)(λ1)2(\lambda-2), (\lambda-2)(\lambda-1)^2,则它的初等因子为:

(λ2),(λ2),(λ1)2(\lambda-2), (\lambda-2), (\lambda-1)^2

  • 矩阵等价的充要条件:秩和不变因子相同     \iff 矩阵等价。


二、 特征矩阵与若尔当标准型 (Jordan Normal Form)

1. 核心概念与性质

  • 凯莱-哈密顿定理

    f(λ) 使 f(A)=0    A 以 A 为根.f(\lambda) \text{ 使 } f(A) = 0 \iff A \text{ 以 } A \text{ 为根}.

  • 最小多项式 m(λ)m(\lambda):最小多项式与最后一个不变因子 dn(λ)d_n(\lambda) 相同。

  • 对角化条件

    A 与对角矩阵相似    最小多项式无重根.A \text{ 与对角矩阵相似} \iff \text{最小多项式无重根}.

2. 若尔当标准型结构

若尔当标准型由若干个若尔当块(Jordan Block)组成:

(J1J2Js) \begin{pmatrix} J_1 & & \\ & J_2 & \\ & & \ddots \\ & & & J_s \end{pmatrix}

其中每一个若尔当块 JiJ_i 的形式为:
Ji=(λ0001λ00001λ0001λ) J_i = \begin{pmatrix} \lambda & 0 & \cdots & \cdots & 0 & 0 \\ 1 & \lambda & \cdots & \cdots & 0 & 0 \\ \vdots & \vdots & \ddots & & \vdots & \vdots \\ \vdots & \vdots & & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & \lambda & 0 \\ 0 & 0 & \cdots & \cdots & 1 & \lambda \end{pmatrix}

3. 如何求若尔当标准型

通用步骤

  1. 求特征值:解 λIA=0|\lambda I - A| = 0,得特征值 λ1,,λs\lambda_1,\dots,\lambda_s

  2. 对每个特征值 λi\lambda_i,确定若尔当块

    • 计算 dk=dimker(AλiI)kd_k = \dim\ker(A - \lambda_i I)^k(零空间维数),k=1,2,k = 1,2,\dots 直到维数稳定
    • 若尔当块个数 =d1= d_1(即几何重数)
    • 大小 k\ge k 的若尔当块个数 =dkdk1= d_k - d_{k-1}(约定 d0=0d_0 = 0
    • 大小恰好 =k= k 的若尔当块个数 =(dkdk1)(dk+1dk)= (d_k - d_{k-1}) - (d_{k+1} - d_k)
  3. 组合:将所有若尔当块按对角排列。

:若 d1d_1 等于代数重数,则全部为 1×11\times1 若尔当块(即可对角化)。

例题:已知 A=(210020003)A = \begin{pmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{pmatrix},求其若尔当标准型。

  1. 求特征值

    λIA=λ2100λ2000λ3=(λ2)2(λ3)|\lambda I - A| = \begin{vmatrix} \lambda-2 & -1 & 0 \\ 0 & \lambda-2 & 0 \\ 0 & 0 & \lambda-3 \end{vmatrix} = (\lambda-2)^2(\lambda-3)

    所以特征值为:
    λ1=λ2=2,λ3=3\lambda_1 = \lambda_2 = 2,\quad \lambda_3 = 3

  2. 分析若尔当块

    • λ=2\lambda = 2 时:
      A2I=(010000001),rank=2A - 2I = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix},\quad \text{rank}=2

      d1=dimker(A2I)=32=11 个若尔当块d_1 = \dim\ker(A-2I) = 3-2 = 1 \quad \Rightarrow \quad 1\text{ 个若尔当块}

      (A2I)2=(000000001),rank=1(A-2I)^2 = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix},\quad \text{rank}=1

      d2=31=2,d3=2(稳定)d_2 = 3-1 = 2,\quad d_3 = 2 \text{(稳定)}

      大小恰好为 2 的块个数 =(d2d1)(d3d2)=(21)(22)=1= (d_2-d_1)-(d_3-d_2) = (2-1)-(2-2) = 1
      λ=2 对应一个 2×2 若尔当块\Rightarrow \lambda=2 \text{ 对应一个 } 2\times2 \text{ 若尔当块}
    • λ=3\lambda = 3 时(1重根),对应 1×11\times1 若尔当块:
      (3)\begin{pmatrix}3\end{pmatrix}
  3. 最终组合成的若尔当标准型为

    (200120003)\begin{pmatrix} 2 & 0 & 0 \\ 1 & 2 & 0 \\ 0 & 0 & 3 \end{pmatrix}


三、 计算示例:求 D4(λ)D_4(\lambda)

对于手稿中的 4×44 \times 4 特征矩阵:

λ21000λ+12000λ1034λ+1 \begin{vmatrix} \lambda-2 & 1 & 0 & 0 \\ 0 & \lambda+1 & 2 & 0 \\ 0 & 0 & \lambda & 1 \\ 0 & 3 & 4 & \lambda+1 \end{vmatrix}

按第一列展开:
D4(λ)=(λ2)λ+1200λ134λ+1=(λ2)[(λ+1)(λ(λ+1)4)2(03)]=(λ2)[(λ+1)(λ2+λ4)+6]=(λ2)(λ3+2λ23λ+2) \begin{aligned} D_4(\lambda) & = (\lambda-2) \begin{vmatrix} \lambda+1 & 2 & 0 \\ 0 & \lambda & 1 \\ 3 & 4 & \lambda+1 \end{vmatrix} \\ & = (\lambda-2)\big[(\lambda+1)(\lambda(\lambda+1)-4) - 2(0-3) \big] \\ & = (\lambda-2)\big[(\lambda+1)(\lambda^2+\lambda-4) + 6 \big] \\ & = (\lambda-2)(\lambda^3+2\lambda^2-3\lambda+2) \end{aligned}


四、 变换矩阵的求法

A(λ)标准型 B(λ)A(\lambda) \longrightarrow \text{标准型 } B(\lambda),求可逆 λ\lambda-矩阵 P(λ),Q(λ)P(\lambda), Q(\lambda) 使得:

B(λ)=P(λ)A(λ)Q(λ)B(\lambda) = P(\lambda)A(\lambda)Q(\lambda)

通用高斯变换技巧(大增广矩阵法):构建如下的联合矩阵进行初等变换:

$$ \left(\begin{array}{c|c} A(\lambda) & I \\ \hline I & 0 \end{array}\right) \longrightarrow \left(\begin{array}{c|c} B(\lambda) & P(\lambda) \\ \hline Q(\lambda) & \end{array}\right) $$
  • 注:在对 A(λ)A(\lambda) 进行化简时,不需要做对称变换,行变换产生的效果记录在右侧,列变换产生的效果记录在下方。


返回总目录

评论
分享

评论