文章目錄
  1. 1. 方程组的回顾
  2. 2. 矩阵的秩
  3. 3. 可解性准则
  4. 4. 习题

方程组的回顾

在高为$m$的列向量空间$\mathbb{R}^m$中,考察$n$个向量

$$A^{(j)}=[a_{1j} ,a_{2j} ,\cdots ,a_{mj} ],j=1,2,\cdots ,n,$$

以及它们的线性包$V=\langle A^{(1)} ,A^{(2)} ,\cdots ,A^{(n)} \rangle$.假设再给出一个向量$B$,问$B$是否在线性包$V\subset \mathbb{R}^m$中,如果在,它的坐标$b_1 ,\cdots ,b_m$(在$\S 1(3′)$的标准基下)是怎么样通过$A^{(j)}$的坐标表示出来的.当$dim V=n$时,问题的第二部分相当于确定向量$B$在基$A^{(1)} ,\cdots ,A^{(n)}$之下的坐标.为此,我们取$A^{(j)}$以未知数$x_j$为系数的线性组合,并构造方程$x_1 A^{(1)} +\cdots +x_n A^{(n)} =B$.该方程的直观形式为

$$x_1 \begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{pmatrix} +x_2 \begin{pmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{pmatrix} +\cdots +x_n \begin{pmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{pmatrix} =\begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{pmatrix} .\label{1} \tag{1}$$

方程的另一种写法是含有$m$个方程,$n$个未知数的线性方程组

$$ \begin{matrix} a_{11} x_1 +a_{12} x_2 +\cdots +a_{1n} x_n =b_1 ,\\ a_{21} x_1 +a_{22} x_2 +\cdots +a_{2n} x_n =b_2 ,\\ \cdots \cdots \cdots \cdots \\ a_{m1} x_1 +a_{m2} x_2 +\cdots +a_{mn} x_n =b_m , \end{matrix} \label{2} \tag{2}$$

这就是我们最初在第$1$章$\S 3$中遇到过的方程组.在那里我们引入了线性方程组$\eqref{2}$的系数矩阵和增广矩阵.

$$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} ,(A\mid B)=\left( \begin{array}{cccc|c} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \cdots & \cdots & \cdots & \cdots & \cdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{array} \right) .\label{3} \tag{3}$$

乍一看来,我们又回到了出发点,浪费了时间而什么都没得到.但事实上,我们现在得到了一系列重要的概念.余下的事情是学会使用它们.

先来约定一些符号.我们通常将和$s_1 +s_2 +\cdots +s_n $简写成$\displaystyle \sum_{i=1}^n s_i $.此处$s_1 ,\cdots ,s_n$是满足数或向量的加法法则的任意量(数,行向量等等).法则

$$\displaystyle \sum_{i=1}^n ts_i =t\sum_{i=1}^n s_i ,\sum_{i=1}^n (s_i +t_i ) =\sum_{i=1}^n s_i +\sum_{i=1}^n t_i $$

是不证自明的.

我们也要考虑下述双重和

$$\sum_{j=1}^n \sum_{i=1}^m a_{ij} =\sum_{j=1}^n \left( \sum_{i=1}^m a_{ij} \right) =\sum_{i=1}^m \left( \sum_{j=1}^n a_{ij} \right) =\sum_{i,j} a_{ij} ,$$

求和的顺序(按照第一或第二个脚标)可以根据自己的希望选择.易见,如果将$a_{ij}$排成$m\times n$阶的长方阵,那么矩阵元素的求和既可以按行进行,也可以按列进行.

矩阵的秩

上节引入的线性包$V=\langle A^{(1)} ,A^{(2)} ,\cdots ,A^{(n)} \rangle $叫作$m\times n$阶长方阵$A$(见公式$\eqref{3}$)的列空间.将$V$记作$V_c (A)$或简记作$V_c $(其中$c$表示列).维数$r_c (A)=dim V_c $叫作矩阵$A$的列秩.类似地可定义矩阵$A$的行秩:$r_r (A)=dim V_r $,此处$V_r =\langle A_{(1)} ,A_{(2)} ,\cdots ,A_{(n)} \rangle $是矩阵$A$的行空间,即由$\mathbb{R}^n$中的行向量$A_{(i)} =(a_{i1} ,a_{i2} ,\cdots ,a_{in} )$,$i=1,2,\cdots ,m$,生成的线性包(其中$r$表示行).换言之,

$$r_c (A) =\text{rank} \lbrace A^{(1)} ,A^{(2)} ,\cdots ,A^{(n)} \rbrace ,$$

$$r_r (A) =\text{rank} \lbrace A_{(1)} ,A_{(2)} ,\cdots ,A_{(n)} \rbrace $$

分别为行向量组和列向量组的秩.根据$\S 1$定理$2$,数值$r_c (A)$和$r_r (A)$的定义是合理的.

按照第$1$章$\S 3$的术语,称矩阵$A’$是由矩阵$A$经过Ⅰ型初等变换得到的,如果有某对脚标$s\neq t$,使得$A’_{(s)} =A_t $,$A’_{(t)} =A_s $,但对任意脚标$i\neq s,t$,$A’_{(i)} =A_{(i)} $;称矩阵$A’$是由矩阵$A$经过Ⅱ型初等变换得到的,如果有某对脚标$s\neq t$,使得任取脚标$i\neq s$,$A’_{(i)} =A_{(i)} $,而$A’_s =A_{(s)} +\lambda A_{(t)} $,其中$\lambda \in \mathbb{R} $.注意到初等变换是在$A$上的行上进行的.

我们指出,两类初等变换都是可逆的,也就是说,从$A$得到的矩阵$A’$可以借助于初等变换重新变回到$A$,并且所用的初等变换是同型的.

引理 如果矩阵$A’$是由长方阵$A$经过有限多次初等行变换得到的,则有等式

$i) r_r (A’) =r_r (A);$

$ii) r_c (A’) =r_c (A).$

证明 只要考虑$A’$是由$A$经过一次初等行变换得到的情况就足够了.

$i)$因为

$$\langle A_{(1)} ,\cdots ,A_{(s)} ,\cdots ,A_{(t)} ,\cdots ,A_{(m)} \rangle =\langle A_{(1)} ,\cdots ,A_{(t)} ,\cdots ,A_{(s)} ,\cdots ,A_{(m)} \rangle ,$$

所以Ⅰ型初等变换不改变$r_r (A)$.另一方面,

$$A’_{(s)} =A_{(s)} +\lambda A_{(t)} \Rightarrow A_{(s)} =A’_{(s)} -\lambda A_{(t)} ,$$

从而

$$\langle A_{(1)} ,\cdots ,A_{(s)} +\lambda A_{(t)} ,\cdots ,A_{(t)} ,\cdots ,A_{(m)} \rangle =\langle A_{(1)} ,\cdots ,A_{(s)} ,\cdots ,A_{(t)} ,\cdots ,A_{(m)} \rangle ,$$

这样Ⅱ型初等变换也不改变$r_r (A)$.

$ii)$设$A’^{(j)} $,$1\leq j\leq n$,是矩阵$A’$的列.我们来证明

$$\displaystyle \sum_{j=1}^n \lambda _j A^{(j)} =0 \Leftrightarrow \sum_{j=1}^n \lambda _j A’^{(j)} =0.\label{4} \tag{4} $$

为此,考察$A$和$A’$对应的齐次线性方程组$\text{HLS}$和$\text{HLS}’$,它们用$\eqref{1}$的形式给出(常数项取零):

$$\text{HLS} :\displaystyle \sum_{j=1}^n x_j A^{(j)} =0,\text{HLS}’ :\displaystyle \sum_{j=1}^n x_j A’^{(j)} =0.$$

矩阵$A$与$A’$的关系使得$\text{HLS}’$是由$\text{HLS}$经过Ⅰ型或Ⅱ型初等变换得到的.根据第$1$章$\S 3$定理$1$,$\text{HLS}$与$\text{HLS}’$等价,即一个方程组的所有的解$(\lambda _1 ,\lambda _2 ,\cdots ,\lambda _n )$也是另一个的解,这样,蕴含关系$\eqref{4}$成立.

综上所述,一个矩阵的列向量的极大线性无关组的向量个数与另一个矩阵列向量的相应个数相符,这就确立了等式$r_c (A’)=r_c (A).\quad \quad \square $

本节的基本结论是下述断言.

定理$1$ 对于任意$m\times n$阶长方阵$A$,等式$r_c (A)=r_r (A)$成立(这个数叫作矩阵$A$的秩,记作$\text{rank} A$).

证明 根据第$1$章$\S 3$定理$2$,经过有限次初等行变换,矩阵$A$可以化成阶梯形

$$\overline{A} =\begin{pmatrix} \overline{a}_{11} & \cdots & \overline{a}_{1k} & \cdots & \overline{a}_{1l} & \cdots & \overline{a}_{1s} & \cdots & \overline{a}_{1n} \\ 0 & \cdots & \overline{a}_{2k} & \cdots & \overline{a}_{2l} & \cdots & \overline{a}_{2s} & \cdots & \overline{a}_{2n} \\ 0 & \cdots & 0 & \cdots & \overline{a}_{3l} & \cdots & \overline{a}_{3s} & \cdots & \overline{a}_{3n} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & \overline{a}_{rs} & \cdots & \overline{a}_{rn} \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \end{pmatrix} \label{5} \tag{5} $$

其中$\overline{a}_{11} \cdot \overline{a}_{2k} \cdot \overline{a}_{3l} \cdots \overline{a}_{rs} \neq 0$,根据引理

$$r_c (A) =r_c (\overline{A} ),r_r (A) =r_r (\overline{A} ),$$

我们只需证明等式$r_c (\overline{A} )=r_r (\overline{A} )$就足够了.

在矩阵$A$与$\overline{A}$中脚标为$1,k,l,\cdots ,s$的列叫作列向量基.它们对应于线性方程组$\eqref{2}$的主未知数$x_1 ,x_k ,x_l ,\cdots ,x_s $.列向量基这一术语是很有道理的.假设矩阵$\eqref{5}$的第$1,k,l,\cdots ,s$个列向量

$$\overline{A}^{(1)} =[\overline{a}_{11} ,0,\cdots ,0] ,\overline{A}^{(k)} =[\overline{a}_{1k} ,\overline{a}_{2k} ,0,\cdots ,0],\cdots \cdots ,\overline{A}^{(s)} =[\overline{a}_{1s} ,\overline{a}_{2s} ,\cdots ,\overline{a}_{rs} ,0,\cdots ,0],$$

如果它们之间有关系式

$$\lambda _1 \overline{A}^{(1)} + \lambda _k \overline{A}^{(k)} +\lambda _l \overline{A}^{(l)} +\cdots +\lambda _s \overline{A}^{(s)} =0,$$

$$\lambda _s \overline{a}^{rs} =0,\cdots ,\lambda _l \overline{a}^{3l} =0,\lambda _k \overline{a}^{2k} =0,\lambda _1 \overline{a}^{11} =0,$$

又因为$\overline{a}_{11} \cdot \overline{a}_{2k} \cdot \overline{a}_{3l} \cdot \overline{a}_{rs} \neq 0$,故$\lambda _1 =\lambda _k =\lambda _l =\cdots =\lambda _s =0$.于是

$$\text{rank} \lbrace \overline{A}^{(1)} ,\overline{A}^{(k)} ,\overline{A}^{(l)} ,\cdots ,\overline{A}^{(s)} \rbrace =r,$$

$$r_c (\overline{A} )\geq r.$$

但是矩阵$\overline{A}$的列空间$\overline{V}_c$等同于从$\overline{A}$中删去后$m-r$个零行所成矩阵的列空间.所以

$$r_c (\overline{A} )=\text{dim} \overline{V}_c \leq \text{dim} \mathbb{R}^r =r.$$

比较两个不等式得到$r_c (\overline{A} )=r$.(不等式$r_c (\overline{A} )\leq r$也可以从一个显然的事实得到,即矩阵$\overline{A}$的所有列都是列向量基的线性组合;我们把这一论断留作习题.)

另一方面,矩阵$\overline{A}$的所有非零行是线性无关的:任意线性关系

$$\lambda _1 \overline{A}_{(1)} + \lambda _2 \overline{A}_{(2)} +\cdots +\lambda _r \overline{A}_{(r)} =0,\lambda _i \in \mathbb{R}$$

如同在列向量的情况一样,给出

$$\lambda _1 \overline{a}^{11} =0,\lambda _2 \overline{a}^{2k} =0,\cdots ,\lambda _r \overline{a}^{rs} =0,$$

因而$\lambda _1 =\lambda _2 =\cdots =\lambda _r =0$.于是$r_r (\overline{A} )=r=r_c (\overline{A}).\quad \square $

可解性准则

矩阵$A$的阶梯形可以回答对应的线性方程组(见第$1$章$\S 3$)的一系列问题,但阶梯形依赖于初等变换的实施过程,例如,列向量基,或等价地方程组$\eqref{2}$中的主未知数,可以有不同的选择.尽管如此,我们却可以从定理$1$及其证明得出下述

推论 若$b_1 =b_2 =\cdots =b_m =0$,则齐次线性方程组$\eqref{2}$中主未知数的个数不依赖于化为阶梯形的方式,它等于$\text{rank} A$,其中$A$是方程组的系数矩阵.

证明 我们已经看到,主未知数的个数等于矩阵$\overline{A}$(见公式$\eqref{5}$)的非零行的个数,后者等于矩阵$A$的秩.而矩阵的秩是唯一确定的.(这句话表明,矩阵的秩作为它的内在特征,不依赖于任何外加状况.)$\quad \square $

在下一章中,我们将得到一个有效的方法去计算矩阵$A$的秩,不需要将$A$化为阶梯型.这种诊断的一个简单而有用的例子是第$1$章中谈到的线性方程组的可解性准则.

定理$2$ (克罗内克-卡皮里)线性方程组$\eqref{2}$是可解的,当且仅当它的系数矩阵的秩等于增广矩阵的秩(见$\eqref{3}$).

证明 将线性方程组$\eqref{2}$写成形式$\eqref{1}$,它的可解性可以解释成下述问题(见本节开头):列向量$B$是否可以写成矩阵$A$的列向量的线性组合.如果$B$能这样表示(即方程组$\eqref{2}$是可解的),则$B\in \langle A^{(1)} ,A^{(2)} ,\cdots ,A^{(n)} \rangle$,那么$\text{rank} \lbrace A^{(1)} ,\cdots ,A^{(n)} \rbrace =\text{rank} \lbrace A^{(1)} ,\cdots ,A^{(n)},B \rbrace$,于是$\text{rank} A=r_c (A)=r_c ((A\mid B)) =\text{rank} (A\mid B)$(见定理$1$).

反之,如果矩阵$A$与矩阵$(A\mid B)$有相同的秩,且$\lbrace A^{(j_1)} ,\cdots ,A^{(j_r)} \rbrace $是矩阵$A$列向量组的极大线性无关组,则扩张组$\lbrace A^{(j_1)} ,\cdots ,A^{(j_r)} ,B\rbrace $是线性相关的,根据$\S 1$定理$1,v)$,$B$是基本列$A^{(j)}$的线性组合.于是方程组$\eqref{2}$是可解的.$\quad \square $

习题

$1$.不把$m\times n$阶矩阵$A=(a_{ij})$化成阶梯形,证明定理$1$.

提示:设$\text{dim}V_r (A)=r,\text{dim}V_c (A)=s$.选择$r$个基行;不失一般性,可以假定它们是前$r$行$A_{(1)} ,A_{(2)} ,\cdots ,A_{(r)} $.考察由$A$的前$r$行组成的$r\times n$矩阵$\tilde{A} =[A_{(1)} ,A_{(2)} ,\cdots ,A_{(r)} ]$.在$\tilde{A}$中选择$t$个基列,此处$t=\text{dim}V_c (\tilde{A} )$.设为$\tilde{A}^{(1)} ,\cdots ,\tilde{A}^{(t)} $.因为$V_c (\tilde{A} )\subset \mathbb{R}^r$,故$t\leq r$.对于$A$的任意列$A^{(k)}$,$k > t$,可以找到常数$\lambda _1 ,\cdots ,\lambda _t \in \mathbb{R}$,使得$A^{(k)}=\lambda _1 A^{(1)}+\cdots +\lambda _t A^{(t)}$,即$a_{ik} =\displaystyle \sum_{p=1}^t \lambda _p a_{ip} $,$1\leq i\leq m$.当$i\leq r$时,这是显然的,因为我们有关于$\tilde{A}$列的关系式$\tilde{A}^{(k)} =\lambda _1 \tilde{A}^{(1)} +\cdots +\lambda _t \tilde{A}^{(t)}$.当$i > r$时,运用第$i$行通过前$r$列的表达式$A_{(i)} =\mu _1 A_{(1)} +\cdots +\mu _r A_{(r)}$,得到

$$a_{ik} =\displaystyle \sum_{l=1}^r \mu _l a_{lk} =\sum_{l=1}^r \mu _l \sum_{p=1}^t \lambda _p a_{lp} =\sum_{p=1}^t \lambda _p \sum_{l=1}^r \mu _l a_{lp} =\sum_{p=1}^t \lambda _p a_{ip} .$$

列的线性相关性准则表明,$s\leq t$,但上述证明给出$t\leq r$,故$s\leq r$.进一步,考察$n\times m$阶转置矩阵

$$\sideset{^t}{}A=\begin{pmatrix} a_{11} & a_{21} & \cdots & a_{m1} \\ a_{12} & a_{22} & \cdots & a_{m2} \\ \cdots & \cdots & \cdots & \cdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \end{pmatrix} $$

得到等式$r_r (\sideset{^t}{}A )=r_c (A) ,r_c (\sideset{^t}{}A )=r_r (A)$,所以根据上述证明$r\leq s$.综上所述,$r=s$.

$2$.如同行的情况,交换矩阵$A$的第$s$列和第$t$列,叫作Ⅰ型初等变换,而将第$t$列乘以常数$\lambda $加到第$s$列上,叫作Ⅱ型初等变换.

描述矩阵$A$经初等列变换化成的阶梯形.用初等列变换将矩阵$\overline{A}$(见公式$\eqref{5}$)化为形式

$$\begin{pmatrix} \tilde{a}_{11} & & & & \vdots & & & \\ & \tilde{a}_{22} & & & \vdots & & & \\ & & \ddots & & \vdots & & & \\ & & & \tilde{a}_{rr} & \vdots & & & \\ \cdots & \cdots & \cdots & \cdots & \vdots & \cdots & \cdots & \cdots & \\ & & & & \vdots & 0 & & & \\ & & & & \vdots & & \ddots & & \\ & & & & \vdots & & & 0 \end{pmatrix} ,$$

其中

$$\tilde{a}_{11} =\overline{a}_{11} ,\tilde{a}_{22} =\overline{a}_{2k} ,\tilde{a}_{33} =\overline{a}_{3l} ,\cdots ,\tilde{a}_{rr} =\overline{a}_{rs} ;\displaystyle \prod_{i=1}^r \tilde{a}_{ii} \neq 0.$$

解:$(1)\;$对于矩阵$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} $来说,通过施行一系列的初等列变换,可以将其转化为阶梯形

$$\overline{A} =\begin{pmatrix} \overline{a}_{11} & 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{k1} & \overline{a}_{k2} & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{l1} & \overline{a}_{l2} & \overline{a}_{l3} & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{s1} & \overline{a}_{s2} & \overline{a}_{s3} & \cdots & \overline{a}_{sr} & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{m1} & \overline{a}_{m2} & \overline{a}_{m3} & \cdots & \overline{a}_{mr} & 0 & \cdots & 0 \end{pmatrix} $$

其中$\overline{a}_{11} \cdot \overline{a}_{k2} \cdot \overline{a}_{l3} \cdots \overline{a}_{sr} \neq 0$.

具体步骤:首先指出,对于矩阵$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} $,第一行中其系数$a_{1j} $当中至少有一个不等于$0$.否则考虑第二行,直至找到第$i$行当中最先出现不等于$0$的数为止.如果$a_{11} =0$,$a_{1j} \neq 0$,交换第$1$列与第$j$列,(用Ⅰ型初等变换)得到一个新矩阵.否则,$a_{11} \neq 0$,则不进行初等变换,但为方便,依然记为新矩阵.现在新矩阵中的第一行第一列位置的系数非$0$.如下所示:

$$\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{11} & \cdots & a_{1n} \\ a_{2i} & a_{22} & \cdots & a_{21} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots & & \vdots \\ a_{mi} & a_{m2} & \cdots & a_{m1} & \cdots & a_{mn} \end{pmatrix} $$

将第一列分别乘以常数$\lambda _i $,分别加到第$j$列$(j=2,3,\cdots ,n)$上去,使得加完后第一行的系数除$a_{11}$以外都变为$0$(做$n-1$次Ⅱ型初等变换).显然为此必须取$\lambda _i =-\dfrac{a_{1j}}{a_{11}} $.结果我们就得到了另一个新矩阵,第一行除第一个位置以外全为零.如下所示:

$$\begin{pmatrix} a_{11} & 0 & \cdots & 0 & \cdots & 0 \\ a_{2i} & a_{22} -a_{2i} \dfrac{a_{12}}{a_{11}} & \cdots & a_{21} -a_{2i} \dfrac{a_{11}}{a_{11}} & \cdots & a_{2n} -a_{2i} \dfrac{a_{1n}}{a_{11}} \\ \vdots & \vdots & & \vdots & & \vdots \\ a_{mi} & a_{m2} -a_{mi} \dfrac{a_{12}}{a_{11}} & \cdots & a_{m1} -a_{mi} \dfrac{a_{11}}{a’_{11}} & \cdots & a_{mn} -a_{mi} \dfrac{a_{1n}}{a_{11}} \end{pmatrix} $$

为方便,把上面的矩阵记为

$$\begin{pmatrix} a’_{11} & 0 & \cdots & 0 & \cdots & 0 \\ a’_{21} & a’_{22} & \cdots & a’_{2j} & \cdots & a’_{2n} \\ \cdots & \cdots & & \cdots & & \cdots \\ a’_{m1} & a’_{m2} & \cdots & a’_{mj} & \cdots & a’_{mn} \end{pmatrix} $$

接着,从第二行开始,考察第$2,\cdots ,n$列的数,如果能找到一个不为零的数$ a’_{2p}$,则交换第$2$列与第$p$列.否则,考察第三行,直至找出一个不为零的数出来为止.

假设,当考察到第$k$行时,能找到这么一个不为零的数$ a’_{kp}$出来,那么交换第$2$列与第$p$列(用Ⅰ型初等变换),得

$$\begin{pmatrix} a’_{11} & 0 & \cdots & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’_{k1} & a’_{kp} & \cdots & a’_{22} & \cdots & a’_{kn} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’_{m1} & a’_{mp} & \cdots & a’_{m2} & \cdots & a’_{mn} \end{pmatrix} $$

将第二列分别乘以常数$\lambda’_i $,分别加到第$j$列$(j=3,4,\cdots ,n)$上去,使得加完后第$k$行的系数除$a_{kp}$以外都变为$0$(做$n-2$次Ⅱ型初等变换).显然为此必须取$\lambda’_i =-\dfrac{a’_{kj}}{a’_{kp}} $.结果我们就得到了另一个新矩阵,第$k$行除第一个和第二个位置以外全为零.如下所示:

$$\begin{pmatrix} a’_{11} & 0 & \cdots & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’_{k1} & a’_{kp} & \cdots & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’_{m1} & a’_{mp} & \cdots & a’_{m2} -a’_{mp} \dfrac{a’_{22}}{a’_{kp}} & \cdots & a’_{mn} -a’_{mp} \dfrac{a’_{kn}}{a’_{kp}}\end{pmatrix} $$

同样,为方便,把上面的矩阵记为

$$\begin{pmatrix} a’’_{11} & 0 & \cdots & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’’_{k1} & a’’_{k2} & \cdots & 0 & \cdots & 0 \\ a’’_{k+1,1} & a’’_{k+1,2} & \cdots & a’’_{k+1,j} & \cdots & a’’_{k+1,n} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ a’’_{m1} & a’’_{m2} & \cdots & a’’_{mj} & \cdots & a’’_{mn} \end{pmatrix} $$

接着,从$k+1$行,第三列开始,重复上述的步骤,经过有限次的初等列交换,必能将矩阵$A$转化为阶梯形

$$\overline{A} =\begin{pmatrix} \overline{a}_{11} & 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{k1} & \overline{a}_{k2} & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{l1} & \overline{a}_{l2} & \overline{a}_{l3} & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{s1} & \overline{a}_{s2} & \overline{a}_{s3} & \cdots & \overline{a}_{sr} & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{m1} & \overline{a}_{m2} & \overline{a}_{m3} & \cdots & \overline{a}_{mr} & 0 & \cdots & 0 \end{pmatrix} $$

其中$\overline{a}_{11} \cdot \overline{a}_{k2} \cdot \overline{a}_{l3} \cdots \overline{a}_{sr} \neq 0$.

所以,矩阵$A$经初等列变换化成的阶梯形为

$$\overline{A} =\begin{pmatrix} \overline{a}_{11} & 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{k1} & \overline{a}_{k2} & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{l1} & \overline{a}_{l2} & \overline{a}_{l3} & \cdots & 0 & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{s1} & \overline{a}_{s2} & \overline{a}_{s3} & \cdots & \overline{a}_{sr} & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ \overline{a}_{m1} & \overline{a}_{m2} & \overline{a}_{m3} & \cdots & \overline{a}_{mr} & 0 & \cdots & 0 \end{pmatrix} $$

其中$\overline{a}_{11} \cdot \overline{a}_{k2} \cdot \overline{a}_{l3} \cdots \overline{a}_{sr} \neq 0$

$(2)\;$对于矩阵$\overline{A} =\begin{pmatrix} \overline{a}_{11} & \cdots & \overline{a}_{1k} & \cdots & \overline{a}_{1l} & \cdots & \overline{a}_{1s} & \cdots & \overline{a}_{1n} \\ 0 & \cdots & \overline{a}_{2k} & \cdots & \overline{a}_{2l} & \cdots & \overline{a}_{2s} & \cdots & \overline{a}_{2n} \\ 0 & \cdots & 0 & \cdots & \overline{a}_{3l} & \cdots & \overline{a}_{3s} & \cdots & \overline{a}_{3n} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & \overline{a}_{rs} & \cdots & \overline{a}_{rn} \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \end{pmatrix} $

其中$\overline{a}_{11} \cdot \overline{a}_{2k} \cdot \overline{a}_{3l} \cdots \overline{a}_{rs} \neq 0$,来说,将第$1$列分别乘以常数$\lambda _i $,分别加到第$j$列$(j=k,l,s,\cdots ,n)$上去,使得加完后第$1$行的系数除$\overline{a}_{11} $以外都变为$0$(做$n-1$次Ⅱ型初等变换).显然为此必须取$\lambda _i =-\dfrac{\overline{a}_{1j}}{\overline{a}_{11}} $.结果我们就得到了另一个新矩阵,第$1$行除第一个位置以外全为零.如下所示:

$$\begin{pmatrix} \overline{a}_{11} & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \\ 0 & \cdots & \overline{a}_{2k} & \cdots & \overline{a}_{2l} & \cdots & \overline{a}_{2s} & \cdots & \overline{a}_{2n} \\ 0 & \cdots & 0 & \cdots & \overline{a}_{3l} & \cdots & \overline{a}_{3s} & \cdots & \overline{a}_{3n} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & \overline{a}_{rs} & \cdots & \overline{a}_{rn} \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \end{pmatrix} $$

接着,考察第二行,将第$k$列分别乘以常数$\lambda’_i $,分别加到第$j$列$(j=l,s,\cdots ,n)$上去,使得加完后第$2$行的系数除$\overline{a}_{2k} $以外都变为$0$.显然为此必须取$\lambda’_i =-\dfrac{\overline{a}_{2j}}{\overline{a}_{2k}} $.结果我们就得到了另一个新矩阵,第$2$行除第$k$个位置以外全为零.如下所示:

$$\begin{pmatrix} \overline{a}_{11} & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \\ 0 & \cdots & \overline{a}_{2k} & \cdots & 0 & \cdots & 0 & \cdots & 0 \\ 0 & \cdots & 0 & \cdots & \overline{a}_{3l} & \cdots & \overline{a}_{3s} & \cdots & \overline{a}_{3n} \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & \overline{a}_{rs} & \cdots & \overline{a}_{rn} \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \end{pmatrix} $$

然后,依次考察第三行,第四行,直至第$r$行,得到矩阵

$$\begin{pmatrix} \overline{a}_{11} & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \\ 0 & \cdots & \overline{a}_{2k} & \cdots & 0 & \cdots & 0 & \cdots & 0 \\ 0 & \cdots & 0 & \cdots & \overline{a}_{3l} & \cdots & 0 & \cdots & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & \overline{a}_{rs} & \cdots & 0 \\ 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 & \cdots & 0 \end{pmatrix} $$

然后,依次把第$k,l,\cdots ,s$列与第$2,3,\cdots ,r$列交换,得到下面矩阵

$$\begin{pmatrix} \overline{a}_{11} & & & & \vdots & & & \\ & \overline{a}_{2k} & & & \vdots & & & \\ & & \ddots & & \vdots & & & \\ & & & \overline{a}_{rs} & \vdots & & & \\ \cdots & \cdots & \cdots & \cdots & \vdots & \cdots & \cdots & \cdots & \\ & & & & \vdots & 0 & & & \\ & & & & \vdots & & \ddots & & \\ & & & & \vdots & & & 0 \end{pmatrix} ,$$

$$\begin{pmatrix} \tilde{a}_{11} & & & & \vdots & & & \\ & \tilde{a}_{22} & & & \vdots & & & \\ & & \ddots & & \vdots & & & \\ & & & \tilde{a}_{rr} & \vdots & & & \\ \cdots & \cdots & \cdots & \cdots & \vdots & \cdots & \cdots & \cdots & \\ & & & & \vdots & 0 & & & \\ & & & & \vdots & & \ddots & & \\ & & & & \vdots & & & 0 \end{pmatrix} ,$$

其中

$$\tilde{a}_{11} =\overline{a}_{11} ,\tilde{a}_{22} =\overline{a}_{2k} ,\tilde{a}_{33} =\overline{a}_{3l} ,\cdots ,\tilde{a}_{rr} =\overline{a}_{rs} ;\displaystyle \prod_{i=1}^r \tilde{a}_{ii} \neq 0.$$

$3$.证明若$a_0 \neq 0$,方阵

$$\begin{pmatrix} 0 & 0 & \cdots & 0 & 0 & a_0 \\ 1 & 0 & \cdots & 0 & 0 & a_1 \\ 0 & 1 & \cdots & 0 & 0 & a_2 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & 0 & \cdots & 1 & 0 & a_{n-2} \\ 0 & 0 & \cdots & 0 & 1 & a_{n-1} \end{pmatrix} $$

的秩为$n$.

证明:方阵$\begin{pmatrix} 0 & 0 & \cdots & 0 & 0 & a_0 \\ 1 & 0 & \cdots & 0 & 0 & a_1 \\ 0 & 1 & \cdots & 0 & 0 & a_2 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & 0 & \cdots & 1 & 0 & a_{n-2} \\ 0 & 0 & \cdots & 0 & 1 & a_{n-1} \end{pmatrix} $经过有限次初等行变换化成如下形式:

$$\begin{pmatrix} 1 & 0 & \cdots & 0 & 0 & a_1 \\ 0 & 1 & \cdots & 0 & 0 & a_2 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & 0 & \cdots & 1 & 0 & a_{n-2} \\ 0 & 0 & \cdots & 0 & 1 & a_{n-1} \\ 0 & 0 & \cdots & 0 & 0 & a_0 \end{pmatrix} $$

上述矩阵经过有限次初等列变换最后化成如下形式:

$$A’=\begin{pmatrix} 1 & 0 & \cdots & 0 & 0 & 0 \\ 0 & 1 & \cdots & 0 & 0 & 0 \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \\ 0 & 0 & \cdots & 1 & 0 & 0 \\ 0 & 0 & \cdots & 0 & 1 & 0 \\ 0 & 0 & \cdots & 0 & 0 & a_0 \end{pmatrix} .$$

因此,有$r_r (A) =r_r(A’)=n$且$r_c (A) =r_c(A’)=n$,于是$r_c (A)=r_r (A)=n$,可知方阵$A$的秩为$n$.

$4$.设两个矩阵

$$A=\begin{pmatrix} \alpha _1 & \alpha _2 & \cdots & \alpha _n \\ \beta _1 & \beta _2 & \cdots & \beta _n \end{pmatrix} ,B=\begin{pmatrix} \alpha _1 & \alpha _2 & \cdots & \alpha _n \\ \beta _1 & \beta _2 & \cdots & \beta _n \\ \gamma _1 & \gamma _2 & \cdots & \gamma _n \end{pmatrix}$$

试用平面上$n$条直线所成集合的几何性质给出$A$和$B$有相等秩的条件.

解:只需要$(\gamma _1 ,\gamma _2 ,\cdots ,\gamma _n )$是$(\alpha _1 , \alpha _2 , \cdots , \alpha _n )$与$(\beta _1 ,\beta _2 , \cdots , \beta _n )$的线性组合,即有矩阵$A$和$B$有相等秩.

文章目錄
  1. 1. 方程组的回顾
  2. 2. 矩阵的秩
  3. 3. 可解性准则
  4. 4. 习题