构造一个显式的、总是可逆的矩阵
By 苏剑林 | 2019-03-01 | 43233位读者 | 引用从《恒等式 det(exp(A)) = exp(Tr(A)) 赏析》一文我们得到矩阵$\exp(\boldsymbol{A})$总是可逆的,它的逆就是$\exp(-\boldsymbol{A})$。问题是$\exp(\boldsymbol{A})$只是一个理论定义,单纯这样写没有什么价值,因为它要把每个$\boldsymbol{A}^n$都算出来。
有没有什么具体的例子呢?有,本文来构造一个显式的、总是可逆的矩阵。
其实思路非常简单,假设$\boldsymbol{x},\boldsymbol{y}$是两个$k$维列向量,那么$\boldsymbol{x}\boldsymbol{y}^{\top}$就是一个$k\times k$的矩阵,我们就来考虑
\begin{equation}\begin{aligned}\exp\left(\boldsymbol{x}\boldsymbol{y}^{\top}\right)=&\sum_{n=0}^{\infty}\frac{\left(\boldsymbol{x}\boldsymbol{y}^{\top}\right)^n}{n!}\\
=&\boldsymbol{I}+\boldsymbol{x}\boldsymbol{y}^{\top}+\frac{\boldsymbol{x}\boldsymbol{y}^{\top}\boldsymbol{x}\boldsymbol{y}^{\top}}{2}+\frac{\boldsymbol{x}\boldsymbol{y}^{\top}\boldsymbol{x}\boldsymbol{y}^{\top}\boldsymbol{x}\boldsymbol{y}^{\top}}{6}+\dots\end{aligned}\end{equation}
恒等式 det(exp(A)) = exp(Tr(A)) 赏析
By 苏剑林 | 2019-02-18 | 67482位读者 | 引用本文的主题是一个有趣的矩阵行列式的恒等式
\begin{equation}\det(\exp(\boldsymbol{A})) = \exp(\text{Tr}(\boldsymbol{A}))\label{eq:main}\end{equation}
这个恒等式在挺多数学和物理的计算中都出现过,笔者都在不同的文献中看到过好几次了。
注意左端是矩阵的指数,然后求行列式,这两步都是计算量非常大的运算;右端仅仅是矩阵的迹(一个标量),然后再做标量的指数。两边的计算量差了不知道多少倍,然而它们居然是相等的!这不得不说是一个神奇的事实。
所以,本文就来好好欣赏一个这个恒等式。
几年前,笔者曾经以自己对矩阵的粗浅理解写了一个“理解矩阵”系列,其中有一篇《为什么只有方阵有行列式?》讨论了非方阵的行列式问题,里边给出了“非方针的行列式不好看”和“方阵的行列式就够了”的观点。本文来再次思考这个问题。
首先回顾方阵的行列式,其实行列式最重要的价值在于它的几何意义:
n维方阵的行列式的绝对值,等于它的各个行(或列)向量所张成的n维立体的超体积。
这个几何意义是行列式的一切重要性的源头,相关的讨论可以参考《行列式的点滴》,它也是我们讨论非方阵行列式的基础。
分析
对于方阵$\boldsymbol{A}_{n\times n}$来说,可以将它看成$n$个行向量的组合,也可以看成$n$个列向量的组合,不管是哪一种,行列式的绝对值都等于这$n$个向量所张成的$n$维立体的超体积。换句话说,对于方阵来说,行、列向量的区分不改变行列式。
对于非方阵$\boldsymbol{B}_{n \times k}$就不一样了,不失一般性,假设$n > k$。我们可以将它看成$n$个$k$维行向量的组合,也可以看成$k$个$n$维列向量的组合。非方针的行列式,应该也具有同样含义,即它们所张成的立体的超体积。
我们来看第一种情况,如果看成$n$个$k$维行向量,那么就得视为这$n$个向量张成的$n$维体的超体积了,但是要注意$n > k$,因此这$n$个向量必然线性相关,因此它们根本就张不成一个$n$维体,也许是一个$n-1$维体甚至更低,这样一来,它的$n$维体的超体积自然为0。
但是第二种情况就没有那么平凡了。如果看成$k$个$n$维列向量,那么这$k$个向量虽然是$n$维的,但它们张成的是一个$k$维体,这$k$维体的超体积未必为0。我们就以这个非平凡的体积作为非方阵行列式的定义好了。
《新理解矩阵6》:为什么只有方阵有行列式?
By 苏剑林 | 2014-07-15 | 69679位读者 | 引用学过线性代数的朋友都知道,方阵和非方阵的一个明显不同是,对于方阵我们可以计算它的行列式,如果不是方阵的话,就没有行列式这个概念了。在追求统一和谐的数学系统中,为什么非方阵却没有行列式?也许对于这个问题最恰当的回答是——因为不够美。对于非方阵,其实也可以类似地定义它的行列式,定义出来的东西,跟方阵的行列式具有同样的性质,比如某行乘上一个常数,行列式值也就乘以一个常数,等等;而且还可以把其几何意义保留下来。但是,非方阵的行列式是不够美的,因为对于一个一般的整数元素的方阵,我们的行列式是一个整数;而对于一个一般的整数元素的非方阵,却导致了一个无理数的行列式值。另外,一个也比较重要的原因是,单单是方阵的行列式也够用了。综合以上两个理由,非方阵的行列式就被舍弃不用了。
非方阵的行列式不够漂亮
$n$阶方阵的行列式是每个向量的线性函数,它代表着向量之间的线性相关性;从几何上来讲,它就是向量组成的平行n维体的(有向)体积。我们当然期望非方阵的行列式也保留这些性质,因为只有这样,方阵行列式的那些运算性质才得以保留,比如上面说的,行列式的一行乘上一个常数,行列式值也乘上一个常数。我们考虑$m\times n$的矩阵,其中$ m < n $,我们将它看成是$m$个$n$维向量的组合。最简单的,我们先考虑$1\times 2$矩阵的行列式,也就是二维向量$(a,b)$的行列式。
在讨论曲线坐标系的积分时,通常都会出现行列式这个东西,作为“体积元”的因子。在广义相对论中,爱因斯坦场方程的作用量就带有度规的行列式,而在对其进行变分时,自然也就涉及到了行列式的求导问题。我参考了朗道的《场论》以及《数理物理基础--物理需用线性高等数学导引》,了解到相关结果,遂记录如下。
推导
设
\begin{equation}\boldsymbol{A}(t)=\left(a_{ij}(t)\right)_{n\times n}\end{equation}
是一个n阶矩阵,其中每个矩阵元素都是t的函数。其行列式为$|\boldsymbol{A}|$,自然地,考虑
\begin{equation}\frac{d}{dt}|\boldsymbol{A}|\end{equation}
高维空间的叉积及其几何意义
By 苏剑林 | 2013-12-26 | 59128位读者 | 引用向量之间的运算有点积和叉积(Cross Product,向量积、外积),其中点积是比较简单的,而且很容易推广到高维;但是叉积不同,一般来说它只不过是三维空间中的东西。叉积的难以推广在于它的多重含义性,如果将向量及其叉积放到张量里边来看(这属于微分形式的内容),那么三维以上的向量叉积是不存在的;但是如果只是把叉积看成是“由两个向量生成第三个与其正交的向量”的工具的话,那么叉积也是可以高维推广的,而且推广的技巧非常巧妙,与三维空间的叉积也非常相似。
回顾三维空间
为了推广三维空间的叉积,首先回顾三维空间的叉积来源是有益的。叉积起源于四元数乘法,但是从目的性来讲,我们希望构造一个向量$\boldsymbol{w}=(w_1,w_2,w_3)$,使得它与已知的两个不共线的向量$\boldsymbol{u}=(u_1,u_2,u_3),\boldsymbol{v}=(v_1,v_2,v_3)$垂直(正交)。从普适性的角度来讲,我们还希望构造出来的向量没有任何“奇点”,为此,我们只用乘法构造。至于叉积的几何意义,则是后话,毕竟,先达到基本的目的再说。
阿达马不等式
设有$n$阶实矩阵$\boldsymbol{A}=(a_{ij})_{n\times n}$,那么它的行列式满足阿达马(Hadamard)不等式
$$\begin{equation}
\left(\det \boldsymbol{A}\right)^2 \leq \prod\limits_{i=1}^{n}\left(a_{1i}^2+a_{2i}^2+\dots+a_{ni}^2\right)
\end{equation}$$
这是阿达马在1893年首先发表的。根据体积就是行列式的说法,上述不等式具有相当明显的几何意义。当$n=2$时,它就是说平行四边形的面积不大于两边长的乘积;当$n=3$时,它就是说平行六面体的体积不大于三条棱长的乘积;高维可以类比。这些结论在几何中几乎都是“显然成立”的东西。因此很难理解为什么这个不等式在1893年才被发现。当然,代数不会接受如此笼统的说法,它需要严格的证明。
《新理解矩阵5》:体积=行列式
By 苏剑林 | 2013-12-25 | 48779位读者 | 引用在文章《新理解矩阵3》:行列式的点滴中,笔者首次谈及到了行列式的几何意义,它代表了n维的“平行多面体”的“体积”。然而,这篇文章写于我初学矩阵之时,有些论述并不严谨,甚至有些错误。最近笔者在写期末论文的时候,研究了超复数的相关内容,而行列式的几何意义在我的超复数研究中具有重要作用,因此把行列式的几何意义重新研究了一翻,修正了部分错误,故发此文,与大家分享。
一个$n$阶矩阵$A$可以看成是$n$个$n$维列向量$\boldsymbol{x}_1,\boldsymbol{x}_2,...,\boldsymbol{x}_n$的集合
$$A=(\boldsymbol{x}_1,\boldsymbol{x}_2,\dots,\boldsymbol{x}_n)$$
从代数的角度来看,这构成了一个矩阵;从几何的角度来看,这$n$个向量可以建立一个平行$n$维体。比如:平行四边形就是“平行二维体”,平行六面体就是“平行三维体”,高阶的只需要相应类比,不需要真正想象出高维空间的立体是什么样。
最近评论