29 Oct

《新理解矩阵1》:矩阵是什么?

前边我承诺过会写一些关于自己对矩阵的理解。其实孟岩在《理解矩阵》这三篇文章中,已经用一种很直观的方法告诉了我们有关矩阵以及线性代数的一些性质和思想。而我对矩阵的理解,大多数也是来源于他的文章。当然,为了更好地理解线性代数,我还阅读了很多相关书籍,以求得到一种符合直觉的理解方式。孟岩的blog已经很久没有更新了,在此谨引用他的标题,来叙述我对矩阵的理解。

当然,我不打算追求那些空间、算子那些高抽象性的问题,我只是想发表一下自己对线性代数中一些常用工具的看法,比如说矩阵、行列式等。同时,文章命名为“理解矩阵”,也就是说这不是矩阵入门教程,而是与已经有一定的线性代数基础的读者一起探讨关于矩阵的其他理解方式,仅此而已。我估计基本上学过线性代数的读者都能够读懂这篇文章。

首先,我们不禁要追溯一个本源问题:矩阵是什么?

点击阅读全文...

31 Oct

《新理解矩阵2》:矩阵是什么?

上一篇文章中我从纯代数运算的角度来讲述了我对矩阵的一个理解,可以看到,我们赋予了矩阵相应的运算法则,它就在代数、分析等领域显示出了巨大作用。但是纯粹的代数是不足够的,要想更加完美,最好是找到相应的几何对象能够与之对应,只有这样,我们才能够直观地理解它,以达到得心应手的效果。

几何理解

我假设读者已经看过孟岩的《理解矩阵》三篇文章,所以更多的细节我就不重复了。我们知道,矩阵A

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}$$

事实上由两个向量$[a_{11},a_{21}]^T$和$[a_{12},a_{22}]^T$(这里的向量都是列向量)组成,它描述了一个平面(仿射)坐标系。换句话说,这两个向量其实是这个坐标系的两个基,而运算$y=Ax$则是告诉我们,在$A$这个坐标系下的x向量,在$I$坐标系下是怎样的。这里的$I$坐标系就是我们最常用的直角坐标系,也就是说,任何向量(包括矩阵里边的向量),只要它前面没有矩阵作用于它,那么它都是在直角坐标系下度量出来的。

点击阅读全文...

4 Nov

《新理解矩阵3》:行列式的点滴

本文的最新版本位于:http://kexue.fm/archives/2208/

亲爱的读者朋友们,科学空间版的理解矩阵已经来到了BoJone认为是最激动人心的部分了,那就是关于行列式的叙述。这部分内容没有在孟岩的文章中被谈及到,是我自己结合了一些书籍和网络资源而得出的一些看法。其中最主要的书籍是《数学桥》,而追本溯源,促进我研究这方面的内容的是matrix67的那篇《教材应该怎么写》。本文包含了相当多的直观理解内容,在我看来,这部分内容也许不是正统的观点,但是至少在某种程度上能够促进我们对线性代数的理解。

大多数线性代数引入行列式的方式都是通过讲解线性方程组的,这种方式能够让学生很快地掌握它的计算,以及给出了一个最实际的应用(就是解方程组啦)。但是这很容易让读者走进一个误区,让他们认为线性代数就是研究解方程组的。这样并不能让读者真正理解到它的本质,而只有当我们对它有了一个直观熟练的感觉,我们才能很好地运用它。

行列式的出现其实是为了判断一个矩阵是否可逆的,它通过某些方式构造出一个“相对简单”的函数来达到这个目的,这个函数就是矩阵的行列式。让我们来反思一下,矩阵可逆意味着什么呢?之前已经提到过,矩阵是从一个点到另外一个点的变换,那么逆矩阵很显然就是为了把它变换回来。我们还说过,“运动是相对的”,点的变换又可以用坐标系的变换来实现。但是,按照我们的直觉,不同的坐标系除了有那些运算上的复杂度不同(比如一般的仿射坐标系计算点积比直角坐标系复杂)之外,不应该有其他的不同了,用物理的语言说,就是一切坐标系都是平权的。那么给出一个坐标系,可以自然地变换到另外一个坐标系,也可以自然地将它变换回来。既然矩阵是这种坐标系的一个描述,那么矩阵不可逆的唯一可能性就是:

这个$n$阶矩阵的$n$个列向量根本就构不成一个$n$维空间的坐标系。

点击阅读全文...

11 Nov

《新理解矩阵4》:相似矩阵的那些事儿

这篇文章估计是这个系列最后一篇了,也许以后会继续谈到线性代数,但是将会独立开来讲述。本文主要讲的是相似矩阵的一些事情,本文的观点很是粗糙,自己感觉都有点模糊,因此请读者细细阅读。在孟岩的文章里头,它对矩阵及其相似有了一个非常精彩的描述:

“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。”

同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。

点击阅读全文...

11 Dec

薛定谔方程的启发式推导

===聊聊天===

上个月在网上买了三本相对论教材和一本《量子力学概论》,本打算好好研究下相对论的数学体系,可是书到了之后,我却深深地被量子力学吸引住了,不停在研读。而且在研究量子力学的同时,我的线性代数和微分方程知识也增加了不少,这确实是我没有想到的。在我看来,不管是狭义相对论还是广义相对论,它本质上都是一种几何理论,你总要想象从一个参考系观测会发生什么,然后从另外一个参考系又会看到什么;而量子力学虽然对我来讲一切都是新鲜的,但是它的数学性比较强,主要是微分方程的求解和理解。我想这也是我对量子力学更感兴趣的原因吧,因为我善于代数而不善于几何。

量子力学中让我最神往的内容莫过于费曼所发明的路径积分形式。资料记载费曼用他发明的方法在一个晚上就算出了别人几个月才算出来的结果,可见路径积分形式的优越性。当然,我也清楚,这个路径积分并不简单,它涉及到了泛函积分这一非常高深的内容,对于我这个连数学分析都还没有学好的小孩来说,泛函是难以触摸的。不过,我还是尽量想办法向它靠近。为此,我还浏览到了一些不少让人兴奋的内容,比如薛定谔的方程的推导、力学-光学类比、雅可比方程等等。

很遗憾,在正统的量子力学教材中,这些让我很兴奋的内容却鲜有涉及,有的话大多数都是一笔带过的感觉。多数量子力学不会讲到路径积分,就算有也只是作为附录。对于薛定谔方程的推导,也没有涉及到。这也让我养成了一个习惯意识:书本最有趣的东西往往都是在附录。所以对于教科书,那么写得正正式式的内容我一概没有兴趣,那些附录内容才是我最喜欢读的。可是,那些让人兴奋的内容却不一定是很难的,就像下面的薛定谔方程的启发式推导,它不仅不难,而且易于理解。

===薛定谔方程===

在量子力学诞生之前,科学家已经通过实验发现光既有波动性也有粒子性,而德布罗意提出也同时具有波动性和粒子性,这些都奠定了量子力学的基础。根据量子论,一个光子的能量可以由$E=h\nu=\hbar (2\pi \nu)$,其中$\nu$是频率,$\hbar=\frac{h}{2\pi}$,h是普朗克常数,习惯记$\omega=2\pi \nu$,即$E=\hbar \omega$。

点击阅读全文...

25 Dec

矩阵化简二次型(无穷小近似处理抛物型)

(阅读本文最好有一定的线性代数基础,至少对线性代数里边的基本概念有所了解。)

这学期已经接近尾声了,我们的《解析几何》已经讲到化简二次曲线了。可是,对于没有线性代数的其他同学们,直接用转轴和移轴这个计算公式来变换,那计算量会让我们很崩溃的;虽然那个“不变量”方法计算上有些简单,却总让人感到很诡异,总觉得不知从何而来,而且又要记一堆公式。事实上,如果有线性代数的基础,这些东西变得相当好理解的。我追求用统一的方法求解同一种问题,即用统一的方式处理所有的二次型,当然也希望计算量简单一点。

一般的模型

一般的二次型可以写成
$$x^T A x + 2 b^T x + c=0$$

其中$x,b$都是n维列向量(各元素为$x_i$和$b_i$),A是n阶方阵(各元素为$a_{ij}$),c是常数。在这里,我们只讨论n=2和n=3的情况。化简二次型的过程,可以归结为A矩阵的简化。

点击阅读全文...

18 Dec

黑洞融合的简单模拟

在天文爱好者眼中,黑洞是一个球体,其半径为$\frac{2GM}{c^2}$;这是广义相对论的施瓦兹黑洞的结果,也从经典力学推导推导出来,虽然用经典力学是错误的,但是对于多数的天文爱好者(包括笔者)来说,这是目前唯一的一种可行的理解方法(广义相对论那些复杂推导会让我们很崩溃的)。当然,事实上,黑洞不是一个球体,它只是一个密度很大的点。至于密度有多大,目前公认的说法是无穷大,但是严格的物理是不接受这个说法的,或者说,物理是不会接受任何无穷大的说法,所以现在积极发展量子引力理论来统一相对论和量子力学,不过这是另话了。$\frac{2GM}{c^2}$只不过是黑洞的视界,视界之内,我们就什么也不知道了。本文主要就从经典力学的角度探讨一下两个黑洞的合并过程中其视界的变化。读者将会发现,这些视界的形状相当有趣。

经典力学中的黑洞是这样定义的:天体表面的逃逸速度超过了光速,于是连光都无法逃脱,所以这个“洞”就很黑。也就是说,光子的总能量(引力势能与动能之和,经典力学意义下的)要为负,负数表示受到束缚。用数学公式来讲,就是:

$$\frac{1}{2}mc^2 - \frac{GM_1 m}{r_1}-\frac{GM_2 m}{r_2}-...-\frac{GM_n m}{r_n} \leq 0$$

点击阅读全文...

2 Jan

用复数化简二次曲线的尝试

当二次型在二维平面的情况下时,就等价于二次曲线的化简。二次曲线的化简主要用到平移和旋转,这恰好是复数所“擅长”的。因此,以复数为工具来对二次曲线进行化简,似乎是一种很显然的思路。然而,我却没有看到这方面的内容,而且我自己之前也忽略了这一思路。下面我对这个思路进行一点探索。

由于只打算做一些启发性引导,所以在这里只考虑$ Ax^2+2Bxy+Cy^2=1$这种不完全的形式(它不包含抛物线)。

点击阅读全文...