《新理解矩阵3》:行列式的点滴
By 苏剑林 | 2012-11-04 | 41050位读者 | 引用本文的最新版本位于:http://kexue.fm/archives/2208/
亲爱的读者朋友们,科学空间版的理解矩阵已经来到了BoJone认为是最激动人心的部分了,那就是关于行列式的叙述。这部分内容没有在孟岩的文章中被谈及到,是我自己结合了一些书籍和网络资源而得出的一些看法。其中最主要的书籍是《数学桥》,而追本溯源,促进我研究这方面的内容的是matrix67的那篇《教材应该怎么写》。本文包含了相当多的直观理解内容,在我看来,这部分内容也许不是正统的观点,但是至少在某种程度上能够促进我们对线性代数的理解。
大多数线性代数引入行列式的方式都是通过讲解线性方程组的,这种方式能够让学生很快地掌握它的计算,以及给出了一个最实际的应用(就是解方程组啦)。但是这很容易让读者走进一个误区,让他们认为线性代数就是研究解方程组的。这样并不能让读者真正理解到它的本质,而只有当我们对它有了一个直观熟练的感觉,我们才能很好地运用它。
行列式的出现其实是为了判断一个矩阵是否可逆的,它通过某些方式构造出一个“相对简单”的函数来达到这个目的,这个函数就是矩阵的行列式。让我们来反思一下,矩阵可逆意味着什么呢?之前已经提到过,矩阵是从一个点到另外一个点的变换,那么逆矩阵很显然就是为了把它变换回来。我们还说过,“运动是相对的”,点的变换又可以用坐标系的变换来实现。但是,按照我们的直觉,不同的坐标系除了有那些运算上的复杂度不同(比如一般的仿射坐标系计算点积比直角坐标系复杂)之外,不应该有其他的不同了,用物理的语言说,就是一切坐标系都是平权的。那么给出一个坐标系,可以自然地变换到另外一个坐标系,也可以自然地将它变换回来。既然矩阵是这种坐标系的一个描述,那么矩阵不可逆的唯一可能性就是:
这个$n$阶矩阵的$n$个列向量根本就构不成一个$n$维空间的坐标系。
《新理解矩阵4》:相似矩阵的那些事儿
By 苏剑林 | 2012-11-11 | 54556位读者 | 引用这篇文章估计是这个系列最后一篇了,也许以后会继续谈到线性代数,但是将会独立开来讲述。本文主要讲的是相似矩阵的一些事情,本文的观点很是粗糙,自己感觉都有点模糊,因此请读者细细阅读。在孟岩的文章里头,它对矩阵及其相似有了一个非常精彩的描述:
“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。”
同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。
算子与线性常微分方程(上)
By 苏剑林 | 2012-11-30 | 41628位读者 | 引用简介
最近在学习量子力学的时候,无意中涉及到了许多矩阵(线性代数)、群论等知识,并且发现其中有不少相同的思想,其中主要是用算子来表示其对函数的作用和反作用。比如我们可以记$D=\frac{d}{dx}$,那么函数$f(x)$的导数就可以看作是算子D对它的一次作用后的结果,二阶导数则是作用了两次,等等。而反过来,$D^{-1}$就表示这个算子的反作用,它把作用后的函数(像)还原为原来的函数(原像),当然,这不是将求导算子做简单的除法,而是积分运算。用这种思想来解答线性微分方程,有着统一和简洁的美。
线性微分方程是求解一切微分方程的基础,一般来说它形式比较简单,多数情况下我们都可以求出它的通解。在非相对论性量子力学的薛定谔方程中,本质上就是在求解一道二阶偏线性微分方程。另一方面,在许多我们无法求解的非线性系统中,线性解作为一级近似,对于定性分析是极其重要的。
一阶线性常微分方程
这是以下所有微分方程求积的一个基础形式,即$\frac{dy}{dx}+g(x)y=f(x)$的求解。这是通过常数变易法来解答的,其思想跟天体力学中的“摄动法”是一致的,首先在无法求解原微分方程的时候,先忽略掉其中的一些小项,求得一个近似解。即我们先求解
$$\frac{dy}{dx}+g(x)y=0$$
薛定谔方程的启发式推导
By 苏剑林 | 2012-12-11 | 68023位读者 | 引用===聊聊天===
上个月在网上买了三本相对论教材和一本《量子力学概论》,本打算好好研究下相对论的数学体系,可是书到了之后,我却深深地被量子力学吸引住了,不停在研读。而且在研究量子力学的同时,我的线性代数和微分方程知识也增加了不少,这确实是我没有想到的。在我看来,不管是狭义相对论还是广义相对论,它本质上都是一种几何理论,你总要想象从一个参考系观测会发生什么,然后从另外一个参考系又会看到什么;而量子力学虽然对我来讲一切都是新鲜的,但是它的数学性比较强,主要是微分方程的求解和理解。我想这也是我对量子力学更感兴趣的原因吧,因为我善于代数而不善于几何。
量子力学中让我最神往的内容莫过于费曼所发明的路径积分形式。资料记载费曼用他发明的方法在一个晚上就算出了别人几个月才算出来的结果,可见路径积分形式的优越性。当然,我也清楚,这个路径积分并不简单,它涉及到了泛函积分这一非常高深的内容,对于我这个连数学分析都还没有学好的小孩来说,泛函是难以触摸的。不过,我还是尽量想办法向它靠近。为此,我还浏览到了一些不少让人兴奋的内容,比如薛定谔的方程的推导、力学-光学类比、雅可比方程等等。
很遗憾,在正统的量子力学教材中,这些让我很兴奋的内容却鲜有涉及,有的话大多数都是一笔带过的感觉。多数量子力学不会讲到路径积分,就算有也只是作为附录。对于薛定谔方程的推导,也没有涉及到。这也让我养成了一个习惯意识:书本最有趣的东西往往都是在附录。所以对于教科书,那么写得正正式式的内容我一概没有兴趣,那些附录内容才是我最喜欢读的。可是,那些让人兴奋的内容却不一定是很难的,就像下面的薛定谔方程的启发式推导,它不仅不难,而且易于理解。
===薛定谔方程===
在量子力学诞生之前,科学家已经通过实验发现光既有波动性也有粒子性,而德布罗意提出也同时具有波动性和粒子性,这些都奠定了量子力学的基础。根据量子论,一个光子的能量可以由$E=h\nu=\hbar (2\pi \nu)$,其中$\nu$是频率,$\hbar=\frac{h}{2\pi}$,h是普朗克常数,习惯记$\omega=2\pi \nu$,即$E=\hbar \omega$。
矩阵化简二次型(无穷小近似处理抛物型)
By 苏剑林 | 2012-12-25 | 24810位读者 | 引用(阅读本文最好有一定的线性代数基础,至少对线性代数里边的基本概念有所了解。)
这学期已经接近尾声了,我们的《解析几何》已经讲到化简二次曲线了。可是,对于没有线性代数的其他同学们,直接用转轴和移轴这个计算公式来变换,那计算量会让我们很崩溃的;虽然那个“不变量”方法计算上有些简单,却总让人感到很诡异,总觉得不知从何而来,而且又要记一堆公式。事实上,如果有线性代数的基础,这些东西变得相当好理解的。我追求用统一的方法求解同一种问题,即用统一的方式处理所有的二次型,当然也希望计算量简单一点。
一般的模型
一般的二次型可以写成
$$x^T A x + 2 b^T x + c=0$$
其中$x,b$都是n维列向量(各元素为$x_i$和$b_i$),A是n阶方阵(各元素为$a_{ij}$),c是常数。在这里,我们只讨论n=2和n=3的情况。化简二次型的过程,可以归结为A矩阵的简化。
我从来不想在教科书上的定义上纠结太多,因为我知道,真正对定义的理解,需要在长期的实践应用中慢慢感悟的,所以我们唯一需要做的是继续我们的研究。
但是前些天有些朋友问到我关于微分的理解,比如“dx是不是一定很小”等等,所以决定在此写写我的理解。
与微分联系很紧密的,也是我们很熟悉的东西,当然是“增量 ”啦,比如$\Delta y$、$\Delta x$等等,增量显然是可以任意大的(只要自变量还在定义域内)。那么考虑一个函数$y=f(x)$,函数的微分是怎么出现的呢?那是因为我们直接研究函数的增量是比较麻烦的,所以就引入了微分dy,当$\Delta x$很小时,它代表增量的主项:$\Delta y=dy+o(\Delta x)=A \Delta x+o(\Delta x)$,A是一个常数。
在天文爱好者眼中,黑洞是一个球体,其半径为$\frac{2GM}{c^2}$;这是广义相对论的施瓦兹黑洞的结果,也从经典力学推导推导出来,虽然用经典力学是错误的,但是对于多数的天文爱好者(包括笔者)来说,这是目前唯一的一种可行的理解方法(广义相对论那些复杂推导会让我们很崩溃的)。当然,事实上,黑洞不是一个球体,它只是一个密度很大的点。至于密度有多大,目前公认的说法是无穷大,但是严格的物理是不接受这个说法的,或者说,物理是不会接受任何无穷大的说法,所以现在积极发展量子引力理论来统一相对论和量子力学,不过这是另话了。$\frac{2GM}{c^2}$只不过是黑洞的视界,视界之内,我们就什么也不知道了。本文主要就从经典力学的角度探讨一下两个黑洞的合并过程中其视界的变化。读者将会发现,这些视界的形状相当有趣。
经典力学中的黑洞是这样定义的:天体表面的逃逸速度超过了光速,于是连光都无法逃脱,所以这个“洞”就很黑。也就是说,光子的总能量(引力势能与动能之和,经典力学意义下的)要为负,负数表示受到束缚。用数学公式来讲,就是:
$$\frac{1}{2}mc^2 - \frac{GM_1 m}{r_1}-\frac{GM_2 m}{r_2}-...-\frac{GM_n m}{r_n} \leq 0$$
最近评论