1 May

无固定点的单摆运动

我们经常听说牛顿力学、相对论力学、量子力学等物理名词,也不时会听到“理论力学”。其实,“理论力学”这个名词是不大妥当的,因为这很容易会让人误认为这是一种新的力学体系。而事实上,理论力学并不是像牛顿力学那样是一种力学体系,而是一种研究力学的方法,而研究的对象在多数情况下依然是经典力学(翻开任意一本《理论力学》教程都不难发现这一点)。简单来讲,它把牛顿时代用微积分来研究力学的方法转变为了“变分”,变“常微分”为“偏微分”。看上去这有点“化简为繁”,但事实上这样的一个转变却带来了力学研究的一个巨大的飞跃。

说到这里,也许有的读者会感到害怕了:这里边肯定又涉及了各种高深莫测的高等数学方法,我们只能望而却步。的确,理论力学中的方法很是深奥,纵使是一个优秀的大学数理本科生,也可能要花上一年多时间才能学完一本《理论力学》。可是,通过最小作用量原理的方法去研究物理又显得如此地诱人。难道像我们这些初级人士就无法亲身体验理论力学方法给我们带来的巨大便利和不一样的体验了吗?

点击阅读全文...

20 Jul

“未解之谜”:为何不讲中点矩形法则?

前言

在之前的一些文章中,我们已经指出过现行教材的一些毛病。比如主次不当(最明显的是那些一上来就讲线性方程组的线性代数教程)、缺乏直观性、缺少引导性等,我想其中最主要的原因可能是过于随大流了,别人怎么编我们也跟着怎么编,缺乏自己的观点和逻辑,因此导致一些常见的毛病就一直流传了下来。也许正因如此,就导致了有那么一种奇怪的现象——明明有一种计算量少的、精确度高一些的方法,教科书几乎从未提及;另外一种计算量稍大、精确度稍低的方法,但每一本同类教科书都讲述了它。不能不说这是一个“未解之谜”......

本文要讲的就是这样的两种方法,它们分别是用来求定积分近似值的“中点矩形法则”和“梯形法则”。对于后者我想绝大多数学习过微积分的朋友都会有印象,它就是那个几乎出现在了所有微积分教材的方法;而前者我相信不少读者都未曾听闻,但让人意外的是,它的计算量稍低,精确度却稍高。本文就简单介绍这两种方法,并且比较它们的精度。而本文的独特之处在于,证明过程沿用了《复分析:可视化方法》的思路,使用几何方法漂亮地估计误差!

我们的目标是在难以精确计算的情况下,通过一定的方法求出$\int_a^b f(x)dx$的近似值,这些方法基本上都是利用了积分即面积的思想。

两种不同的方法

点击阅读全文...

4 Nov

《新理解矩阵3》:行列式的点滴

本文的最新版本位于:http://kexue.fm/archives/2208/

亲爱的读者朋友们,科学空间版的理解矩阵已经来到了BoJone认为是最激动人心的部分了,那就是关于行列式的叙述。这部分内容没有在孟岩的文章中被谈及到,是我自己结合了一些书籍和网络资源而得出的一些看法。其中最主要的书籍是《数学桥》,而追本溯源,促进我研究这方面的内容的是matrix67的那篇《教材应该怎么写》。本文包含了相当多的直观理解内容,在我看来,这部分内容也许不是正统的观点,但是至少在某种程度上能够促进我们对线性代数的理解。

大多数线性代数引入行列式的方式都是通过讲解线性方程组的,这种方式能够让学生很快地掌握它的计算,以及给出了一个最实际的应用(就是解方程组啦)。但是这很容易让读者走进一个误区,让他们认为线性代数就是研究解方程组的。这样并不能让读者真正理解到它的本质,而只有当我们对它有了一个直观熟练的感觉,我们才能很好地运用它。

行列式的出现其实是为了判断一个矩阵是否可逆的,它通过某些方式构造出一个“相对简单”的函数来达到这个目的,这个函数就是矩阵的行列式。让我们来反思一下,矩阵可逆意味着什么呢?之前已经提到过,矩阵是从一个点到另外一个点的变换,那么逆矩阵很显然就是为了把它变换回来。我们还说过,“运动是相对的”,点的变换又可以用坐标系的变换来实现。但是,按照我们的直觉,不同的坐标系除了有那些运算上的复杂度不同(比如一般的仿射坐标系计算点积比直角坐标系复杂)之外,不应该有其他的不同了,用物理的语言说,就是一切坐标系都是平权的。那么给出一个坐标系,可以自然地变换到另外一个坐标系,也可以自然地将它变换回来。既然矩阵是这种坐标系的一个描述,那么矩阵不可逆的唯一可能性就是:

这个$n$阶矩阵的$n$个列向量根本就构不成一个$n$维空间的坐标系。

点击阅读全文...

2 Feb

网友:椭圆定长弦中点轨迹的一种解法

大概在半年前,我曾用“化圆法”解决了椭圆内定长弦中点轨迹问题,求出了轨迹方程。前几天,我收到了网名为“理想”的网友的Email,他提出了自己对这个问题的解法,并得到了形式不同的轨迹方程,因此对两者的等价性表示疑惑。经过检验,我跟他的轨迹方程基本上是等价的,不过,他求出的轨迹方程总包括了原点,这是一点不足之处。但是看起来,他的轨迹方程却感觉好看一些。这的确很让人意外,因为从他的化简过程来看,有种“化简为繁”的味道,却得出了相当简洁的答案,着实有趣。

经过网友的同意,将他的过程贴在这里与大家分享!后面附有pdf文档,欢迎下载阅读。希望在科学空间可以看到更多的读者留下的痕迹。

椭圆定长弦中点轨迹的一种解法

作者:理想

本文介绍了一种计算椭圆定长弦中点轨迹的方法。设椭圆长、短轴分别为$2a$、$2b$,弦长为$2r$,随着弦的两端在椭圆上滑动,弦的中点形成的轨迹为:
$$(\frac{x^2}{a^2} + \frac{y^2}{b^2} - 1)(\frac{x^2}{a^4} + \frac{y^2}{b^4} + \frac{r^2}{a^2b^2}) + \frac{r^2}{a^2b^2} = 0$$
它不是一个椭圆,而是一个高次曲线。

点击阅读全文...

16 Feb

带点电荷的均匀杆

在讨论了倒立单摆的相关分析之后,胡雄大哥(笔者的一位好友)提出了一个问题:一根均匀杆,当然质量不可忽略,只有一个力(简单起见,可以先假设为恒力)作用在其中一个点上(简单起见,可以假设为端点),那么杆是怎么运动的?

其实笔者学了不少的经典力学,也分析了不少问题,但就是对于力矩、角动量等还是模模糊糊的,对于我来说,大多数经典力学问题就是“作用量+变分”,本题也不例外。为了让题目的实验意义更加明确,不妨将题目改成:

一根中性的均匀杆,它的一个端点带有一个点电荷,那么它(仅仅)在一个均匀电场中的运动是怎样的?

在这里,我们进一步简化,只考虑平面问题。杆属于刚体,为了描述杆的运动,我们需要描述杆上一点的运动,以及杆绕这一点的转动,也就是说,即使只考虑平面的情况,该系统也是有三个自由度的。设杆的带电荷那一端点的坐标为$(x,y)$,为了描述杆的转动,以这一端点为中心建立极坐标系,设杆的极角为$\theta$。设电势的函数为$U(x,y)$,因为只有一点带电(受力),因此势能是简单的。

点击阅读全文...

24 Oct

从费马大定理谈起(十一):有理点与切割线法

圆上的有理点

圆上的有理点

我们在这个系列的文章之中,探索了一些有关环和域的基本知识,并用整环以及唯一分解性定理证明了费马大定理在n=3和n=4时的情形。使用高斯整数环或者艾森斯坦整数环的相关知识,相对而言是属于近代的比较“高端”的代数内容(高斯生于1777年,艾森斯坦生于1823年,然而艾森斯坦英年早逝,只活到了1852年,高斯还活到了1855年。)。如果“顺利”的话,我们可以用这些“高端”的工具证明解的不存在性,或者求出通解(如果有解的话)。

然而,对于初等数论来讲,复数环和域的知识的门槛还是有点高了。其次,环和域是一个比较“强”的工具。这里的“强”有点“强势”的意味,是指这样的意思:如果它成功的话,它能够“一举破城”,把通解都求出来(或者证明解的不存在);如果它不成功的话,那么往往就连一点非平凡的解都求不出来。可是,有些问题是求出一部分解都已经很困难了,更不用说求出通解了(我们以后在研究$x^4+y^4 = z^4 + w^4 $的整数解的时候,就能深刻体会这点。)。因此,对于这些问题,单纯用环域的思想,很难给予我们(至少一部分)解。(当然,问题是如何才算是“单纯”,这也很难界定。这里的评论是比较粗糙的。)

点击阅读全文...

16 Apr

采样定理:有限个点构建出整个函数

假设我们在听一首歌,那么听完这首歌之后,我们实际上在做这样的一个过程:耳朵接受了一段时间内的声波刺激,从而引起了大脑活动的变化。而这首歌,也就是这段时间内的声波,可以用时间$t$的函数$f(t)$描述,这个函数的区间是有限的,比如$t\in[0,T]$。接着假设另外一个场景——我们要用电脑录下我们唱的歌。这又是怎样一个过程呢?要注意电脑的信号是离散化的,而声波是连续的,因此,电脑要把歌曲记录下来,只能对信号进行采样记录。原则上来说,采集的点越多,就能够越逼真地还原我们的歌声。可是有一个问题,采集多少点才足够呢?在信息论中,一个著名的“采样定理”(又称香农采样定理,奈奎斯特采样定理)告诉我们:只需要采集有限个样本点,就能够完整地还原我们的输入信号来!

采集有限个点就能够还原一个连续的函数?这是怎么做到的?下面我们来解释这个定理。

任意给定一个函数,一般来说我们都可以将它做傅里叶变换:
$$F(\omega)=\int_{-\infty}^{+\infty} f(t)e^{i\omega t}dt\tag{1}$$
虽然我们的积分限写了正负无穷,但是由于$f(t)$是有限区间内的函数,所以上述积分区间实际上是有限的。

点击阅读全文...

28 Mar

变分自编码器(二):从贝叶斯观点出发

源起

前几天写了博文《变分自编码器(一):原来是这么一回事》,从一种比较通俗的观点来理解变分自编码器(VAE),在那篇文章的视角中,VAE跟普通的自编码器差别不大,无非是多加了噪声并对噪声做了约束。然而,当初我想要弄懂VAE的初衷,是想看看究竟贝叶斯学派的概率图模型究竟是如何与深度学习结合来发挥作用的,如果仅仅是得到一个通俗的理解,那显然是不够的。

所以我对VAE继续思考了几天,试图用更一般的、概率化的语言来把VAE说清楚。事实上,这种思考也能回答通俗理解中无法解答的问题,比如重构损失用MSE好还是交叉熵好、重构损失和KL损失应该怎么平衡,等等。

建议在阅读《变分自编码器(一):原来是这么一回事》后对本文进行阅读,本文在内容上尽量不与前文重复。

准备

在进入对VAE的描述之前,我觉得有必要把一些概念性的内容讲一下。

点击阅读全文...