简介

最近在学习量子力学的时候,无意中涉及到了许多矩阵(线性代数)、群论等知识,并且发现其中有不少相同的思想,其中主要是用算子来表示其对函数的作用和反作用。比如我们可以记$D=\frac{d}{dx}$,那么函数$f(x)$的导数就可以看作是算子D对它的一次作用后的结果,二阶导数则是作用了两次,等等。而反过来,$D^{-1}$就表示这个算子的反作用,它把作用后的函数(像)还原为原来的函数(原像),当然,这不是将求导算子做简单的除法,而是积分运算。用这种思想来解答线性微分方程,有着统一和简洁的美。

线性微分方程是求解一切微分方程的基础,一般来说它形式比较简单,多数情况下我们都可以求出它的通解。在非相对论性量子力学的薛定谔方程中,本质上就是在求解一道二阶偏线性微分方程。另一方面,在许多我们无法求解的非线性系统中,线性解作为一级近似,对于定性分析是极其重要的。

一阶线性常微分方程

这是以下所有微分方程求积的一个基础形式,即$\frac{dy}{dx}+g(x)y=f(x)$的求解。这是通过常数变易法来解答的,其思想跟天体力学中的“摄动法”是一致的,首先在无法求解原微分方程的时候,先忽略掉其中的一些小项,求得一个近似解。即我们先求解
$$\frac{dy}{dx}+g(x)y=0$$

直接积分就可以得到$y=C exp(-\int g(x)dx)$,C是一个常数。现在要考虑原方程的解,那么我们期待原解的形式也是

$$y=C \exp(-\int g(x)dx)$$

但是这里的C是一个函数,代进$\frac{dy}{dx}+g(x)y=f(x)$,得到

$$\frac{dC}{dx} \exp(-\int g(x)dx)=f(x)$$

这也是能够解答的,得到

$C=\int f(x) exp(\int g(x)dx)dx$,那么原方程的通解是

$$y=[\int f(x) \exp(\int g(x)dx)dx]\exp(-\int g(x)dx)\tag{1}$$
特别地,当$g(x)=\alpha=Const.$时,可以很快得出

$$y=[\int f(x) e^{\alpha x}dx]e^{-\alpha x}\tag{2}$$
线性算子

算子D定义为$D=\frac{d}{dx}$,即对一元函数求导,而n阶导数则记为$D^n=\frac{d^n}{dx^n}$,即算子D叠加作用同一个函数,同时记$D^0=1$,即恒等变换。某一个已知的函数甚至一个常数都可以当作一个算子,它作用于某个函数,等价于与这个函数进行普通乘法。可以证明,所有的求导算子$D^n$及反导数(积分)算子$D^{-n}$和所有的非零可微函数构成了一个算子群,这个群是非Abel群。

上述术语大概专业了点,可以这样理解:在微分方程中,只有所求的函数才是真实的物体,其他运算(包括四则运算、求导等)都是对函数的一个作用,我们求解微分方程,就是通过这些作用和反作用,把函数变回最初的像。这和线性代数的思想是类似的,或者说,这篇文章介绍的内容,本身也可以归结为线性代数范畴。至于非Abel群的意思是一般这些作用的复合不符合交换律,这会在以下的例子中谈到

这样,上述的常微分方程可以表示为
$$[D+g(x)]y=f(x)$$

这样的意思是,y经过算子$[D+g(x)]$的作用后变成了$f(x)$,而算子$[D+g(x)]$是由两个基本算子相加而成的(注意不是叠加,叠加表示乘法)。现在我们要求出y来,即作用前的函数,只需要对f(x)进行反作用。即
$$y=[D+g(x)]^{-1} f(x)$$

根据(1),易得
$$[D+g(x)]^{-1} f(x)=[\int f(x) \exp(\int g(x)dx)dx]\exp(-\int g(x)dx)\tag{3}$$
对于常系数的$(D+\alpha)y=f(x)$,有
$$y=(D+\alpha)^{-1} f(x)=[\int f(x) e^{\alpha x}dx]e^{-\alpha x}\tag{4}$$
不过,虽然一般的函数乘法与求导算子是不满足交换律的,但是求导算子和常数却是可以交换的,这一点将在下面求解常系数线性微分方程起到本质上的重要作用。

常系数线性微分方程

下面将要研究一般的线性常微分方程
$$(D^n+a_1 D^{n-1}+a_2 D^{n-2}+...+a_n)y=f(x)\tag{5}$$
在一般的微分方程理论中,f(x)=0和f(x)≠0是分不同的情况讨论的,而且特征方程出现重根时又有不同的形式。但是我们从下面的研究可以知道,它们可以用同样的方法处理(或者说,它们可以写成统一的形式)。首先我们求解特征方程

$$x^n+a_1 x^{n-1}+a_2 x^{n-2}+...+a_n=0$$

的n个根$r_1,r_2,...,r_n$(重根重复计算),然后(5)可以改写成

$$(D-r_1 )(D-r_2 )...(D-r_n)y=f(x)\tag{6}$$
这样的形式就好看多了。要知道这只不过是n个算子叠加作用与一个函数而已,而每个算子的反作用我们已经知道了,那就是(4)的形式,这样一来,我们“如法炮制”,将这n个算子的反作用叠加作用于$f(x)$,就可以得到原函数了。也就是说

$$y=(D-r_n)^{-1}...(D-r_2)^{-1} (D-r_1)^{-1} f(x) \tag{7}$$
根据(4)式可以整理得到:

$$y=e^{r_n x}\int {...e^{r_2 x}\int[ e^{-r_2 x}\cdot e^{r_1 x} \int f(x)e^{-r_1 x}dx]dx}dx\tag{8}$$
可简写为

$$y=e^{r_n x}\int...\int e^{(r_2-r_3 )x}\int e^{(r_1-r_2 )x}\int f(x)e^{-r_1 x} dx^n\tag{9}$$
(9)式就是常系数微分方程的通解,在这种形式之下,几乎所有的情况都得到了统一,同时用这种形式来求解的实用性也是很好的,并不只是具有理论分析的作用。比如f(x)=0时,(9)式可以直接积分出来变为(特征根全不相同时)

$$y=C_1 e^{r_1 x}+C_2 e^{r_2 x}+...+C_n e^{r_n x} \tag{10}$$
当出现重根时,不失一般性,设$r_{n-1}=r_n$,则$e^{(r_{n-1}-r_n)x}=1$,则易得

$$y=C_1 e^{r_1 x}+C_2 e^{r_2 x}+...+(C_{n-1}x+C_n) e^{r_n x}\tag{11}$$
在最后一步积分的时候出现了$C_{n-1} x+C_n$这一项。更一般的重根情况可以类比,这里不再赘述。要说明的是,应对重根情况的求积过程未必更加简单,但是确实有效的,而且做到了统一。

很自然会想到把这种方法延伸到变系数微分方程的求解,可是这会遇到这种方法的一个致命的缺点,它和上面起到的非Abel性有关,这将在下一节描述。

转载到请包括本文地址:https://spaces.ac.cn/archives/1791

更详细的转载事宜请参考:《科学空间FAQ》

如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。

如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!

如果您需要引用本文,请参考:

苏剑林. (Nov. 30, 2012). 《算子与线性常微分方程(上) 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/1791

@online{kexuefm-1791,
        title={算子与线性常微分方程(上)},
        author={苏剑林},
        year={2012},
        month={Nov},
        url={\url{https://spaces.ac.cn/archives/1791}},
}