30 Jul

变分法的一个技巧及其“误用”

By 苏剑林 | 2013-07-30 | 40858位读者 |

不可否认，变分法是非常有用而绝妙的一个数学工具，它“自动地”为我们在众多函数中选出了最优的一个，而免除了具体的分析过程。物理中的最小作用量原理则让变分法有了巨大的用武之地，并反过来也推动了变分法的发展。但是变分法的一个很明显的特点就是在大多数情况下计算相当复杂，甚至如果“蛮干”的话我们几乎连微分方程组都列不出来。因此，一些有用的技巧是很受欢迎的。本文就打算介绍这样的一个小技巧，来让某些变分问题得到一定的化简。

我是怎么得到这个技巧的呢？事实上，那是几个月前我在阅读《引力与时空》时，读到变分原理那一块时我怎么也读不懂，想不明白。明明我觉得是错误的东西，为什么可以得到正确的结果？我的数学直觉告诉我绝对是作者的错，可是我又想不出作者哪里错了，所以就一直把这个问题搁置着。最近我终于得到了自己比较满意的答案，并且窃认为是本文所要讲的这个技巧却被物理学家“误用”了。

技巧

首先来看通常我们是怎么处理变分问题的，以一元函数为例，对于求
$S=\int L(x,\dot{x},t)dt$

的极值曲线，我们通常是直接将其代入欧拉-拉格朗日方程：
$\frac{\partial L}{\partial x}-\frac{d}{dt}(\frac{\partial L}{\partial \dot{x}})=0$

这总是会奏效的，但是通常都不会简单。我们来看一个特例，即很多变分问题的被积函数都是根号的形式的，如狭义相对论的作用量是 $S=-\int mc\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$ ，短程线问题的弧长是 $l=\int\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$ 等等，这一类问题如果直接把其中一个变量作为自变量，其他变量作为函数，代入欧拉-拉格朗日方程，就会得到非常复杂的结果，变量之间“纠缠”在一起，以至于甚至我们连微分方程都列不出来。

可是我们仔细注意就会发现，复杂性的来源是根号，而根号里边的表达式通常并不是非常复杂，要是有个方法让我们将其平方一下就好了。这确实是可以实现的，但是要找到它，却不能从欧拉-拉格朗日方程出发，要从变分法最根本的运算出发。

$\begin{aligned}\delta S &=\delta \int Ldt \\&=\int \delta(Ldt)\\&=\int \delta\sqrt{(Ldt)^2}\\&=\int \frac{\delta (L^2 dt^2)}{2\sqrt{(Ldt)^2}}\end{aligned}$

设 $ds=\sqrt{(Ldt)^2}=Ldt$ ，就变成了
$\int \frac{\delta (L^2 dt^2)}{2ds}=\int \frac{\delta (L^2 dt^2)}{2ds^2}ds$

此时，如果我们在变分过程（要注意，是仅仅在变分过程中）中，将ds看成与x,y无关的、纯粹的参数，那么我们可以改写为
$\int \frac{1}{2}\delta [L^2 (\frac{dt}{ds})^2]ds$

这样子也就是说，如果以 $ds=Ldt$ 作为参量，那么 $S=\int Ldt$ 的变分与 $S=\int \frac{1}{2} [L^2 (\frac{dt}{ds})^2]ds$ 的变分所给出的结果（微分方程组）是等效的。这样一来，我们只需要将 $L'=\frac{1}{2} L^2 (\frac{dt}{ds})^2$ 代入到欧拉-拉格朗日方程中即可，通常来说这会比直接代入L简单一些。

比如，在考虑短程线时，我们要变分 $l=\int\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$ ，设 $ds=\sqrt{g_{\mu\nu}dx^{\mu}dx^{\nu}}$ ，那么
$l=\int g_{\mu\nu}\frac{dx^{\mu}}{ds}\frac{dx^{\nu}}{ds}ds$

记 $L'=\frac{1}{2} g_{\mu\nu}\frac{dx^{\mu}}{ds}\frac{dx^{\nu}}{ds}$ ，代入欧拉-拉格朗日方程就得到：
$\frac{d}{ds}(g_{\mu\nu}\frac{dx^{\nu}}{ds})=\frac{\partial g_{\alpha\beta}}{\partial x^{\nu}}(\frac{dx^{\alpha}}{ds})(\frac{dx^{\beta}}{ds})$

误用

然而，这种技巧有可能会被误用。狭义相对论中的自由粒子作用量是 $S=-\int mc\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$ ，根据上面的结论，它和 $S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds$ 的效果是等价的，其中 $ds=\sqrt{c^2 dt^2-dx^2-dy^2-dz^2}$ 。这在没有考虑相互作用时是正确的，但是如果加入了势能项的作用量时，我们很容易也产生这样的错觉：同样把自由粒子项换成是 $S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds$ ，但这将会导致错误的结果。因为我们所说的技巧，是将整个拉格朗日函数平方，而不是部分平方。

比如我们之前考虑过的
$S= -mc^2 \int \sqrt{1-\frac{v^2}{c^2}}dt-\alpha \phi \sqrt{1-\frac{v^2}{c^2}}dt$

不可以简单地将作用量变换成：
$S=-\int \frac{1}{2}mc[c^2 (\frac{dt}{ds})^2-(\frac{dx}{ds})^2-(\frac{dy}{ds})^2-(\frac{dz}{ds})^2]ds-\frac{\alpha}{c} \phi ds$

这将会给出错误的结果。事实上这也不存在任何简单的方法，最好的方法就是直接将其变分，而不是利用欧拉-拉格朗日方程。

“只要在多走一小步，仿佛是向同一方向迈的一小步，真理便会变成错误。”我想，这也是这句话的体现之一。

转载到请包括本文地址：https://spaces.ac.cn/archives/2040

更详细的转载事宜请参考：《科学空间FAQ》

如果您还有什么疑惑或建议，欢迎在下方评论区继续讨论。

如果您觉得本文还不错，欢迎分享/打赏本文。打赏并非要从中获得收益，而是希望知道科学空间获得了多少读者的真心关注。当然，如果你无视它，也不会影响你的阅读。再次表示欢迎和感谢！

如果您需要引用本文，请参考：

苏剑林. (Jul. 30, 2013). 《变分法的一个技巧及其“误用” 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/2040

@online{kexuefm-2040,
        title={变分法的一个技巧及其“误用”},
        author={苏剑林},
        year={2013},
        month={Jul},
        url={\url{https://spaces.ac.cn/archives/2040}},
}

分类：数学研究标签：变分, 作用量 3 评论

< 【翻译】星空之夜：夏季恒星的色彩 | CreaWriter，惬意创作！ >

你也许还对下面的内容感兴趣

发表你的看法

先忧后乐范

August 3rd, 2015

变分所给出的结果（微分方程组）是等效的。这句话前面的表达式少了狄拉克函数的符号。

回复评论

oyster

February 7th, 2020

推导方法的过程是不是用广义坐标而不是t比较好呢，方便和实际应用作比较，比如您在【理解李曼几何3】里边的实际应用，广义坐标与r,θ，φ对应

回复评论

苏剑林发表于 February 8th, 2020

本文涉及的内容的实际应用就是运动方程呀，所以以 $t$ 为标准是比较实际的。

回复评论

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

变分法的一个技巧及其“误用”

你也许还对下面的内容感兴趣

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接