变分法的一个技巧及其“误用”
By 苏剑林 | 2013-07-30 | 40858位读者 |不可否认,变分法是非常有用而绝妙的一个数学工具,它“自动地”为我们在众多函数中选出了最优的一个,而免除了具体的分析过程。物理中的最小作用量原理则让变分法有了巨大的用武之地,并反过来也推动了变分法的发展。但是变分法的一个很明显的特点就是在大多数情况下计算相当复杂,甚至如果“蛮干”的话我们几乎连微分方程组都列不出来。因此,一些有用的技巧是很受欢迎的。本文就打算介绍这样的一个小技巧,来让某些变分问题得到一定的化简。
我是怎么得到这个技巧的呢?事实上,那是几个月前我在阅读《引力与时空》时,读到变分原理那一块时我怎么也读不懂,想不明白。明明我觉得是错误的东西,为什么可以得到正确的结果?我的数学直觉告诉我绝对是作者的错,可是我又想不出作者哪里错了,所以就一直把这个问题搁置着。最近我终于得到了自己比较满意的答案,并且窃认为是本文所要讲的这个技巧却被物理学家“误用”了。
技巧
首先来看通常我们是怎么处理变分问题的,以一元函数为例,对于求
S=∫L(x,˙x,t)dt
的极值曲线,我们通常是直接将其代入欧拉-拉格朗日方程:
∂L∂x−ddt(∂L∂˙x)=0
这总是会奏效的,但是通常都不会简单。我们来看一个特例,即很多变分问题的被积函数都是根号的形式的,如狭义相对论的作用量是S=−∫mc√c2dt2−dx2−dy2−dz2,短程线问题的弧长是l=∫√gμνdxμdxν等等,这一类问题如果直接把其中一个变量作为自变量,其他变量作为函数,代入欧拉-拉格朗日方程,就会得到非常复杂的结果,变量之间“纠缠”在一起,以至于甚至我们连微分方程都列不出来。
可是我们仔细注意就会发现,复杂性的来源是根号,而根号里边的表达式通常并不是非常复杂,要是有个方法让我们将其平方一下就好了。这确实是可以实现的,但是要找到它,却不能从欧拉-拉格朗日方程出发,要从变分法最根本的运算出发。
δS=δ∫Ldt=∫δ(Ldt)=∫δ√(Ldt)2=∫δ(L2dt2)2√(Ldt)2
设ds=√(Ldt)2=Ldt,就变成了
∫δ(L2dt2)2ds=∫δ(L2dt2)2ds2ds
此时,如果我们在变分过程(要注意,是仅仅在变分过程中)中,将ds看成与x,y无关的、纯粹的参数,那么我们可以改写为
∫12δ[L2(dtds)2]ds
这样子也就是说,如果以ds=Ldt作为参量,那么S=∫Ldt的变分与S=∫12[L2(dtds)2]ds的变分所给出的结果(微分方程组)是等效的。这样一来,我们只需要将L′=12L2(dtds)2代入到欧拉-拉格朗日方程中即可,通常来说这会比直接代入L简单一些。
比如,在考虑短程线时,我们要变分l=∫√gμνdxμdxν,设ds=√gμνdxμdxν,那么
l=∫gμνdxμdsdxνdsds
记L′=12gμνdxμdsdxνds,代入欧拉-拉格朗日方程就得到:
dds(gμνdxνds)=∂gαβ∂xν(dxαds)(dxβds)
误用
然而,这种技巧有可能会被误用。狭义相对论中的自由粒子作用量是S=−∫mc√c2dt2−dx2−dy2−dz2,根据上面的结论,它和S=−∫12mc[c2(dtds)2−(dxds)2−(dyds)2−(dzds)2]ds的效果是等价的,其中ds=√c2dt2−dx2−dy2−dz2。这在没有考虑相互作用时是正确的,但是如果加入了势能项的作用量时,我们很容易也产生这样的错觉:同样把自由粒子项换成是S=−∫12mc[c2(dtds)2−(dxds)2−(dyds)2−(dzds)2]ds,但这将会导致错误的结果。因为我们所说的技巧,是将整个拉格朗日函数平方,而不是部分平方。
比如我们之前考虑过的
S=−mc2∫√1−v2c2dt−αϕ√1−v2c2dt
不可以简单地将作用量变换成:
S=−∫12mc[c2(dtds)2−(dxds)2−(dyds)2−(dzds)2]ds−αcϕds
这将会给出错误的结果。事实上这也不存在任何简单的方法,最好的方法就是直接将其变分,而不是利用欧拉-拉格朗日方程。
“只要在多走一小步,仿佛是向同一方向迈的一小步,真理便会变成错误。”我想,这也是这句话的体现之一。
转载到请包括本文地址:https://spaces.ac.cn/archives/2040
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Jul. 30, 2013). 《变分法的一个技巧及其“误用” 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/2040
@online{kexuefm-2040,
title={变分法的一个技巧及其“误用”},
author={苏剑林},
year={2013},
month={Jul},
url={\url{https://spaces.ac.cn/archives/2040}},
}
August 3rd, 2015
变分所给出的结果(微分方程组)是等效的。这句话前面的表达式少了狄拉克函数的符号。
February 7th, 2020
推导方法的过程是不是用广义坐标而不是t比较好呢,方便和实际应用作比较,比如您在【理解李曼几何3】里边的实际应用,广义坐标与r,θ,φ对应
本文涉及的内容的实际应用就是运动方程呀,所以以t为标准是比较实际的。