从马尔科夫过程到主方程(推导过程)
By 苏剑林 | 2017-10-06 | 79576位读者 |主方程(master equation)是对随机过程进行建模的重要方法,它代表着马尔科夫过程的微分形式,我们的专业主要工具之一就是主方程,说宏大一点,量子力学和统计力学等也不外乎是主方程的一个特例。
然而,笔者阅读了几个著作,比如《统计物理现代教程》,还有我导师的《生物系统的随机动力学》,我发现这些著作对于主方程的推导都很模糊,他们在着力解释结果的意义,但并不说明结果的思想来源,因此其过程难以让人信服。而知乎上有人提问《如何理解马尔科夫过程的主方程的推导过程?》但没有得到很好的答案,也表明了这个事实。
马尔可夫过程 #
主方程是用来描述马尔科夫过程的,而马尔科夫过程可以理解为运动的无记忆性,说通俗点,就是下一刻的概率分布,只跟当前时刻有关,跟历史状态无关。用概率公式写出来就是(这里只考虑连续型概率,因此这里的p是概率密度):
p(x,τ)=∫p(x,τ|y,t)p(y,t)dy
这里的积分区域是全空间。这里的p(x,τ|y,t)称为跃迁概率,即已经确定了t时刻来到了y位置后、在τ时刻达到x的概率密度,这个式子的物理意义是很明显的,就不多做解释了。
尽管(1)式很直观,但用它来建模实际上存在两个比较困难的问题
1、为了建模就得写出p(x,τ|y,t),而事实上我们很难直接写出一个合理的跃迁概率出来;
2、即使写出来p(x,τ|y,t),方程是一个积分方程,而我们对积分方程的研究远不如微分方程。
因此,有必要写出它的微分方程形式。
主方程 #
我们设τ=t+ϵ
p(x,t+ϵ)=∫p(x,t+ϵ|y,t)p(y,t)dy
并且考虑ϵ→0的极限,保留到ϵ的一阶项,我们有
p(x,t+ϵ|y,t)=δ(x−y)+ϵ˜W(x,y,t)
其中用到了p(x,t|y,t)=δ(x−y)这个事实,而
˜W(x,y)=∂p(x,τ|y,t)∂τ|τ=t
我们对(2)式两边都展开ϵ到一阶项,得到
p(x,t)+ϵ∂p(x,t)∂t=∫[δ(x−y)+ϵ˜W(x,y,t)]p(y,t)dy
故
∂p(x,t)∂t=∫˜W(x,y,t)p(y,t)dy
更便于建模 #
读者可以发现,(6)式并非我们常见的主方程的形式,这是因为它不方便建模。我们再来看(3)式,注意我们有
∫p(x,t+ϵ|y,t)dx=1
因此结合(3)式,则必须要求
∫˜W(x,y,t)dx=0
科研中的建模过程是反过来的:需要先写出主方程的形式,然后去求解主方程。也就是说,为了用(6)式建模,则需要写出˜W(x,y,t),而˜W(x,y,t)要满足(8)式的约束条件,但我们很难凭空写出一个˜W(x,y,t)同时又满足这个约束。
幸运的是,我们可以用一个技巧来去掉这个约束。首先我们写出一个任意的函数W(x,y,t),然后考虑
∫W(x,y,t)dx=∬δ(y−z)W(x,z,t)dxdz(接下来交换x,z的位置)=∬δ(y−x)W(z,x,t)dzdx
从而我们可以让
\begin{equation}\tilde{W}(x,y,t) = W(x,y,t) - \int \delta(y-x) W(z,x,t)dz\end{equation}
那么它自动地满足\eqref{eq:yueshu}式,最终主方程的形式变为
\begin{equation}\label{eq:zhufangcheng-2}\frac{\partial p(x,t)}{\partial t}=\int \Big[W(x,y,t)p(y,t)-W(y,x,t)p(x,t)\Big] dy\end{equation}
这就是我们在教科书上能看到的主方程的形式,这时候对W(x,y,t)则没有特别的约束了,因此可以方便地用它来建模。至于对W(y,x,t)的物理意义的诠释,则是后话了。类似的推导过程可以平移到离散型的主方程,也不再赘述。
一点评价 #
从上面的过程可以看到,主方程之所以是我们经常看到的形式,是因为那种形式更方便我们进行建模,至于对结果的诠释,本质上来说都是强加的,不能算作推导过程。而多数著作对主方程的推导,侧重于对结果的物理诠释,对方程的形式的来源不加详述,是引起我们理解上的困难的重要原因之一,希望这里的文字可以对此做些补充。
转载到请包括本文地址:https://spaces.ac.cn/archives/4598
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Oct. 06, 2017). 《从马尔科夫过程到主方程(推导过程) 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/4598
@online{kexuefm-4598,
title={从马尔科夫过程到主方程(推导过程)},
author={苏剑林},
year={2017},
month={Oct},
url={\url{https://spaces.ac.cn/archives/4598}},
}
October 8th, 2017
你的导师是周天寿老师
是的哈~
October 22nd, 2017
离散形式的主方程 http://www.joyfulphysics.net/index.php/archives/146/
December 18th, 2017
非常好非常清晰的解释,让人豁然开朗。Zwanzig的书里是把Langevin方程和FP放在master前面的读来让人一时摸不着头脑
March 12th, 2018
我刚刚接触随机过程,很想了解随机过程的发展背景知识,或者说是随机过程的启蒙知识,由于本人的英语水平缺陷看不懂英文,而目前又苦于找不中文版的相关资料,还请老师能否介绍一些随机过程的学科背景知识呢!谢谢老师!
December 23rd, 2018
楼主,能解释下(9)式以及(9)式到(10)式怎么推的吗?或者给推荐本书,谢谢了
(9)式几乎是显然成立的,(10)式只是根据(9)式得到的一个定义,没有包含什么计算过程。这两步是最不应该看不懂的....
September 26th, 2021
在(9)式中,第一步到第二步中,应该有
W(x,y,t)=\int P(y,t|z,t)W(x,z,t)dz
可以解释这样的积分恒等式式怎么成立的吗?
没看懂你说什么。(9)式是狄拉克函数的性质,哪来的P(y,t|z,t)?
哦,我知道了,我之前看到P(x,t|y,t)=\delta(x-y),是我理解错了。
April 14th, 2022
您好:
如果p(x,t)存在简并时,主方程为什么是\frac{\partial p(x,t)}{\partial t}=\int [W_{x,y,t}p(y,t)d_{x}-W_{y,x,t}p(x,t)d_{y} ]dt;
d_{x},d_{y}分别为x,y的简并度.
为什么简并度会出现在相反的位置,我原本以为是这种形式\frac{\partial p}{\partial t}=\int [W_{x,y,t}p(y,t)d_{y}-W_{y,x,t}p(x,t)d_{x} ]dt,希望您能解答
这个我也不懂啊,不了解简并,而且很久没做这块了...