1 Dec

熵的概念

作为一名物理爱好者,我一直对统计力学中“熵”这个概念感到神秘和好奇。因此,当我接触数据科学的时候,我也对最大熵模型产生了浓厚的兴趣。

熵是什么?在通俗的介绍中,熵一般有两种解释:(1)熵是不确定性的度量;(2)熵是信息的度量。看上去说的不是一回事,其实它们说的就是同一个意思。首先,熵是不确定性的度量,它衡量着我们对某个事物的“无知程度”。熵为什么又是信息的度量呢?既然熵代表了我们对事物的无知,那么当我们从“无知”到“完全认识”这个过程中,就会获得一定的信息量,我们开始越无知,那么到达“完全认识”时,获得的信息量就越大,因此,作为不确定性的度量的熵,也可以看作是信息的度量,说准确点,是我们能从中获得的最大的信息量。

点击阅读全文...

21 Jan

怎么会这么巧!背后的隐藏信息

假设我是一名中学数学老师,在给学生兴致勃勃地讲“素数”,讲完素数的定义和相关性质后,正当我接着往下讲时,有个捣蛋的学生提问,“老师,你能不能举一个三位数的素数?”。可是我手头上没有1000以内的素数表,我也没记住超过100的素数,那怎么办呢?我只好在黑板上写出几个三位数,比如173、211、463,然后跟学生说“让我们来检验这些数是不是素数”。最终的结果是:它们都是素数!然后会有学生疑问:怎么会这么巧?

素数的概率

首先的问题是,任意写一个三位数,它是素数的概率是多少?三位数的素数共有143个,三位数共有900个,于是概率应该是143/900,大约是六分之一。看起来挺低的,要“蒙中”似乎不容易。

点击阅读全文...

13 Jan

当概率遇上复变:从二项分布到泊松分布

泊松分布,适合于描述单位时间内随机事件发生的次数的概率分布,如某一服务设施在一定时间内受到的服务请求的次数、汽车站台的候客人数等。[维基百科]泊松分布也可以作为小概率的二项分布的近似,其推导过程在一般的概率论教材都会讲到。可是一般教材上给出的证明并不是那么让人赏心悦目,如《概率论与数理统计教程》(第二版,茆诗松等编)的第98页就给出的证明过程。那么,哪个证明过程才更让人点赞呢?我认为是利用母函数的证明。

二项分布的母函数为
$$\begin{equation}(q+px)^n,\quad q=1-p\end{equation}$$

点击阅读全文...

30 Apr

当概率遇上复变:随机游走基本公式

笔者发现,有很多概率问题,尤其是独立重复实验问题,如果用生成函数的方法来做,会显得特别方便。本文要讲的“随机游走”问题便是其中一例,它又被形象地叫做“醉汉问题”,其本质上是一个二项分布,但是由于取了极限,出现了很多新的性质和应用。我们先考虑如下问题:

考虑实数轴上的一个粒子,在$t=0$时刻它位于原点,每过一秒,它要不向前移动一格(+1),要不就向后移动一格(-1),问$n$秒后它所处位置的概率分布。

点击阅读全文...

25 Apr

当概率遇上复变:解析概率

每当看到数学的两个看似毫不相关的分支巧妙地联系了起来时,我总会为数学的神奇美丽惊叹不已。在很久以前,当我看到通过生成函数法把数论问题与复变函数方法结合起来,衍生出一门奇妙的“解析数论”时,我就惊叹过生成函数法的漂亮!可惜,一直都没有好好写整理这些内容。今天,当我在看李政道先生的《物理学中的数学方法》时,看到他把复变函数跟随机游动如鬼斧神工般了起来,再次让我拍案叫绝。最后实在压抑不住心中的激动,在此写写概率论和生成函数的事情。

数论与复变函数结合,就生成了一门“解析数论”,按照这个说法,概率与复变函数结合,应该就会有一门“解析概率”,但是我在网上搜索的时候,并没有发现这个名词的存在。经过如此,本文还是试用了这个名词。虽然这个名词没有流行,但事实上,解析概率的方法并不算新,它可以追溯到伟大的数学家拉普拉斯以及他的著作《分析概率论》中。尽管如此,这种巧妙漂亮的方法似乎没有得到大家应该有的充分的认识。

我觉得,即使作为一个简洁的计算工具,生成函数法这个美丽的技巧,也应该尽可能为科学爱好者所知,更不用说数学专业的朋友了。

点击阅读全文...

12 Sep

数学竞赛广东预赛|组成三角形的概率

九月三日BoJone和九个同学到云浮参加了今年广东省的数学竞赛预赛,那一起出发、玩笑、作战、吃饭的情景依然历历在目,让我久久不能忘怀。是呀,能够并肩作战的感觉真好!九日数学成绩出来了,遗憾的是今年政策改变了,我被告知整个市只有三个名额能够参加复赛,于是新兴只有我一个人进入了复赛(另外两个据说是罗定的,我们三个并列第一)。有点无语,我想,大概是要把那些为了功利而参赛的人都给刷下去吧...

今年广东的预赛题前所未有的简单,不论是和全国其他地方相比还是和上一年的题目相比,都简单了不少,但我还是做得不大理想,据我估计,120分的卷子我顶多能够拿个68分,所以BoJone的基本技能实在不容乐观。从云浮考试回来后,和同行的同学讨论试题,得出了一些很有趣的结果,那过程可谓其乐无穷呀!下面是倒数第二题预赛题的几个绝妙解法,供大家欣赏。解法由我和伍泽麒(人称“兔子、神兔”,人如其名,天资聪颖,性格可爱)完成。

题目:

在一条线段中随意选取两个点,把这条线段截成三段,求这三段线段能够组成一个三角形的概率。

点击阅读全文...

26 Aug

“用户评价”靠谱吗?

目前,几乎所有的交易网站(亚马逊、淘宝等)都提供了“用户评价”功能,旨在通过购买者来断定产品的好坏。表面看来,这样的做法给予了大众公正、公开的感觉,然而事实果真如此吗?今年的《环球科学》第八期有一篇文章名为《用户评价靠谱吗》,其中谈到了单靠“用户评价”来评论一件产品的好坏具有不公正性。现在一场审判开始了,原告是“用户评价”,被告是《环球科学》的文章,而法官是数学。

淘宝的用户评价-截图

淘宝的用户评价-截图

审判开始了......“用户评价”坚持自己所显示的是符合实际的,《环球科学》则认为其有不合适之处。审判结果如何?

点击阅读全文...

29 Jul

生活中的趣味数学:同一天生日概率有多大

新浪科技讯 北京时间7月28日消息,据国外媒体报道,数学经常会让聪明人感觉自己笨得不行,有时甚至会让他们很生气。

事实上,数学本身非常有趣,它是我们日常生活的一部分,每个人都能从中获得享受。只不过在课堂上,数学被一些死板的老师教死板了。以下就是英国《每日邮报》最近公布的日常生活中的趣味数学:

你身上的计算器

从左到右给你的手指编

从左到右给你的手指编

点击阅读全文...