26 Oct

新词发现的信息熵方法与实现

在本博客的前面文章中,已经简单提到过中文文本处理与挖掘的问题了,中文数据挖掘与英语同类问题中最大的差别是,中文没有空格,如果要较好地完成语言任务,首先得分词。目前流行的分词方法都是基于词库的,然而重要的问题就来了:词库哪里来?人工可以把一些常用的词语收集到词库中,然而这却应付不了层出不穷的新词,尤其是网络新词等——而这往往是语言任务的关键地方。因此,中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材,直接从大规模的语料库中,自动发现可能成词的语言片段。前两天我去小虾的公司膜拜,并且试着加入了他们的一个开发项目中,主要任务就是网络文章处理。因此,补习了一下新词发现的算法知识,参考了Matrix67.com的文章《互联网时代的社会语言学:基于SNS的文本数据挖掘》,尤其是里边的信息熵思想,并且根据他的思路,用Python写了个简单的脚本。

点击阅读全文...

26 Dec

精确自由落体运动定律的讨论

比萨斜塔.jpg

在初中或高中,自由落体试验简单地用这个公式来描述出来:
$$s=1/2 g t^2$$
其中$g=9.8m//s^2$,等于1kg物体在地球表面所受的重力。
但是这个公式很明显有一个问题,就是实际上在地球,g不是恒定的,会随着距离(即海拔高度)的变化而变化,上述公式能够在一定范围内描述自然落体运动。但是当距离很大时,公式便失效了。

点击阅读全文...

17 Jan

【竖直上抛】炮弹能够射多高(第二宇宙速度)?

一枚炮弹以速度$v_0$向上射出,只考虑重力因素,请问炮弹到达多远的距离后就会开始自由下落?

大炮的发射

大炮的发射

对于这个问题,我们首先采取的是高中生的做法。考虑地球重力,也就是说炮弹在做加速度为-g(-9.8m/s2)的匀变速运动。根据公式$v_t^2-v_0^2=2as$,可得$s=\frac{v_0^2}{2g}$。
此即炮弹能够走得最远距离。

但是看了这条式子,我们会发现,这个“距离”始终是有限的。换一句话说,只要$v_0$不趋于无穷大,s就不会无穷大。但是我们还听到过牛顿这样说过:假如炮弹以某个速度(就是我们现在所所说的第二宇宙速度)飞离地球,它就永远不会回来了。两者不是矛盾吗?

点击阅读全文...

18 Apr

行星的逆行,顺行和留(计算公式)

火星轨迹模拟

火星轨迹模拟

由于地球自西向东自转和公转,所以地球上所看到的绝大多数星体都是东升西落的,所以我们把星体在天空中自东向西的运动称为“顺行”,自西向东被称为“逆行”。由于地球和行星的共同运动,地外外行星在“冲”的前后一段时间内会出现“逆行”的现象(地内行星则相反)。而逆行与顺行之间的那一天(应该说那一时刻),就被称为“留”。也就是说,行星“留”过后,行星在天空中的运动方向由顺行变为逆行,或者由逆行变为顺行。

点击阅读全文...

27 Mar

《方程与宇宙》:活力积分和开普勒方程(二)

二体运动

二体运动

上一回的讨论中,我们已经解决了大部分的问题,并且表达了找到r或者$\theta$关于时间t的函数的希望。在最后的内容中,我们做了以下工作:

由(7)得到$\dot{\theta}=h/r^2$,代入(6)得到:
$$\ddot{r} -h^2/r^3=-\frac{\mu}{r^2}\tag{10}$$这是一个二阶微分方程,它的解很容易找出,但是这个积分太复杂:
$$\dot{r}\frac{d\dot{r}}{dr}=h^2/r^3-\frac{\mu}{r^2}$$
$\dot{r}d\dot{r}=(h^2/r^3-\frac{\mu}{r^2})dr$,两端积分
$$\dot{r}^2={2\mu}/r-h^2/r^2+K_1\tag{11}$$$$\Rightarrow {dt}/{dr}=\frac{r}{\sqrt{K_1 r^2+2\mu r-h^2}}$$
$t=\int \frac{r}{\sqrt{K_1 r^2+2\mu r-h^2}}dr$

点击阅读全文...

27 Feb

丘成桐摘得沃尔夫奖——获数学界终身成就肯定

丘成桐 司徒哲阳摄

丘成桐 司徒哲阳摄

1月31日晚,华裔数学家丘成桐收到以色列教育部部长兼沃尔夫基金会理事长Gideon Sa’ar亲笔签名的信,通知他获得了2010年的沃尔夫数学奖,原因是他“在几何分析方面的贡献已对几何和物理的许多领域产生深远而引人瞩目的影响”。

1978年开始颁发的沃尔夫奖每年评选一次,分别奖励在农业、化学、数学、医药、物理以及艺术领域中取得突出成绩的人士。其中沃尔夫数学奖影响很大。

今年的颁奖典礼定于5月13日在耶路撒冷举行,丘成桐将与美国数学家丹尼斯·沙利文分享10万美元的数学奖奖金。这是丘成桐继菲尔茨奖后,再次获得国际最顶尖的数学大奖。菲尔茨奖和沃尔夫奖双奖得主,迄今只有13位。

点击阅读全文...

26 Jul

问世间质心(重心)知多少

均匀大圆挖去小圆后,求质心(重心)

均匀大圆挖去小圆后,求质心(重心)

不论在数学题目上,或者是物理应用中,我们总能够看到类似的题目:求一个规则物体挖去(或增加)一个规则物体后,其剩下部分的质心(重心)。

点击阅读全文...

2 Aug

【科学松鼠会】猫江湖(科学也是可以很有趣的)

fatcat-06-300x270

fatcat-06-300x270

不要认为科学是一门多么枯燥、深奥的的学科,只要有点创意,科学也可以有趣起来。这种创意并非来源于专业人员,而是来源于生活,来源于关注 ,来源于一颗好奇而勇敢的心。下面请看科学松鼠会推出的《猫江湖》。

我有一个梦想,这个种群将会觉醒,实现其立群信条的真谛:猫猫生而平等;

我有一个梦想,在食堂垃圾桶边,阉割猫和健全公猫能同席而坐,共叙兄弟情谊;

我有一个梦想,甚至连临时喂食点这个正义匿迹、压迫成风的地方,也将变成平等和自由的绿洲;

我有一个梦想,让天下的猫孩儿都有爸爸,我的四个孩子将在一个不是以他们的毛色,而是以健康优劣作为评判标准的国家里生活;

点击阅读全文...