【宇宙驿站】拼音输入法天文学词库
By 苏剑林 | 2009-11-11 | 18645位读者 | 引用测试一个强悍的功能——ScienceWord
By 苏剑林 | 2009-11-22 | 38717位读者 | 引用新词发现的信息熵方法与实现
By 苏剑林 | 2015-10-26 | 107331位读者 | 引用在本博客的前面文章中,已经简单提到过中文文本处理与挖掘的问题了,中文数据挖掘与英语同类问题中最大的差别是,中文没有空格,如果要较好地完成语言任务,首先得分词。目前流行的分词方法都是基于词库的,然而重要的问题就来了:词库哪里来?人工可以把一些常用的词语收集到词库中,然而这却应付不了层出不穷的新词,尤其是网络新词等——而这往往是语言任务的关键地方。因此,中文语言处理很核心的一个任务就是完善新词发现算法。
新词发现说的就是不加入任何先验素材,直接从大规模的语料库中,自动发现可能成词的语言片段。前两天我去小虾的公司膜拜,并且试着加入了他们的一个开发项目中,主要任务就是网络文章处理。因此,补习了一下新词发现的算法知识,参考了Matrix67.com的文章《互联网时代的社会语言学:基于SNS的文本数据挖掘》,尤其是里边的信息熵思想,并且根据他的思路,用Python写了个简单的脚本。
精确自由落体运动定律的讨论(二)
By 苏剑林 | 2010-01-09 | 54390位读者 | 引用之前在这篇文章中,我们使用过一个牛顿引力场中的自由落体公式:
$t=\sqrt{\frac{r_0}{2GM}}{r_0 \cdot arctg \sqrt{\frac{r_0 -r}{r}}+\sqrt{r(r_0 -r)}}$——(1)
我们来尝试一下推导出这个公式来。同时,站长在逐渐深入研究的过程中,发现微分方程极其重要。以前一些我认为不可能解决的问题,都用微分方程逐渐解决了。在以后的文章里,我们将会继续体验到微分方程的伟大魔力!因此,建议各位有志研究物理学的朋友,一定要掌握微分方程,更加深入的,需要用到偏微分方程!
首先,质量为m的物理在距离地心r处的引力为$\frac{GMm}{r^2}$,根据牛顿第二定律F=ma,自然下落的物体所获得的加速度为$\frac{GM}{r^2}$。假设物体从距离地心r开始向地心自由下落,求位移s关于t的函数s=s(t).
科学空间:2009年12月重要天象
By 苏剑林 | 2009-12-05 | 22321位读者 | 引用科学空间论坛成立,正式开放!
By 苏剑林 | 2010-01-15 | 17697位读者 | 引用《巨眼问苍穹》:讲述望远镜的400年
By 苏剑林 | 2010-01-26 | 20003位读者 | 引用《巨眼问苍穹》是国际天文学联合会推出的庆祝望远镜400周年的书籍和电影,也是2009年美狄亚评委会特别奖获奖片
这部影片具有多个名称,其中中文名译为《巨眼问苍穹》、《望远镜的400年》或者《400年的故事-望远镜》等,英文名为《400 Years Of Telescope》,但也发现名为《Eyes On The Skies》的称呼。也不知道哪个更准确一点,不管他了,内容实质是一样的。片长60分钟,有英文、德文和中文配音,并有33种语言的字幕。目前已有30万个DVD免费分发到科学中心、天文馆、天文爱好者俱乐部的教育机构。该书132页,有英文,德文,芬兰文,韩文、日文和中文等多种语言(书籍站长还没有看过,影片就看了一下)。
新年快乐:2010年2月重要天象
By 苏剑林 | 2010-01-27 | 19345位读者 | 引用精彩天象不断的一月刚刚过去,我们迎来了夜空相对寂寥的2月。对于我们来说,本月是今年天象最少的一个月。尽管如此,我们依旧十分喜庆——本月14日,是我国传统的新春佳节,在此科学空间祝大家新年快乐、工作顺利、生活愉快!
春节期间有几个月光干扰较少的暗夜。近几年不少城里人都喜欢在春节期间到乡村去体验更浓的年味,如果天气晴朗,晚上正好有机会可以看看美丽的星空,过一个欢乐而有意义的长假。 站长也是农村里的孩子,欢迎各位同好来访,站长定会招待。不过今年将近过了一个月了,我只看到过一晚的星星,其余的不是阴天就是下雨,太阳也没有见到几回。因此,欢迎大家来贺新年!
最近评论