包含关键字 pre 的文章 - 科学空间|Scientific Spaces

7 Aug

【NASA每日一图】沙子般的 NGC 1313

By 苏剑林 | 2009-08-07 | 18419位读者 | 引用

图片说明：NGC 1313，版权：NASA, ESA By Anne Pellerin

分类：图片摄影标签：NGC, 哈勃阅读全文抢沙发

8 Aug

笔者：38亿年前，在太阳系形成之初，发生了一场“惊天动地”的撞击事件，这造成了月球的环形山，找成了很多天体的坑坑洼洼。不过，它同时也可能是生命之源。因为有研究显示，它可能为地球带来了水。
这一次的翻译没有多大困难，不过呢，有一些专有名词很麻烦，就像Giant plumes，一直搞不清楚这是什么，后来向人请教，才知道这是“地幔柱”。希望各位志同道合的朋友，以后遇到一些不清楚的名词，不要那么快下结论，多去Google一下。

点击阅读全文...

分类：天文探索标签：彗星, 翻译, 月球, 小行星阅读全文抢沙发

18 Aug

世界各国能否联手应对气候变化？

By 苏剑林 | 2009-08-18 | 24510位读者 | 引用

笔者：这一次的翻译有点乱，不过先不管这个，说说内容。

会议、会议、会议......关于气候问题的会议不断，但是仍然没有达到一个很好的共识，而气候恶化却在不断地进行中，而且情况越来越严峻。抑制温室效应的其它途径又未成熟......解决气候变化，路在何方？

点击阅读全文...

分类：生物自然标签：翻译, 世界, 气候阅读全文 1 评论

5 Oct

重新拥抱国家天文台！

By 苏剑林 | 2009-10-05 | 18824位读者 | 引用

三天了，在这个长达8天的假期中，我居然有连续三天没有更新日志了！也许各位想我是外出旅行了，没有时间管理。其实恰恰相反，这几天我都马不停蹄地对着Spaces.Ac.Cn。因为，“科学空间”回到了天文台了。

不明白？不要紧，我详细说说。

之前由于喜爱geekg的风格，所以把网站程序换成了pjblog。不过pjblog是asp，而宇宙驿站的服务器是linux，只支持html和php，所以，没有办法，我只好换空间了。但是我们是非营利性网站，没有利益收入，当然也不希望有这方面的付出了。所以，辗转了多个免费空间，其中包括火山互联等等。这里首先得感谢“观星天文论坛”的Holdy Pan站长，他曾经无偿地把他的空间给我用（后来没有用了）。还有不得不说的是9790.com网站，他免费为大家提供了一块500M的免费空间，自我申请日起，我几乎一直用它，算起来有两个多月了，一直很稳定。现在的网络很少这样的免费空间商了。

点击阅读全文...

分类：生活/情感标签：天文台, 网站阅读全文抢沙发

14 Oct

绿色和平：工厂排污36计

By 苏剑林 | 2009-10-14 | 23548位读者 | 引用

绿色和平组织又发来了新消息，请大家阅读！

绿色和平组织

朋友们，

当“36计”——我国古代的谋略宝典，现在被工厂用在了排放废水、污染江河上，这是怎样的情形呢？我们制作了漫画版的“工厂排污36计”，让你对工厂非法排污的伎俩一览无余。

查看“排污三十六计”漫画系列>>>>

点击阅读全文...

分类：生物自然标签：绿色, 组织, 环境阅读全文 1 评论

30 Oct

最新调查解“毒”珠江：工业水污染触目惊心！

By 苏剑林 | 2009-10-30 | 21344位读者 | 引用

绿色和平组织前天发来了关于珠江河的消息。珠江作为我们广东的“母亲河”，出现了什么问题了呢？

绿色和平组织

亲爱的朋友，

你爱吃鱼么？那么，如果是洗发精口味或肥皂口味的鱼，你还一样食指大动吗？也许你不相信有这样的鱼，那么，跟随我们一起去珠江探访吧。

珠江流域的河流为区内4700万人提供饮用水，然而现在，工业污染却正在毒害那些居民的健康。绿色和平的最新调查发现，珠江三角洲的五家企业向珠江排放有毒有害物质！

点击阅读全文...

分类：生物自然标签：绿色, 环境, 污染, 水域, 工业阅读全文抢沙发

26 Oct

新词发现的信息熵方法与实现

By 苏剑林 | 2015-10-26 | 108418位读者 | 引用

在本博客的前面文章中，已经简单提到过中文文本处理与挖掘的问题了，中文数据挖掘与英语同类问题中最大的差别是，中文没有空格，如果要较好地完成语言任务，首先得分词。目前流行的分词方法都是基于词库的，然而重要的问题就来了：词库哪里来？人工可以把一些常用的词语收集到词库中，然而这却应付不了层出不穷的新词，尤其是网络新词等——而这往往是语言任务的关键地方。因此，中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材，直接从大规模的语料库中，自动发现可能成词的语言片段。前两天我去小虾的公司膜拜，并且试着加入了他们的一个开发项目中，主要任务就是网络文章处理。因此，补习了一下新词发现的算法知识，参考了Matrix67.com的文章《互联网时代的社会语言学：基于SNS的文本数据挖掘》，尤其是里边的信息熵思想，并且根据他的思路，用Python写了个简单的脚本。

点击阅读全文...

分类：信息时代标签：python, 最大熵, 词库, 新词发现阅读全文 24 评论

15 Jan