包含关键字实体识别的文章 - 科学空间|Scientific Spaces

21 Feb

大自然的隐身术——保护色

By 苏剑林 | 2010-02-21 | 35933位读者 | 引用

草蜢

保护色（Crypsis）和拟态现象都表现为与环境色彩相似，不易被识别，保护色表现为与环境色彩相似，这里的“环境色彩”应是环境中主要的占优势的色彩，如春夏的草坪是绿色，冬天的雪地是白色；拟态是与环境中某种生物或非生物相似，而这种生物或非生物的颜色等特征并不一定在环境中占优势，并非主要色彩，保护色则与运动状态基本无关，如枯叶蝶停息在树枝上的模样像枯叶，“停息”状态才像枯叶，一旦飞舞起来就不像了。而我们捕捉昆虫也许都有这种体验：有时看到昆虫由这里飞向另一个地方，但马上在另一个地方搜寻，却不能立即找到。

点击阅读全文...

分类：生物自然标签：动物, 昆虫阅读全文抢沙发

3 Feb

[SETI-50周年]茫茫宇宙觅知音

By 苏剑林 | 2011-02-03 | 20023位读者 | 引用

转载自2011年1月的《天文爱好者》作者：薛国轩

“多萝西计划”再探地外文明

据美国空间网站2010年11月13日报道，在人类“探索地外文明”（英文缩写为SETI）50周年纪念之际，世界多个国家的天文学家从本月起再度展开“且听外星人”的联合行动，以延续开始于1960年的“奥兹玛计划”。新的探索活动被命名为“多萝西计划”（Project Dorothy），已于11月5日正式启动，将持续整整一个月时间，来自澳大利亚、日本、韩国、意大利、荷兰、法国、阿根廷和美国的天文学家参与其中。他们将把大大小小的望远镜指向地球周围的一些星球，以期收听到外星人的“天外来音”。

Allen Telescope Array

点击阅读全文...

分类：天文探索标签：转载, 探索, 地外文明, 无线电, SETI 阅读全文抢沙发

22 Sep

一个人的数学建模：碎纸复原

By 苏剑林 | 2013-09-22 | 39027位读者 | 引用

suizhiji

笔者一直无心参加数学竞赛，主要原因是我喜欢能够持续深入地思考一个问题，而不想被竞赛的时间限制所束缚。我并不是一个机灵的人，因此很难有竞赛所需要的“灵光一现”。大概一个多星期前全国数学建模的预赛开始了，我也饶有兴致地关注了一下，并且留意到了B题这道有趣的题目——碎纸复原，然后就开始思考算法了。那时候应该是9月13日中午，我开始了一个人的数学建模，“一个人”并不是说我一个人就组成一支队了，而是我一个人自由高效地在构思算法、摸索代码，不为比赛，只为达到目的，那种兴奋一直持续到了当晚凌晨三点。

点击阅读全文...

分类：数学研究,生活/情感标签：软件, 代码, 建模阅读全文 2 评论

18 Dec

迟到一年的建模：再探碎纸复原

By 苏剑林 | 2014-12-18 | 81885位读者 | 引用

前言：一年前国赛的时候，很初级地做了一下B题，做完之后还写了个《碎纸复原：一个人的数学建模》。当时就是对题目很有兴趣，然后通过一天的学习，基本完成了附件一二的代码，对附件三也只是有个概念。而今年我们上的数学建模课，老师把这道题作为大作业让我们做，于是我便再拾起了一年前的那份激情，继续那未完成的一个人的数学建模...

与去年不同的是，这次将所有代码用Python实现了，更简洁，更清晰，甚至可能更高效~~以下是论文全文。

研究背景

2011年10月29日，美国国防部高级研究计划局（DARPA）宣布了一场碎纸复原挑战赛（Shredder Challenge），旨在寻找到高效有效的算法，对碎纸机处理后的碎纸屑进行复原。[1]该竞赛吸引了全美9000支参赛队伍参与角逐，经过一个多月的时间，有一支队伍成功完成了官方的题目。

近年来，碎纸复原技术日益受到重视，它显示了在碎片中“还原真相”的可能性，表明我们可以从一些破碎的片段中“解密”出原始信息来。另一方面，该技术也和照片处理领域中的“全景图拼接技术”有一定联系，该技术是指通过若干张不同侧面的照片，合成一张完整的全景图。因此，分析研究碎纸复原技术，有着重要的意义。

点击阅读全文...

分类：数学研究,生活/情感标签：代码, python, 建模, 图像阅读全文 19 评论

26 Aug

fashion-mnist的gan玩具

By 苏剑林 | 2017-08-26 | 58474位读者 | 引用

fashion_mnist_demo

mnist的手写数字识别数据集一直是各种机器学习算法的试金石之一，最近有个新的数据集要向它叫板，称为fashion-mnist，内容是衣服鞋帽等分类。为了便于用户往fashion-mnist迁移，作者把数据集做成了几乎跟mnist手写数字识别数据集一模一样——同样数量、尺寸的图片，同样是10分类，甚至连数据打包和命名都跟mnist一样。看来fashion mnist为了取代mnist，也是拼了，下足了功夫，一切都做得一模一样，最大限度降低了使用成本～这叫板的心很坚定呀。

叫板的原因很简单——很多人吐槽，如果一个算法在mnist没用，那就一定没用了，但如果一个算法在mnist上有效，那它也不见得在真实问题中有效～也就是说，这个数据集太简单，没啥代表性。

fashion-mnist的github：https://github.com/zalandoresearch/fashion-mnist/

点击阅读全文...

分类：信息时代标签：深度学习, GAN, 生成模型阅读全文 8 评论

6 May

记录一次爬取淘宝/天猫评论数据的过程

By 苏剑林 | 2015-05-06 | 168953位读者 | 引用

笔者最近迷上了数据挖掘和机器学习，要做数据分析首先得有数据才行。对于我等平民来说，最廉价的获取数据的方法，应该是用爬虫在网络上爬取数据了。本文记录一下笔者爬取天猫某商品的全过程，淘宝上面的店铺也是类似的做法，不赘述。主要是分析页面以及用Python实现简单方便的抓取。

笔者使用的工具如下

Python 3——极其方便的编程语言。选择3.x的版本是因为3.x对中文处理更加友好。
Pandas——Python的一个附加库，用于数据整理。
IE 11——分析页面请求过程（其他类似的流量监控工具亦可）。
剩下的还有requests,re，这些都是Python自带的库。

实例页面（美的某热水器）：http://detail.tmall.com/item.htm?id=41464129793

点击阅读全文...

分类：信息时代标签：网站, 爬虫阅读全文 45 评论

6 Jun

闲聊：神经网络与深度学习

By 苏剑林 | 2015-06-06 | 68885位读者 | 引用

神经网络

在所有机器学习模型之中，也许最有趣、最深刻的便是神经网络模型了。笔者也想献丑一番，说一次神经网络。当然，本文并不打算从头开始介绍神经网络，只是谈谈我对神经网络的个人理解。如果希望进一步了解神经网络与深度学习的朋友，请移步阅读下面的教程：
http://deeplearning.stanford.edu/wiki/index.php/UFLDL教程

http://blog.csdn.net/zouxy09/article/details/8775360

机器分类

这里以分类工作为例，数据挖掘或机器学习中，有很多分类的问题，比如讲一句话的情况进行分类，粗略点可以分类为“积极”或“消极”，精细点分为开心、生气、忧伤等；另外一个典型的分类问题是手写数字识别，也就是将图片分为10类（0,1,2,3,4,5,6,7,8,9）。因此，也产生了很多分类的模型。

点击阅读全文...

分类：信息时代标签：神经网络, 深度学习, 机器学习阅读全文 17 评论

4 Aug

文本情感分类（二）：深度学习模型

By 苏剑林 | 2015-08-04 | 606979位读者 | 引用

语言处理

在《文本情感分类（一）：传统模型》一文中，笔者简单介绍了进行文本情感分类的传统思路。传统的思路简单易懂，而且稳定性也比较强，然而存在着两个难以克服的局限性：一、精度问题，传统思路差强人意，当然一般的应用已经足够了，但是要进一步提高精度，却缺乏比较好的方法；二、背景知识问题，传统思路需要事先提取好情感词典，而这一步骤，往往需要人工操作才能保证准确率，换句话说，做这个事情的人，不仅仅要是数据挖掘专家，还需要语言学家，这个背景知识依赖性问题会阻碍着自然语言处理的进步。

点击阅读全文...

分类：信息时代标签：python, 深度学习, 机器学习, 文本挖掘阅读全文 176 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

大自然的隐身术——保护色

[SETI-50周年]茫茫宇宙觅知音

一个人的数学建模：碎纸复原

迟到一年的建模：再探碎纸复原

研究背景

fashion-mnist的gan玩具

记录一次爬取淘宝/天猫评论数据的过程

闲聊：神经网络与深度学习

机器分类

文本情感分类（二）：深度学习模型

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接