包含关键字推荐系统解耦的文章 - 科学空间|Scientific Spaces

14 Feb

唯美星空·梦幻天国(KAGAYA加贺谷穰作品)

By 苏剑林 | 2010-02-14 | 50664位读者 | 引用

典型的冬季星空-KAGAYA

BoJone一看到这些图片，就不由自主地心生喜爱，觉得只有一个词语可以形容它，那就是“唯美”。是的，太美了！几乎每一张图片都把星空和动画完美地结合了起来，既极具美感，又融合了天文。极度细致的画面营造了一个仙境般的世界，加上清澈浩淼的星空、轻舞飞扬的花瓣、不食人间烟火的星之女神……，这一切结合在一起，勾起了人们对于茫茫宇宙的无限幻想，打动人们的心扉而产生共鸣。这一切纯净而美好的幻想构筑了一个新的世界，它属于KAGAYA，同样属于喜爱这些作品的KAGAYA的拥趸，对于他们来说，那就是天堂。

点击阅读全文...

分类：图片摄影标签：星空阅读全文 10 评论

6 Oct

《积分公式大全》网络版本

By 苏剑林 | 2010-10-06 | 20933位读者 | 引用

为了方便各位读者查阅，BoJone特意制作了这个积分公式表的电子版本。
数学公式采用JsMath技术显示，为了能够更清晰地显示数学公式，推荐读者下载TeX-fonts字体。

原著的具体说明和下载，请点击

浏览地址：http://kexue.fm/sci/integral/index.html

点击阅读全文...

分类：数学研究标签：网站, 积分阅读全文抢沙发

5 Jul

最近的那些事儿...

By 苏剑林 | 2011-07-05 | 15609位读者 | 引用

有心者会发现科学空间最近的更新慢了...

是的，最近事情有点多。

点击阅读全文...

分类：生活/情感标签：学习阅读全文抢沙发

21 Jan

修改了一下背景音乐

By 苏剑林 | 2012-01-21 | 39285位读者 | 引用

不少关心科学空间的朋友都提到过关于背景音乐的建议。能听到大家对科学空间的建议，BoJone感到非常开心，无奈前些时间一直无时间改进。今天趁着假期抽时间弄了一下。

首先把播放器更换成了一个免费的网页falsh播放器：Flash Mp3 Player。这个播放器比微软的功能稍稍强一些，而且支持断点续播（当你刷新网页后不是重新播放，而是从之前的位置），并且由于是Flash平台，可以直接在Firefox等支持Flash的浏览器播放。

点击阅读全文...

分类：生活/情感标签：网站阅读全文 7 评论

21 Aug

[电子书]《最小作用量原理与物理学的发展》

By 苏剑林 | 2013-08-21 | 49128位读者 | 引用

最小作用量原理无疑是物理中最迷人的地方之一。国内基本上很少谈及到最小作用量原理的书籍，尤其是这方面的历史，这本书算是第一本，也是一个尝试吧。个人感觉这本书写得还是不错的，大体上讲了物理力、热、光、电各方面的作用量原理及其探索，给了我们一个大概的历史思路。尽管书本一些公式的地方还有欠清晰，但是我还是愿意推荐给读者们。本文提供电子书下载，原因很简单，这本书似乎已经停产了~在亚马逊已经买不到了。有兴趣的朋友下载打印吧。

点击阅读全文...

分类：资源共享标签：书籍, 作用量, 下载阅读全文 4 评论

11 Sep

《转山》，动人之旅

By 苏剑林 | 2013-09-11 | 23635位读者 | 引用

转山

刚看完了电影《转山》，挺感动的，总觉得好像不写点东西就对不起这部电影了。

这还需要从上学期选公选课谈起。上学期我选择的公选课是数据库，而体育课则是太极，接近期末考的时候又重新选公选课了，我想选修一门轻松点、惬意点的课程，刚开始是选择了书法，后来看到了“自行车出行与户外旅游”，有点心动，再看上课老师，原来就是我们的太极老师，上了一学期的太极，跟他有些熟悉，也觉得他很好相处，就觉得选择这门课程了。

上一周二是这门课程是第一次课，老师讲得很精彩，而事实上，我唯一能够全程专心听课的就只有两门课程，一门就是这个公选课，另外就是马克思列宁主义（奇怪吧？确实是，马列老师讲得真的很精彩，我几乎没有分过神）。《转山》这部电影也是上公选课的时候老师推荐的，是根据同名小说改编的。大体的情节是一个台湾年轻人，只身踏上骑自行车从丽江到拉萨的旅途。影片描绘了他路上的崎岖行程，描绘了一路上的风土人情，让人颇为深刻。

点击阅读全文...

分类：生活/情感标签：情感, 影视, 旅行阅读全文 2 评论

13 Aug

两个惊艳的python库：tqdm和retry

By 苏剑林 | 2016-08-13 | 67147位读者 | 引用

Python基本是我目前工作、计算、数据挖掘的唯一编程语言（除了符号计算用Mathematica外）。当然，基本的Python功能并不是很强大，但它胜在有巨量的第三方扩展库。在选用Python的第三方库时，我都会经过仔细考虑，希望能挑选出最简单的、最直观的一个（因为本人比较笨，太复杂用不了）。在数据处理方面，我用得最多的是Numpy和Pandas，这两个绝对称得上王者级别的库，当然不能不提的是Scipy，但我很少直接用它，一般会通过Pandas间接调用了；可视化方面不用说是Matplotlib了；在建模方面，我会用Keras，直接上深度学习模型，Keras已经成为相当流行的深度学习框架了，如果做文本挖掘，通常还会用到jieba（分词）、Gensim（主题建模，包含了诸如word2vec之类的模型），机器学习库还有流行的Scikit Learn，但我很少用；网络方面，写爬虫我用requests，这是个人性化的网络库，如果写网站，我会用bottle，这是个单文件版的迷你框架，一切由自己定义，当然，我也不会去写什么大型网站，我就写一个简单的的接口那样而已；最后如果要并行的话，一般直接用multiprocessing。

不过，以上都不是本文要推荐的，本文要推荐的是两个可以渗透到日常写代码的库，它实现了我们平时很多时候都需要的功能，但是不用增加什么代码，绝对让人眼前一亮。

点击阅读全文...

分类：信息时代标签：python 阅读全文 9 评论

1 May

【不可思议的Word2Vec】 4.不一样的“相似”

By 苏剑林 | 2017-05-01 | 143240位读者 | 引用

相似度的定义

当用Word2Vec得到词向量后，一般我们会用余弦相似度来比较两个词的相似程度，定义为
$$\cos (\boldsymbol{x}, \boldsymbol{y}) = \frac{\boldsymbol{x}\cdot\boldsymbol{y}}{|\boldsymbol{x}|\times|\boldsymbol{y}|}$$
有了这个相似度概念，我们既可以比较任意两个词之间的相似度，也可以找出跟给定词最相近的词语。这在gensim的Word2Vec中，由most_similar函数实现。

等等！我们很快给出了相似度的计算公式，可是我们居然还没有“定义”相似！连相似都没有定义，怎么就得到了评估相似度的数学公式了呢？

要注意，这不是一个可以随意忽略的问题。很多时候我们都不知道我们干的是什么，就直接去干了。好比上一篇文章说到提取关键词，相信很多人都未曾想过，什么是关键词，难道就仅仅说关键词就是很“关键”的词？而如果想到，关键词就是用来估计文章大概讲什么的，这样我们就得到一种很自然的关键词定义
$$keywords = \mathop{\text{argmax}}_{w\in s}p(s|w)$$
进而可以用各种方法对它建模。

回到本文的主题来，相似度怎么定义呢？答案是：看场景定义所需要的相似。

点击阅读全文...

分类：信息时代标签：词向量, Word2Vec, 互信息阅读全文 40 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

唯美星空·梦幻天国(KAGAYA加贺谷穰作品)

《积分公式大全》网络版本

最近的那些事儿...

修改了一下背景音乐

[电子书]《最小作用量原理与物理学的发展》

《转山》，动人之旅

两个惊艳的python库：tqdm和retry

【不可思议的Word2Vec】 4.不一样的“相似”

相似度的定义

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接