包含关键字变分信息瓶颈的文章 - 科学空间|Scientific Spaces

7 Apr

【不可思议的Word2Vec】 3.提取关键词

By 苏剑林 | 2017-04-07 | 219148位读者 | 引用

本文主要是给出了关键词的一种新的定义，并且基于Word2Vec给出了一个实现方案。这种关键词的定义是自然的、合理的，Word2Vec只是一个简化版的实现方案，可以基于同样的定义，换用其他的模型来实现。

说到提取关键词，一般会想到TF-IDF和TextRank，大家是否想过，Word2Vec还可以用来提取关键词？而且，用Word2Vec提取关键词，已经初步含有了语义上的理解，而不仅仅是简单的统计了，而且还是无监督的！

什么是关键词？

诚然，TF-IDF和TextRank是两种提取关键词的很经典的算法，它们都有一定的合理性，但问题是，如果从来没看过这两个算法的读者，会感觉简直是异想天开的结果，估计很难能够从零把它们构造出来。也就是说，这两种算法虽然看上去简单，但并不容易想到。试想一下，没有学过信息相关理论的同学，估计怎么也难以理解为什么IDF要取一个对数？为什么不是其他函数？又有多少读者会破天荒地想到，用PageRank的思路，去判断一个词的重要性？

说到底，问题就在于：提取关键词和文本摘要，看上去都是一个很自然的任务，有谁真正思考过，关键词的定义是什么？这里不是要你去查汉语词典，获得一大堆文字的定义，而是问你数学上的定义。关键词在数学上的合理定义应该是什么？或者说，我们获取关键词的目的是什么？

点击阅读全文...

分类：信息时代标签：词向量, Word2Vec, 语言模型阅读全文 54 评论

23 Jul

BLOG评论故障修复，部分数据丢失

By 苏剑林 | 2009-07-23 | 17399位读者 | 引用

今天一早起来，兴致勃勃地发表着日志，却发现评论用不了了，侧边栏也故障了。
如图：

紧接着，尝试更新缓存、重新安装、换空间，都无法解决。

于是只好到官方网站求助，谁知道发现，只要删除cookies就好了（真冤枉，害我丢失了数据）

点击阅读全文...

分类：生活/情感标签：网站, 故障, 数据阅读全文抢沙发

12 Aug

无穷级数求和的积分审敛法

By 苏剑林 | 2009-08-12 | 45266位读者 | 引用

这是我研究级数求和的时候的一个猜测，现在已经发现为正确的。

存在级数 $\sum_{x=1}^{\infty} f(x)$ ，若有

$\lim_{x -> \infty } \int f(x)dx -> \infty$ ，则该级数发散。

如果 $\lim_{x -> \infty } \int f(x)dx$ 收敛，则该级数收敛。

点击阅读全文...

分类：数学研究标签：级数, 求和, 积分阅读全文 2 评论

28 Mar

分享：用LaTeX+MathJax画一个三维三阶环方

By 苏剑林 | 2019-03-28 | 20339位读者 | 引用

昨天看到数学研发论坛在讨论三维三阶幻方，论坛里的各大牛都已经讨论得差不多了，我也没什么好插话的。然后突发奇想，能不能用纯LaTeX画出一个这样的立体幻方出来？

昨天下午折腾了好一会儿，最后只抛出了个半成品，然后经过论坛的mathe大佬继续完善后，终于成功地画出来了：
$\begin{array}{ccccccccccc} & & & & 4 & —& —& — & — & 25 & —& —& — & — & 11 \\ & & & \require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & && &\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} && &&\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} &| \\ & & 14 & — & — & —& — & 22 & — & — & — & —& 7 & & | \\ & \require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}}& &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & &\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}}& & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}}&&\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} & | & & | \\ 24 & — & —& —& — & 1 & —& —& — & — & 18 & & | & & |\\ |& & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & &\color{red}{13} &| & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} &\color{red}{27} & | & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & | &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&5\\ |& & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & \require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & | & & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} &| & & |&\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} &|\\ |& & \color{red}{8} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}& | &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \color{red}{12} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}& | &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&22&&|\\ |&\require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & | &\require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}}& | &\require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|} & | &&|\\ 15 & — & —& —& — & 3 & — & — & —& —& 21 & & | & &|\\ |& & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & & \color{red}{9} &| &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \color{red}{26} &|&\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&|&\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&6\\ |& & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}}&\require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} & &| & &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\vdots}} &\require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} &&|&&|&\style{display: inline-block; transform: rotate(45deg)}{|}\\ |& &\color{red}{16} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}} &|&\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}& \color{red}{8} &\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&\require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}& | & \require{HTML} \style{display: inline-block; opacity:0.5;}{\color{red}{\cdots}}&17\\ |& \require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}}& & & &|& \require{HTML} \style{display: inline-block; transform: rotate(45deg); opacity:0.5;}{\color{red}{\vdots}} &&&& | & \require{HTML} \style{display: inline-block; transform: rotate(45deg)}{|}\\ 23 & — & — & — & — & 2 & — & — & — & — & 19\\ \end{array}$

事实上代码里边还内嵌了一些HTML代码，所以不算是严格的纯LaTeX代码，应该说是LaTeX+MathJax的结合。

分类：数学研究标签：趣味, 幻方, 分享阅读全文抢沙发

7 Jul

百科翻译：草原上的狐狸（Swift Fox）

By 苏剑林 | 2009-07-07 | 40487位读者 | 引用

“维基百科”翻译又开始了，这次我们来关注下北美洲的一种珍贵动物——草原狐。
这个条目在中文的维基上没有出现过，但英文上有，现在我把它翻译过来了。由于只有两年的初中生物学习经验，所以一定有很多翻译不当的地方，请大家多提意见！谢谢

图片说明：草原狐，来自“维击百科”

点击阅读全文...

分类：生物自然标签：翻译, 动物, 维基, 狐狸, 草原阅读全文 2 评论

29 Jul

科学空间：2009年8月重要天象

By 苏剑林 | 2009-07-29 | 33409位读者 | 引用

日食之后的八月，精彩天象仍将不断上演。英仙座流星雨将在本月出现极大，这同时也拉开了下半年流星雨季的大幕。木星和海王星冲日以及水星东大距等天象，将使行星观测再次成为热点。

观测关注：

太阳由巨蟹座运行到狮子座
01日月掩心宿二
06日南宝瓶座ι流星雨极大（ZHR=2）
07日木星合月
11日土星环消失（从太阳的方向看倾角为0）
12日北宝瓶座δ流星雨极大（ZHR=5-10）
13日英仙座流星雨极大（01:30-04:00, ZHR=100）
15日木星冲日
16日火星合月
17日天鹅座κ流星雨极大（ZHR=3）
18日金星合月；海王星冲日
20日北宝瓶座ι流星雨极大
25日水星东大距
28日月掩心宿二

点击阅读全文...

分类：天文探索标签：天象, 2009, 观测阅读全文 2 评论

7 Aug

湖泊沉积物引来争议：是否彗星造成冰期灾难？

By 苏剑林 | 2009-08-07 | 18715位读者 | 引用

笔者：翻译完这篇文章，感觉可以用一个字来形容：累！的确，这篇文章的不少句子都让人很模糊，我也只是意译+请教+google出来的，有任何的错误欢迎指出！翻译过程中，不断地使用了词典、Google，加上向人请教，才勉强完成了。 冰期、史前文明、灭绝、天体撞击，这些被谈论得越来越多了，究竟真相如何呢？又或者会不会发生在我们的将来呢？

点击阅读全文...

分类：生物自然标签：彗星, 翻译, 沉积物, 冰期阅读全文 31 评论

16 Aug

电脑修好了，Blog正常更新

By 苏剑林 | 2009-08-16 | 20385位读者 | 引用

前两天电脑被我随便设置弄“坏”了，昨天折腾了一整天，没有办法，今天送到专卖店修理，不到三分钟，OK！.....

病症：

电脑能够启动，但是启动前那一声尖锐的“嘟”不见了，鼠标、键盘都不亮，显示器无信号。总而言之，就是主机仿佛停止了与外界的一切联系。

点击阅读全文...

分类：生活/情感标签：网站, 电脑, 故障阅读全文 1 评论

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

【不可思议的Word2Vec】 3.提取关键词

什么是关键词？

BLOG评论故障修复，部分数据丢失

无穷级数求和的积分审敛法

分享：用LaTeX+MathJax画一个三维三阶环方

百科翻译：草原上的狐狸（Swift Fox）

科学空间：2009年8月重要天象

湖泊沉积物引来争议：是否彗星造成冰期灾难？

电脑修好了，Blog正常更新

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接