10 Apr

分享一次专业领域词汇的无监督挖掘

去年 Data Fountain 曾举办了一个“电力专业领域词汇挖掘”的比赛,该比赛有意思的地方在于它是一个“无监督”的比赛,也就是说它考验的是从大量的语料中无监督挖掘专业词汇的能力。

这个显然确实是工业界比较有价值的一个能力,又想着我之前也在无监督新词发现中做过一定的研究,加之“无监督比赛”的新颖性,所以当时毫不犹豫地参加了,然而最终排名并不靠前~

不管怎样,还是分享一下我自己的做法,这是一个真正意义上的无监督做法,也许会对部分读者有些参考价值。

基准对比

首先,新词发现部分,用到了我自己写的库nlp zero,基本思路是先分别对“比赛所给语料”、“自己爬的一部分百科百科语料”做新词发现,然后两者进行对比,就能找到一批“比赛所给语料”的特征词。

点击阅读全文...

14 Dec

基于Conditional Layer Normalization的条件文本生成

从文章《从语言模型到Seq2Seq:Transformer如戏,全靠Mask》中我们可以知道,只要配合适当的Attention Mask,Bert(或者其他Transformer模型)就可以用来做无条件生成(Language Model)和序列翻译(Seq2Seq)任务。

可如果是有条件生成呢?比如控制文本的类别,按类别随机生成文本,也就是Conditional Language Model;又比如传入一副图像,来生成一段相关的文本描述,也就是Image Caption。

相关工作

八月份的论文《Encoder-Agnostic Adaptation for Conditional Language Generation》比较系统地分析了利用预训练模型做条件生成的几种方案;九月份有一篇论文《CTRL: A Conditional Transformer Language Model for Controllable Generation》提供了一个基于条件生成来预训练的模型,不过这本质还是跟GPT一样的语言模型,只能以文字输入为条件;而最近的论文《Plug and Play Language Models: a Simple Approach to Controlled Text Generation》将$p(x|y)$转化为$p(x)p(y|x)$来探究基于预训练模型的条件生成。

条件Normalization示意图

条件Normalization示意图

不过这些经典工作都不是本文要介绍的。本文关注的是以一个固定长度的向量作为条件的文本生成的场景,而方法是Conditional Layer Normalization——把条件融合到Layer Normalization的$\beta$和$\gamma$中去。

点击阅读全文...

18 Jul

日全食多路联合直播频道

正式直播活动计划于北京时间7月22日7时30分开始,11时30分结束,持续约4个小时。

(观看请安装PPlive插件,只能用IE或者IE内核浏览器观看)

 

简介:

点击阅读全文...

29 Jul

生活中的趣味数学:同一天生日概率有多大

新浪科技讯 北京时间7月28日消息,据国外媒体报道,数学经常会让聪明人感觉自己笨得不行,有时甚至会让他们很生气。

事实上,数学本身非常有趣,它是我们日常生活的一部分,每个人都能从中获得享受。只不过在课堂上,数学被一些死板的老师教死板了。以下就是英国《每日邮报》最近公布的日常生活中的趣味数学:

你身上的计算器

从左到右给你的手指编

从左到右给你的手指编

点击阅读全文...

6 Aug

逻辑推理:拿了多少分(PuzzleUp)

A,B,C,D四人做10道回答是否的问题,答对了得一分,四人的答案和A,B,C的得分如图所示。问D的得分是多少?(附加说明:这里的答错不扣分)

事实上,这道题目本身已经把难度降到非常低了,因此推荐大家都去想一下。
如果你实在没有心思去想,可以直接看答案(不推荐)。

点击阅读全文...

31 Oct

“战神”升空看它到底有多神?

美国当地时间28日上午11时30分(北京时间昨晚11时30分),虽然海上的薄雾还未散去,美国宇航局的“战神Ⅰ-X”火箭在佛罗里达肯尼迪航天中心咆哮着发射升空。它是人类有史以来威力最大的火箭,这也是肯尼迪航天中心发出的最大的声音。

“战神I-X”火箭

“战神I-X”火箭

“阿波罗11号”从这里登月40年之后,肯尼迪航天中心决心再次登月,这是美国重返月球的第一步。

点击阅读全文...

17 Jan

【竖直上抛】炮弹能够射多高(第二宇宙速度)?

一枚炮弹以速度$v_0$向上射出,只考虑重力因素,请问炮弹到达多远的距离后就会开始自由下落?

大炮的发射

大炮的发射

对于这个问题,我们首先采取的是高中生的做法。考虑地球重力,也就是说炮弹在做加速度为-g(-9.8m/s2)的匀变速运动。根据公式$v_t^2-v_0^2=2as$,可得$s=\frac{v_0^2}{2g}$。
此即炮弹能够走得最远距离。

但是看了这条式子,我们会发现,这个“距离”始终是有限的。换一句话说,只要$v_0$不趋于无穷大,s就不会无穷大。但是我们还听到过牛顿这样说过:假如炮弹以某个速度(就是我们现在所所说的第二宇宙速度)飞离地球,它就永远不会回来了。两者不是矛盾吗?

点击阅读全文...

23 Jan

【龟猫记】家里多了几只小动物

两只小乌龟

两只小乌龟

寒假到了,黄老师说今年回老家去看看,所以把他宿舍里的几只小动物都家养在我家里了。其中有两只小乌龟,一只小猫。(喵喵喵...)

这个假期可以好好地近距离接触和观察小动物了。

小动物们都挺听话的,很是可爱,只是希望在下学期回来之后,老师不会看到成功减肥的猫。(^_^)

不多说了,先上图,瞧瞧它们(乡下地方,很简陋,见笑了)——

点击阅读全文...