包含关键字 KL散度的文章 - 科学空间|Scientific Spaces

7 Feb

你的CRF层的学习率可能不够大

By 苏剑林 | 2020-02-07 | 96727位读者 | 引用

CRF是做序列标注的经典方法，它理论优雅，实际也很有效，如果还不了解CRF的读者欢迎阅读旧作《简明条件随机场CRF介绍（附带纯Keras实现）》。在BERT模型出来之后，也有不少工作探索了BERT+CRF用于序列标注任务的做法。然而，很多实验结果显示（比如论文《BERT Meets Chinese Word Segmentation》）不管是中文分词还是实体识别任务，相比于简单的BERT+Softmax，BERT+CRF似乎并没有带来什么提升，这跟传统的BiLSTM+CRF或CNN+CRF的模型表现并不一样。

基于CRF的4标签分词模型示意图

这两天给bert4keras增加了用CRF做中文分词的例子（task_sequence_labeling_cws_crf.py），在调试过程中发现了CRF层可能存在学习不充分的问题，进一步做了几个对比实验，结果显示这可能是CRF在BERT中没什么提升的主要原因，遂在此记录一下分析过程，与大家分享。

点击阅读全文...

分类：信息时代标签：模型, 概率图, crf 阅读全文 44 评论

26 Oct

新词发现的信息熵方法与实现

By 苏剑林 | 2015-10-26 | 104224位读者 | 引用

在本博客的前面文章中，已经简单提到过中文文本处理与挖掘的问题了，中文数据挖掘与英语同类问题中最大的差别是，中文没有空格，如果要较好地完成语言任务，首先得分词。目前流行的分词方法都是基于词库的，然而重要的问题就来了：词库哪里来？人工可以把一些常用的词语收集到词库中，然而这却应付不了层出不穷的新词，尤其是网络新词等——而这往往是语言任务的关键地方。因此，中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材，直接从大规模的语料库中，自动发现可能成词的语言片段。前两天我去小虾的公司膜拜，并且试着加入了他们的一个开发项目中，主要任务就是网络文章处理。因此，补习了一下新词发现的算法知识，参考了Matrix67.com的文章《互联网时代的社会语言学：基于SNS的文本数据挖掘》，尤其是里边的信息熵思想，并且根据他的思路，用Python写了个简单的脚本。

点击阅读全文...

分类：信息时代标签：python, 最大熵, 词库, 新词发现阅读全文 24 评论

9 Jan

精确自由落体运动定律的讨论(二)

By 苏剑林 | 2010-01-09 | 52867位读者 | 引用

之前在这篇文章中，我们使用过一个牛顿引力场中的自由落体公式：
$t=\sqrt{\frac{r_0}{2GM}}{r_0 \cdot arctg \sqrt{\frac{r_0 -r}{r}}+\sqrt{r(r_0 -r)}}$——（1）

我们来尝试一下推导出这个公式来。同时，站长在逐渐深入研究的过程中，发现微分方程极其重要。以前一些我认为不可能解决的问题，都用微分方程逐渐解决了。在以后的文章里，我们将会继续体验到微分方程的伟大魔力！因此，建议各位有志研究物理学的朋友，一定要掌握微分方程，更加深入的，需要用到偏微分方程！

首先，质量为m的物理在距离地心r处的引力为$\frac{GMm}{r^2}$，根据牛顿第二定律F=ma，自然下落的物体所获得的加速度为$\frac{GM}{r^2}$。假设物体从距离地心r开始向地心自由下落，求位移s关于t的函数s=s(t).

点击阅读全文...

分类：数学研究,物理化学标签：引力, 自由落体, 微分方程, 重力阅读全文 10 评论

5 Dec

科学空间：2009年12月重要天象

By 苏剑林 | 2009-12-05 | 21907位读者 | 引用

由于备战考试，这篇预报姗姗来迟。现在，终于可以跟大家见面了。2009年最后一月的夜空，并没有因为严冬的到来而显得冷清。精彩天象将接踵而来，想必寒冷的天气挡不住天文爱好者的热情。当然，光有热情还不够，防寒的措施一定要做好，要是为了一夜观测而吊上一周的点滴，那就不大好了。

12月22日是冬至节气，意味着北半球到了黑夜最长的时段，可观测时间也达到了最长！在这里我也希望大家合理安排观测时间，注意休息，切勿过于疲劳。愿大家在最好的一个月中，能够更好地享受天文的乐趣，以此完美地结束这个天文年！

点击阅读全文...

分类：天文探索标签：行星, 天象, 2009, 流星, 观测, 预测阅读全文抢沙发

8 Dec

哥本哈根气候大会召开情况

By 苏剑林 | 2009-12-08 | 15801位读者 | 引用

开始了，成与否，期待吧！
我们能够做的，也只有期待......

简介
12月7日起，192个国家的环境部长和其他官员们将在哥本哈根召开联合国气候会议，商讨《京都议定书》一期承诺到期后的后续方案，就未来应对气候变化的全球行动签署新的协议。这是继《京都议定书》后又一具有划时代意义的全球气候协议书，毫无疑问，对地球今后的气候变化走向产生决定性的影响。这是一次被喻为“拯救人类的最后一次机会”的会议。会议将在现代化的Bella中心举行，为期两周。联合国气候会议一年召开一次，其前身为1992年在里约热内卢召开的地球峰会，地球峰会的目的是协调应对气候变化而采取的国际行动。

点击阅读全文...

分类：生物自然标签：转载, 气候阅读全文抢沙发

20 Dec

哥本哈根没有“句号”，留下一个“逗号”

By 苏剑林 | 2009-12-20 | 15741位读者 | 引用

结束了，大会结束了。

多少记者、志愿者、领导人，都经过了N个不眠之夜。在此向他们致敬！

这次会议是否成功，还是读者自己来判断吧。

气候变化大会在发布《哥本哈根协议》后闭幕

总之一切才刚刚开始，还没有出现“。”，只有“，”。这场气候战注定了会很艰辛。这一次会议通过了一份并通过《哥本哈根协定》（提供下载），而下一年的会议将会在墨西哥举行。

还是让我们来看看相关报道好了。

点击阅读全文...

分类：生物自然标签：气候阅读全文抢沙发

26 Dec

新年新天象：2010年1月重要天象

By 苏剑林 | 2009-12-26 | 20699位读者 | 引用

带着鼓励与期待，科学空间迈入了新的一年。虽然天文年已经过去，但是天文不会过去。2010年仍将是精彩天象不断上演的一年，科学空间会一如既往地带给大家准确、丰富的天象信息，为大家的天文观测提供一点点有用信息。同时在此祝大家新的一年里更加开心快乐、更上一层楼！

点击阅读全文...

分类：天文探索标签：天象, 观测, 2010 阅读全文抢沙发

26 Dec

精确自由落体运动定律的讨论

By 苏剑林 | 2009-12-26 | 37182位读者 | 引用

在初中或高中，自由落体试验简单地用这个公式来描述出来：
$$s=1/2 g t^2$$
其中$g=9.8m//s^2$，等于1kg物体在地球表面所受的重力。
但是这个公式很明显有一个问题，就是实际上在地球，g不是恒定的，会随着距离（即海拔高度）的变化而变化，上述公式能够在一定范围内描述自然落体运动。但是当距离很大时，公式便失效了。

点击阅读全文...

分类：物理化学标签：引力, 奥赛, 运动, 力学, 重力阅读全文 5 评论

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前31岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

科学空间|Scientific Spaces

你的CRF层的学习率可能不够大

新词发现的信息熵方法与实现

精确自由落体运动定律的讨论(二)

科学空间：2009年12月重要天象

哥本哈根气候大会召开情况

哥本哈根没有“句号”，留下一个“逗号”

新年新天象：2010年1月重要天象

精确自由落体运动定律的讨论

关于站长

智能搜索

热门标签

随机文章

最近评论

友情链接