包含关键字 2013国赛b 的文章 - 科学空间|Scientific Spaces

Processing math: 100%

7 Feb

你的CRF层的学习率可能不够大

By 苏剑林 | 2020-02-07 | 116409位读者 | 引用

CRF是做序列标注的经典方法，它理论优雅，实际也很有效，如果还不了解CRF的读者欢迎阅读旧作《简明条件随机场CRF介绍（附带纯Keras实现）》。在BERT模型出来之后，也有不少工作探索了BERT+CRF用于序列标注任务的做法。然而，很多实验结果显示（比如论文《BERT Meets Chinese Word Segmentation》）不管是中文分词还是实体识别任务，相比于简单的BERT+Softmax，BERT+CRF似乎并没有带来什么提升，这跟传统的BiLSTM+CRF或CNN+CRF的模型表现并不一样。

基于CRF的4标签分词模型示意图

基于CRF的4标签分词模型示意图

这两天给bert4keras增加了用CRF做中文分词的例子（task_sequence_labeling_cws_crf.py），在调试过程中发现了CRF层可能存在学习不充分的问题，进一步做了几个对比实验，结果显示这可能是CRF在BERT中没什么提升的主要原因，遂在此记录一下分析过程，与大家分享。

点击阅读全文...

分类：信息时代标签：模型, 概率图, crf 阅读全文 44 评论

26 Oct

新词发现的信息熵方法与实现

By 苏剑林 | 2015-10-26 | 120396位读者 | 引用

在本博客的前面文章中，已经简单提到过中文文本处理与挖掘的问题了，中文数据挖掘与英语同类问题中最大的差别是，中文没有空格，如果要较好地完成语言任务，首先得分词。目前流行的分词方法都是基于词库的，然而重要的问题就来了：词库哪里来？人工可以把一些常用的词语收集到词库中，然而这却应付不了层出不穷的新词，尤其是网络新词等——而这往往是语言任务的关键地方。因此，中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材，直接从大规模的语料库中，自动发现可能成词的语言片段。前两天我去小虾的公司膜拜，并且试着加入了他们的一个开发项目中，主要任务就是网络文章处理。因此，补习了一下新词发现的算法知识，参考了Matrix67.com的文章《互联网时代的社会语言学：基于SNS的文本数据挖掘》，尤其是里边的信息熵思想，并且根据他的思路，用Python写了个简单的脚本。

点击阅读全文...

分类：信息时代标签：python, 最大熵, 词库, 新词发现阅读全文 24 评论

31 Dec

网站PR升到3了！

By 苏剑林 | 2009-12-31 | 16371位读者 | 引用

哈哈，在2009年最后一天，还发现了一件好事情：
Spaces.Ac.cn的Google PR已经升到了3了！

建立“科学空间”网站，也可以算是2009年做的最重要、最成功的事情之一了。在“宇宙驿站”的支持下，慢慢地建立起来，然后经过多次转换，从原先的转载到现在的撰写，现在已经基本定型，保持每周至少更新一次。

点击阅读全文...

分类：生活/情感标签：网站阅读全文抢沙发

9 Jan

精确自由落体运动定律的讨论(二)

By 苏剑林 | 2010-01-09 | 61133位读者 | 引用

跳伞过程中的自由落体阶段.jpg

之前在这篇文章中，我们使用过一个牛顿引力场中的自由落体公式：
$t=\sqrt{\frac{r_0}{2GM}}{r_0 \cdot arctg \sqrt{\frac{r_0 -r}{r}}+\sqrt{r(r_0 -r)}}$ ——（1）

我们来尝试一下推导出这个公式来。同时，站长在逐渐深入研究的过程中，发现微分方程极其重要。以前一些我认为不可能解决的问题，都用微分方程逐渐解决了。在以后的文章里，我们将会继续体验到微分方程的伟大魔力！因此，建议各位有志研究物理学的朋友，一定要掌握微分方程，更加深入的，需要用到偏微分方程！

首先，质量为m的物理在距离地心r处的引力为 $\frac{GMm}{r^2}$ ，根据牛顿第二定律F=ma，自然下落的物体所获得的加速度为 $\frac{GM}{r^2}$ 。假设物体从距离地心r开始向地心自由下落，求位移s关于t的函数s=s(t).

点击阅读全文...

分类：数学研究,物理化学标签：引力, 自由落体, 微分方程, 重力阅读全文 10 评论

19 Dec

【NASA每日一图】极光、流星、雪夜

By 苏剑林 | 2009-12-19 | 24685位读者 | 引用

极光、流星、雪夜

(图片说明：极光、流星、雪夜，版权:Bj?rnar G. Hansen)

点击阅读全文...

分类：图片摄影标签：流星, 极光阅读全文抢沙发

20 Dec

【空间天文网】2010年天文月历

By 苏剑林 | 2009-12-20 | 17633位读者 | 引用

这是兄弟网站“空间天文网”原创作品，上面还尽可能详细的标注了与日期对应的天象。精挑细选了6张高质量的天文风光摄影作品。可以作为电脑桌面，也可以打印出来，能够使您在视觉享受的同时了解近期的天象信息在此对“空间天文网”站长表示无限感谢^_^！。

请移步“科学空间相册”阅览：http://album.spaces.ac.cn/?id=20_1

分类：资源共享标签：天象, 月历阅读全文抢沙发

15 Jan

科学空间论坛成立，正式开放！

By 苏剑林 | 2010-01-15 | 19410位读者 | 引用

为了让大家有一个更好的科学交流平台，本站特意弄了一个简洁的讨论社区。在观测日环食之际，正式对广大读者开放。

登录入口：http://bbs.spaces.ac.cn

点击阅读全文...

分类：生活/情感标签：网站, 日环食, 假期阅读全文抢沙发

17 Jan

【竖直上抛】炮弹能够射多高(第二宇宙速度)？

By 苏剑林 | 2010-01-17 | 46707位读者 | 引用

一枚炮弹以速度 $v_0$ 向上射出，只考虑重力因素，请问炮弹到达多远的距离后就会开始自由下落？

大炮的发射

大炮的发射

对于这个问题，我们首先采取的是高中生的做法。考虑地球重力，也就是说炮弹在做加速度为-g（-9.8m/s²）的匀变速运动。根据公式 $v_t^2-v_0^2=2as$ ，可得 $s=\frac{v_0^2}{2g}$ 。
此即炮弹能够走得最远距离。

但是看了这条式子，我们会发现，这个“距离”始终是有限的。换一句话说，只要 $v_0$ 不趋于无穷大，s就不会无穷大。但是我们还听到过牛顿这样说过：假如炮弹以某个速度（就是我们现在所所说的第二宇宙速度）飞离地球，它就永远不会回来了。两者不是矛盾吗？

点击阅读全文...

分类：物理化学标签：上抛, 重力, 宇宙速度阅读全文 7 评论

«
1
...
63
64
65
66
67
68
69
...
151
»

关于站长

苏剑林|BoJone，科学空间博主，【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者（但不专业）......目前32岁，还在单调递增。希望能一直在此分享科学之美～

你也许会关心：

科学空间|Scientific Spaces 介绍

科学空间QQ交流群：67729435

科学空间微信交流群：spaces_ac_cn

常见问题集：《科学空间FAQ》

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

热门标签

随机文章

最近评论

gaoxy: 苏神您好，请问，对于使用一维RoPE训练好的模型，冻结其他参数，仅更换位置编码方式为二维RoP...
leqian: 感谢大佬的博客，决定从vae第一篇博客开始，深入学习和理解一下vae。有一个点不是很明白，重构...
wanderor: Wikipedia 上说 In 1959, Vitold Belevitch observed...
chaofangbianmian: 苏神，“Zq的唯一梯度就是编码表对齐这部分”，关于这句我有个疑问。Zq为什么没有根据重构的梯度...
chaofangbianmian: 苏神，“Zq的唯一梯度就是编码表对齐这部分”，关于这句我有个疑问。Zq为什么没有根据重构的梯度...
leo mao: 第七个公式，为啥不对第一项的K^ 作vq操作呢
My.Sun: hello苏神，想问问你的arxiv和官网同步，是指用了arxiv的API吗？我现在遇到一个情...
Gary Liu: 个人认为生物领域需要先提点而不是加速，涉及到DNA序列、癌症相关，准确才是人们需要的东西，当然...
OGAndy: 舒服了，懂了
WesKwong: 我也觉得有一点奇怪，没看懂q下标的规律，假设 $d=8$ ，那么代入[comment=24584]...