18
Aug
I care ! 我在乎,我行动!| 绿色和平
By 苏剑林 | 2009-08-18 | 24759位读者 | 引用
8
Oct
《哈勃太空望远镜超高清原始片源》VeryCD资源
By 苏剑林 | 2009-10-08 | 32979位读者 | 引用
1
Nov
本站域名Spaces.Ac.Cn的PR为2了
By 苏剑林 | 2009-11-01 | 24733位读者 | 引用
22
Nov
测试一个强悍的功能——ScienceWord
By 苏剑林 | 2009-11-22 | 39526位读者 | 引用
7
Feb
你的CRF层的学习率可能不够大
By 苏剑林 | 2020-02-07 | 103976位读者 | 引用CRF是做序列标注的经典方法,它理论优雅,实际也很有效,如果还不了解CRF的读者欢迎阅读旧作《简明条件随机场CRF介绍(附带纯Keras实现)》。在BERT模型出来之后,也有不少工作探索了BERT+CRF用于序列标注任务的做法。然而,很多实验结果显示(比如论文《BERT Meets Chinese Word Segmentation》)不管是中文分词还是实体识别任务,相比于简单的BERT+Softmax,BERT+CRF似乎并没有带来什么提升,这跟传统的BiLSTM+CRF或CNN+CRF的模型表现并不一样。
这两天给bert4keras增加了用CRF做中文分词的例子(task_sequence_labeling_cws_crf.py),在调试过程中发现了CRF层可能存在学习不充分的问题,进一步做了几个对比实验,结果显示这可能是CRF在BERT中没什么提升的主要原因,遂在此记录一下分析过程,与大家分享。
30
Jan
【NASA每日一图】Messier 88
By 苏剑林 | 2010-01-30 | 20374位读者 | 引用
1
Feb
最近评论