19
Jun
简述无偏估计和有偏估计
By 苏剑林 | 2019-06-19 | 89234位读者 | 引用
13
Jun
“噪声对比估计”杂谈:曲径通幽之妙
By 苏剑林 | 2018-06-13 | 199201位读者 | 引用说到噪声对比估计,或者“负采样”,大家可能立马就想到了Word2Vec。事实上,它的含义远不止于此,噪音对比估计(NCE, Noise Contrastive Estimation)是一个迂回但却异常精美的技巧,它使得我们在没法直接完成归一化因子(也叫配分函数)的计算时,就能够去估算出概率分布的参数。本文就让我们来欣赏一下NCE的曲径通幽般的美妙。
注:由于出发点不同,本文所介绍的“噪声对比估计”实际上更偏向于所谓的“负采样”技巧,但两者本质上是一样的,在此不作区分。
问题起源
问题的根源是难分难舍的指数概率分布~
指数族分布
在很多问题中都会出现指数族分布,即对于某个变量x的概率p(x),我们将其写成
p(x)=eG(x)Z
其中G(x)是x的某个“能量”函数,而Z=∑xeG(x)则是归一化常数,也叫配分函数。这种分布也称为“玻尔兹曼分布”。
最近评论