NCE评测指标理解

3,766次阅读

共计 644 个字符，预计需要花费 2 分钟才能阅读完成。

NCE评测指标是facebook以前提出的一个评测ctr模型的指标，中文翻译一下就是归一化交叉信息熵，在提到归一化之前，基本上ctr模型都是交叉熵作为模型优化的loss。先给出归一化交叉熵原文的介绍。

NCE评测指标理解

原文关于这个的解释我有点翻译不过来，偷懒直接贴图了。有兴趣的可以直接看这个图。

看公示的理解，不是难理解，分子就是预估的交叉熵， $p_i$ 是模型预估的pctr，分母是真实的交叉熵，p就是样本的真实的ctr。

ok，一开始看到这我其实还不太理解这个的含义，觉得这个只是做了一个标准化，有什么意义？

第一步假设 $p_i$ 跟真实的p是一模一样相等，那么意味分子分母的值就是一样的了，这个是怎么计算的？

计算的方式就是外边的求和相拆分到里面去，下面给出前面一项的举例说明：

$-\frac{1}{N}\sum_{i=1}^{n}\frac{1+y_i}{2}log(p_i)=-p*log(p)$

那这样的含义是什么？如果出现这样，那么所有的正负样本的预估值都是一样的，那么就没有任何意义了，模型也是懒得不行了。这应该是最差的情况了。这个时候计算的归一化交叉熵就是1，所以如果你模型得到的值是这样的话应该是有问题。

那么它对应的一个极端的情况就是，每一个样本都是完完全全预估正确，那么对应的分子就是 0了，所以得到的值就是 0，所以这个NCE的范围应该是在0-1之间。理论上数值越小越好，越接近于 0的极端就是完全预估正确当然是更好啰。

以上就是自己看了之后一些理解，没有照搬原文的翻译，希望能帮助理解吧！

正文完

请博主喝杯咖啡吧！

发表至： Alg

2021-12-06

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

升级WordPress时提示”另一更新正在进行”