ESCM分析Part5–思考ips解决pip问题

4,282次阅读

没有评论

共计 672 个字符，预计需要花费 2 分钟才能阅读完成。

提前说一句不太好听的话，其实这个论文这个环节我看的懵逼，不是太懂。公式推理看起来都是对的，从上往下推是可以推的通，但是给我的感觉是说了跟没说一样，还是不太理解正在解决PIP的思路。

所以这篇文章算不上论文解读，应该只是自己的疑问通过文字描述一遍，看看有咩有新的想法。。。。

第一个疑问点，为什么将样本分为k个，这个跟放在一起有什么区别？

ESCM分析Part5–思考ips解决pip问题

说是在第K个盒子里，在点击事件上观测的分布是独立于反事实cvr预估，这个是嘛意思？实在是不理解。

但是看18公式又是比较简单，就是针对 $click=1$ 和 $click=0$ 的样本的loss估计。正常每个盒子里的样本不都是满足这个公式，即使不进行样本划分不都是一样？所以这个样本划分的含义是啥？

然后在看下面的推理哈

ESCM分析Part5–思考ips解决pip问题

19公式其实就是将全空间到K个子空间的转化。

公式20中最后一步转化其实有点疑问， $E_(u,i)[\frac{o_{u,i}}{\hat q_{u,i}}]$ 这个被消除了，对于点击样本 $o_{u,i}=1$ 但是分母应该还是预估值，难道是对所有的点击样本期望是1？这个是ips里调权的参数，就是之前文章里介绍的ctr tower输出的pctr的倒数，这么看也不太是这么回事？

接着就直接得到结论了。。。

ESCM分析Part5–思考ips解决pip问题

反正我还是没看懂啊！

其实说实话到这里IPS的论证是完了，但是究竟IPS真的是做无偏估计？看过之前一个大佬的解释，使用ctr高低来决定样本权重是否真的合理？