粗排第四讲

4,491次阅读

没有评论

共计 745 个字符，预计需要花费 2 分钟才能阅读完成。

粗排第四讲

这一讲算是粗排后续的总结篇，之前三讲的时候就已经介绍了粗排层的整体设计方案。

一般情况下都是物料特别多的时候。。。

1、数据本身的迭代，都说数据是模型的天花板

2、模型本身的迭代，比如之前说到的双塔模型本身的迭代，比如wide&deep的双塔，这块关于双塔迭代知乎上有篇石塔西文章可以参考。

3、粗排学习精排的序，粗排精排化，从阿里的cold来看，这个方向也是一个趋势

4、回归粗排本身，这就是关注到粗排到本身只是构建一个topk集合

但是目前到现状都是在1，2，3发力，至于4也是一个方向。

1、最近在冷启动这块，看到了一个2017年的论文 DropoutNet ，其实这个的架构也是一个双塔的架构，这里无非在输入和中间结构上有点改动，但是还是分成用户塔和物料塔，这个网络是通过dropout的方式，淡化行为交互信息，以自身属性为出发点，说白了就是基于基础属性做的冷启动推荐。然而这一点不就是契合冷启动嘛！

2、召回模块，大名鼎鼎的dssm和YouTube DNN网络都是召回届经典的网络，然后AirBnb 和 Facebook 都做了一些改进，AirBnb从业务的角度出发详细介绍他们在数据方面的trick，值得借鉴思考。Facebook整了多个塔，两个不够，多个来添。之前张俊林老师来我司交流对比学习的时候，有同学也提到了这个多塔是否有必要，张老师的回答是没觉得多塔有什么创新，是不是该试试senet了，嘿嘿

3、粗排，在之前的几个文章讲的比较详细可以去看看

这里只是简单的介绍了双塔的一些适用场景，改进的方法在上一段的也提到过，有兴趣的可以看看。

在一个大规模的推荐系统中，粗排一般情况下都是在的，之前的聊的的一些方法还是需要AB测试来告诉我们最后的答案。

正文完

请博主喝杯咖啡吧！