算法 - 算法之道

Alg swing 算法的简介

又是一年年底，年终述职总结刚刚完成了，这一年有不足也有进步，新的一年继续加油。先从整理资料开始吧！之前的工作…

这篇文章关于ucb 探索的简介和代码实现，大部分来自网上的一个大佬的文章，然后我试着改了写代码备注，新增了一个…

如果模型的label为连续的概率值，选择什么loss 函数进行学习。抛出这个问题，因为现在在做一个视频推荐的项…

NCE评测指标是facebook以前提出的一个评测ctr模型的指标，中文翻译一下就是归一化交叉信息熵，在提到归…

前言美团技术博客最近出了一篇文章讲多任务学习，优化的对象是深层转化。上图是论文中给出的一个深层转化的过程图…

背景延迟转化应该是很多 cvr 预估场景都会遇到的问题，这个也是用户的行为有很大的关心，本身用户的深层行为是…

首先，DSSM：在这里特指双塔模型；FM自不必说。训练部署大家都懂再来啰嗦下双塔和FM在做召回时，线上的部…

作者：铁心核桃链接：https://www.zhihu.com/question/448924025/ans…

问题：Youtube为什么要用这个巨大的softmax多分类来建模，而不是用p(w|user,video)的二…

在看一个大佬向量的解释时候提到召回中的向量的解耦，看完之后有所感触，回想 DSSM 中的实现，跟这描述似乎完全…

新业务线上现在有很多种召回策略，在线和离线都有，使用深度召回期望能召回与用户更相关并且感兴趣的物品。这几天页研…

引言关于faiss的使用也是在使用embedding相似度召回的时候接触到，的确是一个高效的计算相似度的方案…

引子大名鼎鼎的NLP论文《all in attention》诠释了attention的厉害。attentio…

ID类特征在很多应用场景下都会遇到，电商里面的物品id，信息流里面资讯id,用户的id等等。id 类特征可以直…

百度的Familia提供了工业界主题向量的应用，现在应该很多的工业界项目中会应用到，也取得不错的效果。官方的文…

在前面两篇文章中，我们用一个框架梳理了各大优化算法，并且指出了以Adam为代表的自适应学习率优化算法可能存在的…

在上篇文章中，我们用一个框架来回顾了主流的深度学习优化算法。可以看到，一代又一代的研究者们为了我们能炼（xun…

机器学习界有一群炼丹师，他们每天的日常是：拿来药材（数据），架起八卦炉（模型），点着六味真火（优化算法），就…