深度学习 - 算法之道

Alg swing 算法的简介

又是一年年底，年终述职总结刚刚完成了，这一年有不足也有进步，新的一年继续加油。先从整理资料开始吧！之前的工作…

前言美团技术博客最近出了一篇文章讲多任务学习，优化的对象是深层转化。上图是论文中给出的一个深层转化的过程图…

问题：Youtube为什么要用这个巨大的softmax多分类来建模，而不是用p(w|user,video)的二…

在看一个大佬向量的解释时候提到召回中的向量的解耦，看完之后有所感触，回想 DSSM 中的实现，跟这描述似乎完全…

新业务线上现在有很多种召回策略，在线和离线都有，使用深度召回期望能召回与用户更相关并且感兴趣的物品。这几天页研…

这个是一个朋友面试时遇到的问题，这个问题个人觉得算是一个开放性的问题，同时需要你对深度学习有着宏观的认识，并且…

tf2.0是要力推keras，最近将之前的代码改造成keras(挤时间自己改的，还在测试)，这中间看着kera…

Bert 最近很火，应该是最近最火爆的 AI 进展，网上的评价很高，那么 Bert 值得这么高的评价吗？我个人…

在CTR预估领域出现了很多模型，之前看过一篇微信文章讲述十大经典CTR模型，DCN就是其中一个模型，估计很多公…

现在TensorFlow是机器学习中最常用的库之一。有时，描述张量图可能是非常有用的，并且知道什么操作需要更多…

这个文章阿里妈妈最近公开的，但是这个算法在MTL领域应该大家都已经使用，只是没人公布出来，如果你多看看MTL的…

之前使用的horovod就是使用ring allreduce的方法实现深度学习并行计算优化，这篇文章主要来源于…

在写这篇文章之前，压根就没使用过 tensorflow 分布式学习，以前日常工作的数据量也不需要这么大的计算资…

最近换了新坑，组里的tensorflow版本基本上都赶到了最新的1.13版本了，我最近写的代码都是基于1.13…

本文简单介绍梯度裁剪(gradient clipping)的方法及其作用，不管在RNN或者在其他网络都是可以使…

输入管道性能指南 GPU 和 TPU 可以从根本上缩短执行单个训练步骤所需的时间。为了实现最佳性能的目的，我们…

GraphKeys tf.GraphKeys包含所有graph collection中的标准集合名，有点像Py…

最近使用keras写了一点代码，输入是正负样本，loss使用的是交叉熵，但是最终我只需要网络对给定的样本的预测…