ID类特征在很多应用场景下都会遇到,电商里面的物品id,信息流里面资讯id,用户的id等等。id 类特征可以直…
最近在看一些图像去重的一些方法,网上一搜就会看到phash、dhash和ahash等基于哈希方法的去重算法,这…
百度的Familia提供了工业界主题向量的应用,现在应该很多的工业界项目中会应用到,也取得不错的效果。官方的文…
在前面两篇文章中,我们用一个框架梳理了各大优化算法,并且指出了以Adam为代表的自适应学习率优化算法可能存在的…
在上篇文章中,我们用一个框架来回顾了主流的深度学习优化算法。可以看到,一代又一代的研究者们为了我们能炼(xun…
机器学习界有一群炼丹师,他们每天的日常是: 拿来药材(数据),架起八卦炉(模型),点着六味真火(优化算法),就…
这个是一个朋友面试时遇到的问题,这个问题个人觉得算是一个开放性的问题,同时需要你对深度学习有着宏观的认识,并且…
:grin:有个同事某一天问我embedding向量化的过程,巴拉巴拉一堆,在日常写代码就两步 构建向量矩阵 …
接上一篇描述RNN网络说道gradient vanish的问题,要解决这个问题,那么gru/lstm是解决其问…
我们假设我们有两个相关的任务A和B,依赖一个共享的隐藏层表示F。 1、Implicit data augmen…
研究这RNN,还是要为后面的Attention相关服务的,以前的工程里面也用过对特征使用Attention机制…
Bert 最近很火,应该是最近最火爆的 AI 进展,网上的评价很高,那么 Bert 值得这么高的评价吗?我个人…
在CTR预估领域出现了很多模型,之前看过一篇微信文章讲述十大经典CTR模型,DCN就是其中一个模型,估计很多公…
这两天组里有同事在做特征分析这块的工作的时候其实会涉及到特征共线性问题,所以趁这个机会也去理解一下这个概念,说…
本文主要是参考了http://blog.echen.me/2011/07/18/introduction-to…
Xgbfi 用于训练好的xgboost模型分析对应特征的重要性,当然你也可以使用fmap来观察 What is…
对于召回的一些数据如何给这些数据来排名,然后根据这个排名来显示数据,这就需要使用“威尔逊区间”了。 首先我们讨…
简单介绍一下吧,lightgbm是微软推出的gbdt相关的机器学习库,一开源就受到很多开发者的喜爱吧,主要是运…