• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

2019年06月的内容

RNN模型入门

RNN模型入门

研究这 RNN,还是要为后面的 Attention 相关服务的,以前的工程里面也用过对特征使用 Attention 机制,但是业务场景只是使用而已,最近要去研究 NLP 相关通用能力,与 NLP 相关的基础算法都要去了解一下。这个也不是 RNN 的基础详细解释,毕竟网上的文章都是随处可以看到了,这个也是自己到处看看然后自己做个简单的笔记记录吧!RNN 循……

word2vec到bert发展史

word2vec到bert发展史

Bert 最近很火,应该是最近最火爆的 AI 进展,网上的评价很高,那么 Bert 值得这么高的评价吗?我个人判断是值得。那为什么会有这么高的评价呢?是因为它有重大的理论或者模型创新吗?其实并没有,从模型创新角度看一般,创新不算大。但是架不住效果太好了,基本刷新了很多 NLP 的任务的最好性能,有些任务还被刷爆了,这个才是关键。另外一点是 Bert 具备广泛……

wp高效插件复制粘贴图片上传插件-the paste

博主的 wp 博客文章里面会经常插入好几张图,每次在媒体里面通过点击上传很麻烦,在网上一搜发现插件 the paste这样可以通过复制粘贴的方式实现图片的上传算是神器吧!安装插件之后就会出现上面的效果了,哈哈,这个图片就是我用这种方式上传的哦,是不是很神奇。。。本站下载……

DCN网络浅析

DCN网络浅析

在 CTR 预估领域出现了很多模型,之前看过一篇微信文章讲述十大经典 CTR 模型,DCN 就是其中一个模型,估计很多公司都已经将其应用到自己的业务场景中了。最早的 wide&deep 网络,对 wide 部分特征的要求是很高的,超高维特征加上线性模型是可以去的不错的效果,主要是模型会简单并且可解释性会很好,对于 wide&deep 其实对……

TensorFlow timeline模块使用

现在 TensorFlow 是机器学习中最常用的库之一。有时,描述张量图可能是非常有用的,并且知道什么操作需要更多的时间和更少的时间。这可以用张量流timeline模块完成。如何执行张量流代码的分析。如何从多次会话运行合并时间轴。分析期间可能会出现什么问题,以及如何解决问题使用Timeline对象来获取图中每个节点的执行时间:你使用一个经典的……

ESMM模型CVR预估

ESMM模型CVR预估

这个文章阿里妈妈最近公开的,但是这个算法在 MTL 领域应该大家都已经使用,只是没人公布出来,如果你多看看 MTL 的文章就会发现这篇文章其实没有什么太大的创新,但是既然论文发表出来了并且在工业实践上取得了很好的成绩,所以还是值得肯定的。核心的要点两个方面:权值共享与完备空间这个网络的有一个很好的地方就是子网络可以自由的去定义,可以根据实际的调参情况确定……

Ring Allreduce并行计算优化

之前使用的 horovod 就是使用 ring allreduce 的方法实现深度学习并行计算优化,这篇文章主要来源于转载,部分加上自己的注释。当将神经网络的训练并行化到许多 GPU 上时,你必须选择如何将不同的操作分配到你可用的不同 GPU 上。在这里,我们关注一种称为数据并行随机梯度下降( SGD )的技术。与标准 SGD 一样,梯度下降是通过数据……