• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

redis_py_cluster读取redis遇到too many connections问题

最近项目中需要自己去往 redis 里面写数据,redis 集群读写需要使用到 redis_py_cluster 这个 python 包,这中间遇到不少问题,其中就有数据序列化问题,有人使用 spark 中的 json 序列化方式,与 python 还不兼容,最后是不序列化直接存字符串的方式解决了不同语言之间的兼容问题,但是自己在读写 redis 的时候遇到……

Keras从零学习-函数式多输入与多输出-0x05

在工程实践中单输入的场景还是比较少的,这种单输入的理解仅是单个 Input,并不是特征为 1 哈。关于多输入这块还是有点歧义,比如我们有多种类型的特征,那么每一种特征处理的方式不一样,在工程实现也是使用多个 Input 来实现,可以参考我之前写的这篇文章keras 多输入官网给了一个例子,tweet 预测赞数的一个例子,在给出的模型中是定义了两个单独的输……

Keras从零学习-函数式模型-0x4

序列模型的好处就是简单易理解,上一篇文章介绍了序列模型的简单使用模型定义序列模型但是函数式模型定义会让你定义模型更加灵活。为什么称之为函数式,是因为你发现你在定义网路的时候就是在写各种函数的调用,所以看起来就是不断调用的函数来操作神经网络。先看一个简单的例子(来源 keras 官网)from keras.layers import Input, Den……

Keras从零学习-模型定义(序列模型)-0x03

之前的文章是使用感知机作为引导,文章中也涉及到一点点的 keras 代码示例,从这篇开始主要以讲解 keras 代码为主,暂时主要讲解 api 的使用,如果涉及到很低层的原理相关,我自己理解多少会写多少,水平有限。回到正题,这一节主要是讲一下 Keras 定义模型的第一种方法:序列模型定义你可以把它当做一个流水线你定义的模型就是按照流水线的方式,一……

Keras从零学习-多层感知机-0x02

多层感知机顾名思义,相比于单层感知机多了很多网络层,可以参考下图:上面图中中间插入了两层网络,在 DL 中又称之为隐层,与之相关的名词就是输入层和输出层。感知机输出的结果非 0 即 1,对于结果的判断存在很大的跳跃,这中间没有任何的过度。从数据层面来说,你的数据特征如果波动一点可能输出的结果就会从 0 到 1,所以在做推理预测的时候有的时候会发现一……

Keras从零学习-感知机-0x01

学习神经网络一般都是从感知机开始着手学习,那先从 keras 构建一个感知机开始。感知机算法的原理比较简单上面的公式中 w 对应着权重,x 就是你输入的特征,比如广告的分类信息,b 表示偏置信息。当然满足条件大于 0 则为 1 否则为 0.这里引入一个激活函数的概念,单层感知器使用的是 sign 符号函数,如果改为 sigmoid 函数那么就与逻辑……

keras从零学习-安装指引-0x00

安装方法在安装 Keras 之前,请安装以下后端引擎之一:TensorFlow,Theano,或者 CNTK。我们推荐 TensorFlow 后端。如果你要从源码上编译可以参考这篇文 mac 下编译 tensorflow你也可以考虑安装以下可选依赖:cuDNN (如果你计划在 GPU 上运行 Keras,建议安装)。HDF5 和 h5py (如果……

关于subprocess执行脚本输出定向问题

博主使用这个模块,主要想利用这个去循环执行 hive 脚本,调用 shell 去执行,同时也要适当的时候将结果输出到指定的位置。一、subprocess运行 python 的时候,我们都是在创建并运行一个进程。subprocess.call()父进程等待子进程完成返回退出信息(returncode,相当于 Linux exit code)subp……

hive调优记录

hive调优记录

最近有场讲座是关于 hive 的一个培训,也去听了一下,其中的某些点还是自己的盲区,平时也没注意到这些地方的优化,这些还是比较重要的,特此记录一下。并行优化set hive.exec.parallel=true;    //开启任务并行执行假设你有两个子查询然后需要 join 关联处理,并且两个子查询之间没有任何的关联,这个时候两个子查询可以并行执……

Hive之行转列lateral view用法

Hive之行转列lateral view用法

一般写 sql 经常会遇到行转列或者列转行之类的操作,就像 concat_ws 之类的函数被广泛的使用,今天这个也是经常要使用的拓展方法。Lateral View 语法lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias……

Embedding向量化的一些理解

Embedding向量化的一些理解

:grin:有个同事某一天问我 embedding 向量化的过程,巴拉巴拉一堆,在日常写代码就两步构建向量矩阵查询但是向量化的真正意图是什么?或者说为什么要进行向量化?个人觉得应该先从 onehot 说起,在日常的工程中经常会遇到各种各样的 id 类特征,这些特征类别量很大,比如用户的 id 会有好多亿,如果你直接使用 onehot 那么你的特征……

关于keras多输入的一些问题

tf2.0 是要力推 keras,最近将之前的代码改造成 keras(挤时间自己改的,还在测试),这中间看着 keras 官方文档加上搜索,有些点其实还是存在一定的疑问。其实主要的问题就是在这模型输入输出这块,keras 在构造网络这块还是比较简单的,看着官网的例子关于函数式 api 提供的例子都是非常的简单。基本上套路就是一个 Input 然后 FC ……

GRU原理白话解析

GRU原理白话解析

接上一篇描述 RNN 网络说道 gradient vanish 的问题,要解决这个问题,那么 gru/lstm 是解决其问题的,说的抽象一点是解决这个问题,实在一点就是要解决记忆问题。基本原理假设给你一个很长很长的文章,一开始你读了很多行还记得前面写了啥,大概描述内容都记得,但是越往后面渐渐的你发现之前的内容是啥记得不太清了,gru 就可以帮助你一直记住……

MTL有效性

MTL有效性

我们假设我们有两个相关的任务 A 和 B,依赖一个共享的隐藏层表示 F。1、Implicit data augmentationMTL 可以有效增加用于模型训练的样本量。由于所有任务难免会有一些噪声,当我们在任务 A 上训练模型, 我们的目标是学习针对任务 A 的一个好的表示,可以完全避免依赖数据的噪音,而且泛化效果好。由于不同的任务有不同的噪声模式,一……

网站图标下载

网站图标下载

不知从何时起有不少人邮件问我网站的鼠标图片之类的资源,今天就打包一份供下载,文末回复刷新即可下载相关附件(ps:骗一波回复)亚丝娜镇楼……

RNN模型入门

RNN模型入门

研究这 RNN,还是要为后面的 Attention 相关服务的,以前的工程里面也用过对特征使用 Attention 机制,但是业务场景只是使用而已,最近要去研究 NLP 相关通用能力,与 NLP 相关的基础算法都要去了解一下。这个也不是 RNN 的基础详细解释,毕竟网上的文章都是随处可以看到了,这个也是自己到处看看然后自己做个简单的笔记记录吧!RNN 循……

word2vec到bert发展史

word2vec到bert发展史

Bert 最近很火,应该是最近最火爆的 AI 进展,网上的评价很高,那么 Bert 值得这么高的评价吗?我个人判断是值得。那为什么会有这么高的评价呢?是因为它有重大的理论或者模型创新吗?其实并没有,从模型创新角度看一般,创新不算大。但是架不住效果太好了,基本刷新了很多 NLP 的任务的最好性能,有些任务还被刷爆了,这个才是关键。另外一点是 Bert 具备广泛……

wp高效插件复制粘贴图片上传插件-the paste

博主的 wp 博客文章里面会经常插入好几张图,每次在媒体里面通过点击上传很麻烦,在网上一搜发现插件 the paste这样可以通过复制粘贴的方式实现图片的上传算是神器吧!安装插件之后就会出现上面的效果了,哈哈,这个图片就是我用这种方式上传的哦,是不是很神奇。。。本站下载……