admin
互联网行业码农一枚/业余铲屎官/数码影音爱好者/二次元
文章 747
bigdata 特征工程(4)-数据预处理二值化
上一篇文章讲解了区间缩放法处理数据,接下来就讲解二值化处理 这个应该很简单了,从字面意思就是将数据分为0或者1…
bigdata 特征工程(3)-数据预处理归一化
上一篇文章讲解了数据预处理区间缩放法,这篇文章主要讲解数据归一化处理 既然讲到归一化和前面的标准化需要对比一下…
bigdata 特征工程(2)-数据预处理区间缩放法
接上一篇文章无量纲标准化预处理数据标准化处理数据,这篇文章继续使用区间缩放法进行处理 区间缩放法原理 最常见的…
bigdata 特征工程(1)-数据预处理标准化
机器学习中特征工程的构造分析,以前在这方便还是没有去全面的了解,最近有一段磨刀的时间,还是从基础学习开始,理论…
bigdata spark决策树API分析
此版本是ml版本,区别于mllib版本的决策树api 输入 Param name Type(s) Defaul…
bigdata spark shell运行模式小记
集群经常会增加相应的node节点,但是相应的环境有没有及时更新,有的时候因为某个节点环境没有配置好导致程序跑挂…
bigdata spark随机森林算法
spark随机森林算法 由多个决策树构成的森林,算法分类结果由这些决策树投票得到,决策树在生成的过程当中分别在…
Python BluePrint概念
Blueprints 先备份下这篇文章,这篇文章解释了我当前web app架构的疑惑,算是对flask又有了一…
Python pandas之series小记
Series is a one-dimensional labeled array capable of ho…
math scipy统计模块stats翻译
Statistics (scipy.stats) 介绍 在这个教程我们讨论一部分scipy.stats模块的特…
Sql hive专题(1)-数据表创建
数据库的基本操作很多都是相差不大,从mysql到hive,基本上大部分语法都是相同的,除了一部分本质上的差异,…