logo logo
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  1. 首页
  2. bigdata
  3. 文章列表
特征工程(4)-数据预处理二值化

bigdata 特征工程(4)-数据预处理二值化

上一篇文章讲解了区间缩放法处理数据,接下来就讲解二值化处理 这个应该很简单了,从字面意思就是将数据分为0或者1…

7,376次阅读 0个评论
bigdata 2017-08-17
特征工程(3)-数据预处理归一化

bigdata 特征工程(3)-数据预处理归一化

上一篇文章讲解了数据预处理区间缩放法,这篇文章主要讲解数据归一化处理 既然讲到归一化和前面的标准化需要对比一下…

6,220次阅读 0个评论
bigdata 2017-08-17
特征工程(2)-数据预处理区间缩放法

bigdata 特征工程(2)-数据预处理区间缩放法

接上一篇文章无量纲标准化预处理数据标准化处理数据,这篇文章继续使用区间缩放法进行处理 区间缩放法原理 最常见的…

6,454次阅读 0个评论
bigdata 2017-08-17
特征工程(1)-数据预处理标准化

bigdata 特征工程(1)-数据预处理标准化

机器学习中特征工程的构造分析,以前在这方便还是没有去全面的了解,最近有一段磨刀的时间,还是从基础学习开始,理论…

6,351次阅读 0个评论
bigdata 2017-08-17
spark决策树API分析

bigdata spark决策树API分析

此版本是ml版本,区别于mllib版本的决策树api 输入 Param name Type(s) Defaul…

4,717次阅读 0个评论
bigdata 2017-08-16
spark shell运行模式小记

bigdata spark shell运行模式小记

集群经常会增加相应的node节点,但是相应的环境有没有及时更新,有的时候因为某个节点环境没有配置好导致程序跑挂…

5,813次阅读 0个评论
bigdata 2017-08-16
spark随机森林算法

bigdata spark随机森林算法

spark随机森林算法 由多个决策树构成的森林,算法分类结果由这些决策树投票得到,决策树在生成的过程当中分别在…

6,553次阅读 0个评论
bigdata 2017-08-15
simrank算法

bigdata simrank算法

1. SimRank推荐算法的图论基础 SimRank是基于图论的,如果用于推荐算法,则它假设用户和物品在空间…

5,949次阅读 0个评论
bigdata 2017-08-04
大数据专题

bigdata 大数据专题

大数据专题  

4,159次阅读 0个评论
bigdata 2017-07-23
spark专题

bigdata spark专题

spark学习专题  

4,079次阅读 2个评论
bigdata 2017-07-23
hive collect_set等集合函数

bigdata hive collect_set等集合函数

hive工作中用到的一些函数 1. concat(string s1, string s2, string s…

19,845次阅读 0个评论
bigdata 2017-06-29
spark1.6 fp-growth序列化数据错误

bigdata spark1.6 fp-growth序列化数据错误

Spark运行FP-growth异常报错 在spark1.4版上尝试运行频繁子项挖掘算法是,照搬官方提供的Py…

4,083次阅读 0个评论
bigdata 2017-06-27
Spark RDD中的aggregate函数

bigdata Spark RDD中的aggregate函数

刚开始看spark快速编程这本书的时候真的是没有理解这个函数的意思,后来看了博客再去看先关的api文档,现在基…

4,915次阅读 0个评论
bigdata 2017-06-20
Hadoop 任务执行设置队列参考(转载)

bigdata Hadoop 任务执行设置队列参考(转载)

对于集群我们经常会启用公平调度或容量调度来满足多用户的需求,这个时候我们需要去设定相应的队列以及队列的优先级。…

8,456次阅读 0个评论
bigdata 2017-06-07
Spark mlib协同过滤算法中文翻译

bigdata Spark mlib协同过滤算法中文翻译

最近看了下spark协同过滤的api,并根据提供的代码写了一版商品推荐代码,现在将当前的模块一些api函数翻译…

5,900次阅读 0个评论
bigdata 2017-05-27
Spark读取csv跳首行

bigdata Spark读取csv跳首行

目前开发的版本的是spark1.6,因此很多最新的api无法使用,典型的就是读取csv文件无法跳过首行,现在给…

10,084次阅读 0个评论
bigdata 2017-05-27
map_reduce原理

bigdata map_reduce原理

进入大数据领域经常接触到的词汇就是map /reduce,其实在这个在python中经常用到,比如处理一个li…

4,137次阅读 0个评论
bigdata 2017-05-25
spark-yarn集群python异常

bigdata spark-yarn集群python异常

今天在spark yarn集群上面跑代码发现出现import numpy error ,提示没有相应的模块,其…

3,427次阅读 0个评论
bigdata 2017-05-25
  • «
  • 1
  • 2
  • 3
  • 4
文章搜索
热门文章
闲聊transformer

闲聊transformer

tranformer架构的提出是2017年google做机器翻译的团队提出来了,文章一出来产生的影响很大,毕竟...
fastapi 禁用 swagger

fastapi 禁用 swagger

背景 起初是早上收到安全同事发出的一个问题整改单,说是提供在预发环境的公网接口存在风险,看到单子里面的内容是 ...
标签云
androidC++11Co-actionCSAPPDockergithadoophivejsKerasleetcodeLinuxllmmacMatLabnlpnumpyOpencvpdrunnerPythonQtRedisscalasparkSqlSSLwebWordpresswslwsl2xgboost多线程大数据技术篇插件数学之美机器学习杂谈树莓派正则深度学习灵魂爬虫科普算法虚拟机计算广告计算机视觉设计模式读书
关于我们

持续关注互联网推荐算法和计算广告前沿技术,不定期分享相关的技术,同时也会记录自己的学习历程。本网站由又拍云_logo2 提供CDN加速/云存储服务

版权说明

Copyright © 2025 算法之道. All rights reserved.

Copyright © Themes Design By Puock 粤ICP备17053707号
 Theme by Puock