logo logo
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  1. 首页
  2. 标签
  3. spark
一次spark任务异常记录

bigdata 一次spark任务异常记录

昨晚一直在运行的spark任务出现了异常,运行了这么久恰恰这个时候出现了异常。 最直观的现象就是任务出现延迟,…

4,262次阅读 0个评论
bigdata 2021-05-12
SparkSQL系列(1/25)–创建DataFrame

bigdata SparkSQL系列(1/25)–创建DataFrame

博主日常在工作中使用spark sql进行数据分析比较多,常见的还会借助hive。从Tfrecord里面读数据…

4,743次阅读 1个评论
bigdata 2021-02-26
spark获取指定分区数据

bigdata spark获取指定分区数据

使用 mapPartitionsWithIndex 如下所示 // Create (1, 1), (2, 2)…

4,204次阅读 0个评论
bigdata 2018-06-22
spark问题集锦

bigdata spark问题集锦

今天刚打了一个jar包放在yarn集群运行报了错误,干脆整个文章记录所有遇到的问题 1、Lost Execut…

6,366次阅读 0个评论
bigdata 2018-04-09
spark实现gbdt和lr

bigdata spark实现gbdt和lr

spark对python开放的接口实在是有限,只有scala是亲生的。查了下scala的包和函数,发现提供的真…

10,649次阅读 2个评论
bigdata 2018-03-19
技术篇-每日一篇0x1

bigdata 技术篇-每日一篇0x1

前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数…

3,005次阅读 0个评论
bigdata 2018-03-12
slope one python版与spark sql版本代码分享

bigdata slope one python版与spark sql版本代码分享

slopeone原理 Slope One  是一种很简单的类比类似的算法, 其实大体意思 就是A B 不同的用…

5,262次阅读 0个评论
bigdata 2018-02-24
spark训练rm推荐模型cholesky分解异常分析

bigdata spark训练rm推荐模型cholesky分解异常分析

最近隔壁的小伙伴跑模型出现了类似以下的错误,当然最主要的错误在下面的红色标识出来 client token: …

5,560次阅读 0个评论
bigdata 2018-01-09
特征工程(6)-数据预处理数据变换

bigdata 特征工程(6)-数据预处理数据变换

上一篇讲解了使用哑编码的方式来进行数据预处理,这篇文章看起来只是用来作为数据类型的转换,比如多项式操作或者自定…

5,029次阅读 0个评论
bigdata 2017-08-18
特征工程(5)-数据预处理哑编码

bigdata 特征工程(5)-数据预处理哑编码

上一篇讲解了数据二值化处理,这篇讲解数据的哑编码 哑编码概念 先来讲解下哑编码的概念吧,当你的变量不是定量特征…

12,422次阅读 0个评论
bigdata 2017-08-17
特征工程(4)-数据预处理二值化

bigdata 特征工程(4)-数据预处理二值化

上一篇文章讲解了区间缩放法处理数据,接下来就讲解二值化处理 这个应该很简单了,从字面意思就是将数据分为0或者1…

7,376次阅读 0个评论
bigdata 2017-08-17
特征工程(3)-数据预处理归一化

bigdata 特征工程(3)-数据预处理归一化

上一篇文章讲解了数据预处理区间缩放法,这篇文章主要讲解数据归一化处理 既然讲到归一化和前面的标准化需要对比一下…

6,220次阅读 0个评论
bigdata 2017-08-17
特征工程(2)-数据预处理区间缩放法

bigdata 特征工程(2)-数据预处理区间缩放法

接上一篇文章无量纲标准化预处理数据标准化处理数据,这篇文章继续使用区间缩放法进行处理 区间缩放法原理 最常见的…

6,454次阅读 0个评论
bigdata 2017-08-17
特征工程(1)-数据预处理标准化

bigdata 特征工程(1)-数据预处理标准化

机器学习中特征工程的构造分析,以前在这方便还是没有去全面的了解,最近有一段磨刀的时间,还是从基础学习开始,理论…

6,348次阅读 0个评论
bigdata 2017-08-17
spark决策树API分析

bigdata spark决策树API分析

此版本是ml版本,区别于mllib版本的决策树api 输入 Param name Type(s) Defaul…

4,717次阅读 0个评论
bigdata 2017-08-16
spark shell运行模式小记

bigdata spark shell运行模式小记

集群经常会增加相应的node节点,但是相应的环境有没有及时更新,有的时候因为某个节点环境没有配置好导致程序跑挂…

5,813次阅读 0个评论
bigdata 2017-08-16
spark随机森林算法

bigdata spark随机森林算法

spark随机森林算法 由多个决策树构成的森林,算法分类结果由这些决策树投票得到,决策树在生成的过程当中分别在…

6,553次阅读 0个评论
bigdata 2017-08-15
spark专题

bigdata spark专题

spark学习专题  

4,079次阅读 2个评论
bigdata 2017-07-23
  • «
  • 1
  • 2
  • 3
  • »
文章搜索
热门文章
闲聊transformer

闲聊transformer

tranformer架构的提出是2017年google做机器翻译的团队提出来了,文章一出来产生的影响很大,毕竟...
fastapi 禁用 swagger

fastapi 禁用 swagger

背景 起初是早上收到安全同事发出的一个问题整改单,说是提供在预发环境的公网接口存在风险,看到单子里面的内容是 ...
标签云
androidC++11Co-actionCSAPPDockergithadoophivejsKerasleetcodeLinuxllmmacMatLabnlpnumpyOpencvpdrunnerPythonQtRedisscalasparkSqlSSLwebWordpresswslwsl2xgboost多线程大数据技术篇插件数学之美机器学习杂谈树莓派正则深度学习灵魂爬虫科普算法虚拟机计算广告计算机视觉设计模式读书
关于我们

持续关注互联网推荐算法和计算广告前沿技术,不定期分享相关的技术,同时也会记录自己的学习历程。本网站由又拍云_logo2 提供CDN加速/云存储服务

版权说明

Copyright © 2025 算法之道. All rights reserved.

Copyright © Themes Design By Puock 粤ICP备17053707号
 Theme by Puock