logo logo
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  • 首页
  • Python
  • Wordpress
  • ml
  • leetcode
  • math
  • Alg
  1. 首页
  2. bigdata
  3. 文章列表
SparkSql系列(7/25) 去重方法

bigdata SparkSql系列(7/25) 去重方法

消除重复的数据可以通过使用 distinct 和 dropDuplicates 两个方法,二者的区别在于,di…

7,428次阅读 0个评论
bigdata 2021-08-24
SparkSql系列(6/25) collect 使用

bigdata SparkSql系列(6/25) collect 使用

Spark collect() 和 collectAsList() 是用于将 RDD/DataFrame/Da…

4,994次阅读 0个评论
bigdata 2021-08-23
SparkSql系列(5/25)  case when 使用

bigdata SparkSql系列(5/25) case when 使用

case when 这种用法基本上每一类编程语言里都会有,scala 里面常见的就是 case 语法,也就是条…

6,260次阅读 0个评论
bigdata 2021-06-07
SparkSql系列(4/25) 删除列

bigdata SparkSql系列(4/25) 删除列

这个系列好久没更新了,一个字懒,两个字很懒。这篇比较简单,主要的 API 就是 drop 函数。 val st…

5,255次阅读 0个评论
bigdata 2021-06-07
一次spark任务异常记录

bigdata 一次spark任务异常记录

昨晚一直在运行的spark任务出现了异常,运行了这么久恰恰这个时候出现了异常。 最直观的现象就是任务出现延迟,…

4,262次阅读 0个评论
bigdata 2021-05-12
SparkSQL系列(1/25)–创建DataFrame

bigdata SparkSQL系列(1/25)–创建DataFrame

博主日常在工作中使用spark sql进行数据分析比较多,常见的还会借助hive。从Tfrecord里面读数据…

4,742次阅读 1个评论
bigdata 2021-02-26
Hadoop 复制的两个方法

bigdata Hadoop 复制的两个方法

直奔主题,目前在Hadoop 集群上我常用的执行Copy的命令就是 cp,前两天复制一批数据,如果可以直接搬走…

6,748次阅读 0个评论
bigdata 2020-12-18
Spark DataFrame合并遇到的问题

bigdata Spark DataFrame合并遇到的问题

情况: 需要合并多个DataFrame ,存在部分DataFrame 的 columns 比其他的要多的情况,…

3,430次阅读 0个评论
bigdata 2020-12-16
Spark UDF 使用中看似问题的问题

bigdata Spark UDF 使用中看似问题的问题

这篇文章的由来是最近在做数据负采样方面的工作,看了些论文准备自己着手对样本直接操作,常规的使用工具就是Spar…

2,865次阅读 0个评论
bigdata 2020-12-05
keras任意中间层结果输出

bigdata keras任意中间层结果输出

最近使用keras写了一点代码,输入是正负样本,loss使用的是交叉熵,但是最终我只需要网络对给定的样本的预测…

7,694次阅读 0个评论
bigdata 2018-09-22
Keras过拟合相关解决办法

bigdata Keras过拟合相关解决办法

这种过拟合的处理称为正则化。 我们来学习一些最常用的正则化技术,并将其应用于实践中。 1.缩小神经网络的规模 …

8,495次阅读 0个评论
bigdata 2018-09-18
spark获取指定分区数据

bigdata spark获取指定分区数据

使用 mapPartitionsWithIndex 如下所示 // Create (1, 1), (2, 2)…

4,204次阅读 0个评论
bigdata 2018-06-22
Spark中Container killed by YARN for exceeding memory limits

bigdata Spark中Container killed by YARN for exceeding memory limits

昨天在yarn集群上跑代码遇到这个问题,现在发现spark代码写好是重要的一方面,spark submit参数…

11,032次阅读 0个评论
bigdata 2018-04-15
大数据常见错误解决方案

bigdata 大数据常见错误解决方案

1、用./bin/spark-shell启动spark时遇到异常:java.net.BindException…

6,451次阅读 0个评论
bigdata 2018-04-15
推荐系统老司机的十一条经验

bigdata 推荐系统老司机的十一条经验

一年一度的ACM Recsys会议在9月份已经胜利闭幕,留下一堆slides和tutorials等着我们去学习…

4,359次阅读 0个评论
bigdata 2018-04-12
spark写hive表遇到的字段问题

bigdata spark写hive表遇到的字段问题

  问题:spark版本1.6,将dataframe写到hive表中,hive表事先已经在库中建立好…

5,382次阅读 0个评论
bigdata 2018-04-09
spark问题集锦

bigdata spark问题集锦

今天刚打了一个jar包放在yarn集群运行报了错误,干脆整个文章记录所有遇到的问题 1、Lost Execut…

6,366次阅读 0个评论
bigdata 2018-04-09
深度学习关键词

bigdata 深度学习关键词

batch: batch是批。深度学习每一次参数的更新所需要损失函数并不是由一个{data:label}获得的…

3,543次阅读 0个评论
bigdata 2018-03-20
  • «
  • 1
  • 2
  • 3
  • 4
  • »
文章搜索
热门文章
闲聊transformer

闲聊transformer

tranformer架构的提出是2017年google做机器翻译的团队提出来了,文章一出来产生的影响很大,毕竟...
fastapi 禁用 swagger

fastapi 禁用 swagger

背景 起初是早上收到安全同事发出的一个问题整改单,说是提供在预发环境的公网接口存在风险,看到单子里面的内容是 ...
标签云
androidC++11Co-actionCSAPPDockergithadoophivejsKerasleetcodeLinuxllmmacMatLabnlpnumpyOpencvpdrunnerPythonQtRedisscalasparkSqlSSLwebWordpresswslwsl2xgboost多线程大数据技术篇插件数学之美机器学习杂谈树莓派正则深度学习灵魂爬虫科普算法虚拟机计算广告计算机视觉设计模式读书
关于我们

持续关注互联网推荐算法和计算广告前沿技术,不定期分享相关的技术,同时也会记录自己的学习历程。本网站由又拍云_logo2 提供CDN加速/云存储服务

版权说明

Copyright © 2025 算法之道. All rights reserved.

Copyright © Themes Design By Puock 粤ICP备17053707号
 Theme by Puock