Sql - 算法之道

Sql hive 高级聚合函数

HQL里着实还有很多未发掘的东东，平时写的SQL都感觉很简单。直到最近做些统计报表发现一些新大陆。 group…

最近有场讲座是关于hive的一个培训，也去听了一下，其中的某些点还是自己的盲区，平时也没注意到这些地方的优化，…

1、map和reduce个数设置的问题 map和reduce的个数不是越多越好，因为启动时都会消耗很长的时间，…

日常使用的数据查询工具都是hive，了解一下hive sql执行顺序，其实与mysql之间的差异不是太大，参考…

这篇文章会出现是因为在统计一个数据的时候随手写了count，一时忘记count对null的处理，类似其他的空字…

将本地文件的数据加载到hive的ORC格式表时，出现以下报错： Diagnostic Messages for…

Hive 分桶分桶对于每一个表或者分区，Hive可以进一步组织成桶，也就是更为细粒度的数据范围划分 Hiv…

博主日常使用查询的工具就是hive，与mysql还是有很多共同之处，但是很多时候也要去hive官网查询相关信息…

列式存储和行式存储上图左边为逻辑表，右边第一个为行式存储，第二个为列式存储。行存储的特点：查询满足条件的…

最近写的脚本都需要向hive中传递相关参数，所以搜集一下网上的资料备注一下，也顺便学习一下。使用Hive编写…

今天博主需要建立一个备份带分区的数据表，拷贝时若采用静态分区方式需要写N行语句，因此可以使用动态分区，节省大量…

今晚终于在aws上把hive单机版的环境终于安装好了，现在记录一下安装环境的所有步骤，以后学习hive可以直接…

Hive 分桶分桶对于每一个表或者分区，Hive可以进一步组织成桶，也就是更为细粒度的数据范围划分 Hiv…

对于程序中的string型字段，char、varchar、nchar、nvarchar四种类型来对应（暂时不考…

经常需要查询半年以内或者指定时间范围内的数据，一般情况下数据库中保存的都是时间戳，时间戳实际上就是unix时间…

在hive查询中关于聚合和统计函数中涉及到百分比函数，比如PERCENT_RANK，不过这都是依据某个字段行数…

1. 字符串长度函数：length 语法: length(string A) 返回值: int 说明：返回字符…

今天需要统计一个table中一个分组前百分之十的记录，查了下资料有over函数，类似row_number ov…