• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

hive专题(1)-数据表创建

Sql admin 2年前 (2017-08-06) 662次浏览 0个评论 扫描二维码

数据库的基本操作很多都是相差不大,从 mysql 到 hive,基本上大部分语法都是相同的,除了一部分本质上的差异,其他语法可以通用,今天就先学习下 hive 数据表的创建

CREATE TABLE pokes (foo INT, bar STRING);
hive> CREATE TABLE pokes (foo INT, bar STRING);
OK
Time taken: 2.053 seconds
hive> show tables;
OK
pokes
Time taken: 0.115 seconds, Fetched: 1 row(s)

到此我们就创建了一个数据表 pokes,hive 还可以创建带有分区的数据表,何为分区的概念?

分区指的是在创建表时指定的 partition 的分区空间,可以理解为把表的数据分成一块一块的,假设我们使用时间作为分区的依据,也就是每天我们都会产生相应的分区数据,到时候我们想查某一天的数据,直接去查那个分区的数据即可,不需要去遍历整个数据库去查询,这样的话查询的速度会快很多。

分区先关的技术

1、一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。

2、表和列名不区分大小写。

3、分区是以字段的形式在表结构中存在,通过 describe table 命令可以查看到字段存在,但是该字段不存放实际的数据内容,仅仅是分区的表示。

下面我们就创建一个带有分区的数据表

CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (year STRING,month STRING,day STRING);

 


Deeplearn, 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明hive 专题(1)-数据表创建
喜欢 (0)
admin
关于作者:

您必须 登录 才能发表评论!