hive专题(1)-数据表创建

2,368次阅读
没有评论

数据库的基本操作很多都是相差不大,从mysql到hive,基本上大部分语法都是相同的,除了一部分本质上的差异,其他语法可以通用,今天就先学习下hive数据表的创建

CREATE TABLE pokes (foo INT, bar STRING);
hive> CREATE TABLE pokes (foo INT, bar STRING);
OK
Time taken: 2.053 seconds
hive> show tables;
OK
pokes
Time taken: 0.115 seconds, Fetched: 1 row(s)

到此我们就创建了一个数据表pokes,hive还可以创建带有分区的数据表,何为分区的概念?

分区指的是在创建表时指定的partition的分区空间,可以理解为把表的数据分成一块一块的,假设我们使用时间作为分区的依据,也就是每天我们都会产生相应的分区数据,到时候我们想查某一天的数据,直接去查那个分区的数据即可,不需要去遍历整个数据库去查询,这样的话查询的速度会快很多。

分区先关的技术

1、一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。

2、表和列名不区分大小写。

3、分区是以字段的形式在表结构中存在,通过describe table命令可以查看到字段存在,但是该字段不存放实际的数据内容,仅仅是分区的表示。

下面我们就创建一个带有分区的数据表

CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (year STRING,month STRING,day STRING);

 

admin
版权声明:本站原创文章,由admin2017-08-06发表,共计659字。
转载提示:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)