好久没写Hive的那些事了,今天开始写点吧。今天的话题是总结Hive的几种常见的数据导入方式,我总结为四种:
(1)、从本地文件系统中导入数据到Hive表;
(2)、从HDFS上导入数据到Hive表;
(3)、从别的表中查询出相应的数据并导入到Hive表中;
(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。
我会对每一种数据的导入进行实际的操作,因为纯粹的文字让人看起来很枯燥,而且学起来也很抽象。好了,开始操作!
一、从本地文件系统中导入数据到Hive表
先在Hive里面创建好表,如下:
2 |
>
(id int ,
name string, |
5 |
>
FIELDS TERMINATED BY " " |
8 |
Time
taken: 2.832 seconds |
这个表很简单,只有四个字段,具体含义我就不解释了。本地文件系统里面有个/home/wyp/wyp.txt文件,内容如下:
1 |
[wyp @master ~]$
cat wyp.txt |
2 |
1 wyp 25 13188888888888 |
3 |
2 test 30 13888888888888 |
wyp.txt文件中的数据列之间是使用 分割的,可以通过下面的语句将这个文件里面的数据导入到wyp表里面,操作如下:
1 |
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
|