「hive创建表java」hive创建表命令

admin 2023-03-19 14:50:07 1960

今天给各位分享hive创建表java的知识，其中也会对hive创建表命令进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、如何生成hive的建表语句
2、Hive系列之SerDe
3、Hive如何建表，数据装载？

如何生成hive的建表语句

Java连接Hive

利用jdbc连接到hive，使用Java程序写一个循环。

先获取全部表，然后show create table每个表。

没能尝试成功，一直连接不上：

import java.sql.SQLException;

import java.sql.Connection;

import java.sql.ResultSet;

import java.sql.Statement;

import java.sql.DriverManager;

public class HiveTestCase {

private static String driverName = "org.apache.hive.jdbc.HiveDriver";

public static void main(String[] args)

throws SQLException {

try {

Class.forName(driverNa

Hive系列之SerDe

SerDe是Serialize/Deserilize的简称，目的是用于序列化和反序列化。

序列化是对象转换为字节序列的过程。

序列化是字节序列恢复为对象的过程。

对象的序列化主要有两种用途：对象的持久化，即把对象转换成字节序列后保存到文件中；对象数据的网络传送。

除了上面两点， hive的序列化的作用还包括：Hive的反序列化是对key/value反序列化成hive table的每个列的值。Hive可以方便的将数据加载到表中而不需要对数据进行转换，这样在处理海量数据时可以节省大量的时间。

SerDe说明hive如何去处理一条记录，包括Serialize/Deserilize两个功能， Serialize把hive使用的java object转换成能写入hdfs的字节序列，或者其他系统能识别的流文件。Deserilize把字符串或者二进制流转换成hive能识别的java object对象。比如：select语句会用到Serialize对象，把hdfs数据解析出来；insert语句会使用Deserilize，数据写入hdfs系统，需要把数据序列化。

hive创建表时，通过自定义的SerDe或使用Hive内置的SerDe类型指定数据的序列化和反序列化方式。

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name

[(col_name data_type [COMMENT col_comment], ...)]

[COMMENT table_comment]

[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]

[CLUSTERED BY (col_name, col_name, ...)

[SORTED BY (col_name [ASC|DESC], ...)]

INTO num_buckets BUCKETS]

[ROW FORMAT row_format]

[STORED AS file_format]

[LOCATION hdfs_path]

如上创建表语句，使用row format 参数说明SerDe的类型。

Avro

ORC

RegEx

Thrift

Parquet

CSV

JsonSerDe

自定义类型使用的步骤：

Hive如何建表，数据装载？

楼主说的是Hive，不是HBase。从Oracle里面头导出数据为平面文件后，导入HDFS里面。Hive里面的表结构是要自己手工定的。

建表可以自己写个小程序实现，根据oracle字典表和hive的建表规则，每个地方使用hive的情景不同，建表也不同。数据装载可以用sqoop来实现。

你可以安装下SQOOP，注意这个跟HADOOP的版本要对应的，不然会出现一些问题。以下是我项目用到的例子，不过我有个更高级的方法，只需配到表就行了，就是写个JAVA程序，然后自动生成对应的脚本，再执行就可以了。转载，仅供参考。

hive创建表java的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于hive创建表命令、hive创建表java的信息别忘了在本站进行查找喔。

标签：hive创建表java