流数据湖平台Apache Paimon（四）集成 Hive 引擎-阿里云开发者社区

流数据湖平台Apache Paimon（四）集成 Hive 引擎

2023-12-26 184

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 流数据湖平台Apache Paimon（四）集成 Hive 引擎

第3章集成 Hive 引擎

前面与Flink集成时，通过使用 paimon Hive Catalog，可以从 Flink 创建、删除、查询和插入到 paimon 表中。这些操作直接影响相应的Hive元存储。以这种方式创建的表也可以直接从 Hive 访问。

更进一步的与 Hive 集成，可以使用 Hive SQL创建、查询Paimon表。

3.1 环境准备

Paimon 目前支持 Hive 3.1、2.3、2.2、2.1 和 2.1-cdh-6.3。支持 Hive Read 的 MR 和 Tez 执行引擎，以及 Hive Write 的 MR 执行引擎（beeline也不支持hive write）。

在Hive根目录下创建auxlib文件夹，将paimon-hive-connector-0.5-SNAPSHOT.jar复制到auxlib中（不推荐用add jar，MR 引擎运行 join 语句会报异常）：

下载地址：https://repository.apache.org/snapshots/org/apache/paimon/paimon-hive-connector-3.1/0.5-SNAPSHOT/

mkdir /opt/module/hive/auxlib

cp paimon-hive-connector-3.1-0.5-20230703.002437-65.jar /opt/module/hive/auxlib

3.2 访问已有的Paimon表

USE test;
SHOW TABLES;
SELECT * FROM ws_t;
INSERT INTO test_table VALUES (9,9,9);

3.3 创建Paimon表

SET hive.metastore.warehouse.dir=hdfs://hadoop102:8020/paimon/hive;
CREATE TABLE test_h(
  a INT COMMENT 'The a field',
  b STRING COMMENT 'The b field'
)
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'

3.4 通过外部表访问Paimon表

要访问现有的 paimon 表，还可以将它们注册为 Hive 中的外部表,不需要指定任何列或表属性，只需要指定路径。

CREATE EXTERNAL TABLE test.hive_ex
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'
LOCATION 'hdfs://hadoop102:8020/paimon/hive/test.db/ws_t';

–或将路径写在表属性中：

CREATE EXTERNAL TABLE hive_ex
STORED BY 'org.apache.paimon.hive.PaimonStorageHandler'
TBLPROPERTIES (
 'paimon_location' ='hdfs://hadoop102:8020/paimon/hive/test.db/ws_t'
);

操作外部表：

SELECT * FROM hive_ex;
INSERT INTO hive_ex VALUES (8,8,8);

流数据湖平台Apache Paimon（四）集成 Hive 引擎

第3章集成 Hive 引擎

3.1 环境准备

3.2 访问已有的Paimon表

3.3 创建Paimon表

3.4 通过外部表访问Paimon表

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

流数据湖平台Apache Paimon（四）集成 Hive 引擎

第3章 集成 Hive 引擎

3.1 环境准备

3.2 访问已有的Paimon表

3.3 创建Paimon表

3.4 通过外部表访问Paimon表

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

第3章集成 Hive 引擎