利用外表访问HDFS数据
在openGauss上创建的HDFS外表,需要支持HDFS原生数据表实际所采用的ROUND ROBIN和replication数据分布方式。
正如所述,对接最终要实现通过CREATE SERVER语法定义外部服务器来存储HDFS数据库实例信息。
要修改外部服务器的信息,请使用语法。
要删除外部服务器,请使用DROP SERVER语法。
管理Foreign Table
-
- 创建HDFS外表需要指定该外表所在HDFS服务器的server_name,以及该表在此HDFS数据库实例服务器上的存储文件列表或存储目录。一个HDFS外表可以对应多个HDFS存储文件或一个文件存储目录。如果指定的是HDFS文件存储目录,默认该目录及子目录内的所有文件都为该表的数据文件。
- 引擎支持访问存储在HDFS上的ORC version 0.11和version 0.12格式的数据表,并支持ORC格式采用SNAPPY、ZLIB及NO压缩方式。
- 引擎支持访问存储在HDFS上的Parquet version 1.0和version 2.0格式的数据表,并支持Parquet格式采用SNAPPY及NO压缩方式。
- 数据由外部工具导入HDFS数据库实例文件系统,并存储为Hadoop原生格式数据表时,默认的HDFS节点间数据分布方式是数剧随机均布在所有HDFS数据节点上。支持的HDFS外表数据需要指定分布方式为ROUNDROBIN。
- Column属性默认为可以为空(NULL),当指定为“NOT NULL”时,不会对数据做一致性检查,需要由应用来保证无空值。
修改外表,具体请参考。
- 删除外表,具体请参考DROP FOREIGN TABLE。
- 查看外表。外表创建完成后,即可以通过SELECT进行数据查询。更多信息请参见。