在外部表定义中指定HDFS数据

    在一个Hadoop HA集群中,LOCATION子句引用逻辑名字服务的id(hdfs-site.xml配置文件中的dfs.nameservices性质)。有名字服务配置的hdfs-site.xml文件必须被安装在Greenplum的Master和每一个Segment主机上。

    例如,如果dfs.nameservices被设置为mycluster,LOCATION子句有这样的格式:

    一个没有HA的集群在LOCATION子句中指定名字节点的主机名和端口:

    如果用户在使用MapR集群,用户要指定一个特定的集群和该文件:

    • file_path是该文件的路径。

    • 要指定另一个列在配置文件中的MapR集群,用这种语法指定该文件:

      cluster_name是在该配置文件中指定的集群的名称并且file_path是该文件的路径。

    有关MapR集群的信息请见MapR的文档。

    • LOCATION子句的URI不能包含这四种字符中的任意一种:\、’、<、>。如果URI包含任何这些字符,CREATE EXTERNAL TABLE会返回一个错误。

    • 格式限制如下。

      • 对于自定义格式的可写外部表,只允许gphdfs_export格式化器。
      • 只能为可写外部表设置压缩。可读外部表的压缩设置是自动。

    上级主题: 一次性HDFS协议安装