将Amazon EMR用于安装在AWS上的Greenplum数据库

    除了一次性HDFS协议安装中描述的步骤之外,用户还必须确保Greenplum数据库能访问EMR实例。如果用户的Greenplum数据库系统运行在一个Amazon弹性计算云(EC2)实例上,用户需要配置Greenplum数据库系统和EMR安全性组。

    有关Amazon EMR的信息请见。有关Amazon EC2的信息请见https://aws.amazon.com/ec2/

    这些步骤描述了如何设置Greenplum数据库系统和一个Amazon EMR实例来支持Greenplum数据库的外部表:

    1. 例如,Amazon EMR Release 4.0.0包括Apache Hadoop 2.6.0。这个Amazon页面描述了。

      有关EMR和Greenplum数据库所使用的Hadoop版本,请见表 1

    2. 确保设置了环境变量和Greenplum数据库的服务器配置参数:

      • Greenplum数据库服务器配置参数:
        • gp_hadoop_home
    3. 例如,在AWS安全性组中打开端口8020。

    4. 配置Greenplum数据库和EMR实例的Hadoop数据节点之间的通信。打开一个TCP/IP端口,这样Greenplum数据库的Segment主机能够与EMR实例的Hadoop数据节点通信。

      例如,在AWS安全性管理器中打开端口50010。

    上级主题: