将Amazon EMR用于安装在AWS上的Greenplum数据库
除了一次性HDFS协议安装中描述的步骤之外,用户还必须确保Greenplum数据库能访问EMR实例。如果用户的Greenplum数据库系统运行在一个Amazon弹性计算云(EC2)实例上,用户需要配置Greenplum数据库系统和EMR安全性组。
有关Amazon EMR的信息请见。有关Amazon EC2的信息请见https://aws.amazon.com/ec2/
这些步骤描述了如何设置Greenplum数据库系统和一个Amazon EMR实例来支持Greenplum数据库的外部表:
-
例如,Amazon EMR Release 4.0.0包括Apache Hadoop 2.6.0。这个Amazon页面描述了。
有关EMR和Greenplum数据库所使用的Hadoop版本,请见表 1。
确保设置了环境变量和Greenplum数据库的服务器配置参数:
- Greenplum数据库服务器配置参数:
- gp_hadoop_home
- Greenplum数据库服务器配置参数:
-
例如,在AWS安全性组中打开端口8020。
配置Greenplum数据库和EMR实例的Hadoop数据节点之间的通信。打开一个TCP/IP端口,这样Greenplum数据库的Segment主机能够与EMR实例的Hadoop数据节点通信。
例如,在AWS安全性管理器中打开端口50010。
上级主题: