一次性HDFS协议安装
- 在所有Greenplum数据库主机上安装Java 1.7或者更高的版本,包括Master、Segment以及后备Master。
在所有主机上安装一个兼容的Hadoop发布。该发布在所有的主机上都应该相同。Hadoop安装信息可以参考Hadoop发布文档。
有关兼容的Hadoop发布的信息,请见Greenplum数据库发行注记。
安装后,确保Greenplum系统用户(gpadmin)对Hadoop库或者Greenplum的MR客户端具有读和执行权限。
在所有Segment上设置下列环境变量:
- JAVA_HOME – Java主目录
例如,增加下面这样的行到gpadmin用户的.bashrc配置中。
这些变量必须在~gpadmin/.bashrc或者~gpadmin/.bash_profile文件中设置,这样gpadmin用户的shell环境才能定位Java和Hadoop的主目录。
设置下列Greenplum数据库服务器配置参数并且重启Greenplum数据库。
例如,下列命令使用Greenplum数据库工具gpconfig以及gpstop来设置服务器参数并且重启Greenplum数据库:
gpstop -u
有关Greenplum数据库工具gpconfig和gpstop的信息,请见Greenplum数据库工具指南。
如果需要,确保$GPHOME/lib/hadoop/hadoop_env.sh文件在每一个Greenplum数据库主机上生成的CLASSPATH环境变量包含gphdfs所需的Java类所在的JAR文件的路径。
上级主题: 使用Hadoop分布式文件系统(HDFS)表