读写自定义格式的HDFS数据
要读取自定义格式的数据:
见。
MapReduce代码用Java编写。Greenplum提供了在MapReduce代码中使用的Java API。Javadoc在$GPHOME/docs目录中可以找到。要查看Javadoc,展开文件gnet-1.1-javadoc.tar并且打开index.html。Javadoc记载了下列包:
要让Java库对所有的Hadoop用户都可用,Hadoop集群的管理员应该把相应的gphdfs连接器的jar文件放在$HADOOP_HOME/lib目录中并且重启任务跟踪器。如果没有这样做,Hadoop用户仍能够使用gphdfs连接器的jar文件,但是要用分布式缓存技术。
上级主题: 一次性HDFS协议安装