读写自定义格式的HDFS数据

    要读取自定义格式的数据:

    例 1 - 从HDFS读取自定义格式数据

    见。

    MapReduce代码用Java编写。Greenplum提供了在MapReduce代码中使用的Java API。Javadoc在$GPHOME/docs目录中可以找到。要查看Javadoc,展开文件gnet-1.1-javadoc.tar并且打开index.html。Javadoc记载了下列包:

    要让Java库对所有的Hadoop用户都可用,Hadoop集群的管理员应该把相应的gphdfs连接器的jar文件放在$HADOOP_HOME/lib目录中并且重启任务跟踪器。如果没有这样做,Hadoop用户仍能够使用gphdfs连接器的jar文件,但是要用分布式缓存技术。

    上级主题: 一次性HDFS协议安装