这篇博客我们来体验通过java API来访问HDFS。
解压Hadoop,然后把Hadoop的根目录配置到HADOOP_HOME环境变量里面
然后把HADOOP_HOME/lib和HADOOP_HOME/bin配置到path里面。
要把官网下载的Hadoop目录下面的bin目录替换成Windows下编译的Hadoop的bin目录。开始时我没做这一步,上传文件成功了。但是下载文件的时候就不行了。
我已经上传了自己编译好的hadoop-2.7.3的bin目录,可以从 http://download.csdn.net/detail/mrbcy/9758112下载。
我的环境是Win10 64位。如果跟我的不一样可以参考我的另一篇博客http://blog.csdn.net/mrbcy/article/details/55806809 自已编译即可。
需要添加的jar包列表如下:
hadoop/share/hadoop/common/hadoop-common-2.7.3.jarhadoop/share/hadoop/common/lib/*.jarhadoop/share/hadoop/hdfs/hadoop-hdfs-2.7.3.jarhadoop/share/hadoop/hdfs/lib/*.jar也可以用maven,依赖列表稍后补上。
运行后,上传文件成功。
报错了。
网上查了一下,说是环境变量没有配。
配置好以后还是报那个错误。看来是必须替换bin了
这里返回一个迭代器还是很讲究的。如果返回一个List、Map之类的东西,很可能由于数据量过大,造成客户端崩溃,而且对网络的传输也是一个很大的挑战。
新闻热点
疑难解答