HDFS模块功能
YARN模块功能
ResourceManager:
NodeManager:
ApplicationMaster:
Container:
MR模块功能
... ...
日志
.log:通过log4j记录的,大部分的应用日志信息;
.out:记录标准输出和标准错误日志,少。
框架名称-用户名-进程名-主机名-日志格式后缀
目录sbin里面的启动脚本中有hadoop-daemon.sh、yarn-daemon.sh和hadoop-daemons.sh、yarn-daemon.sh
它们有什么区别呢?
hadoop-daemon.sh分别启动每个进程,在slave上也要手动去敲命令
而hadoop-daemon.sh只需要在namenode中就可以,它从配置文件中获取所有的slave,然后远程上去调用hadoop-daemon.sh启动单个进程。
yarn-daemon.sh也一样。
历史服务器
1.x中有jobtracker,2.x中没有,那怎么从web ui中查看历史作业运行情况呢?
那就是historyserver。
默认情况下历史服务器不启动
启动命令和关闭命令
web UI地址: http://master:19888/
在2.X中多了一种针对MR小作业的优化机制:Uber模式
在运行一个作业的时候会有一条输出语句为Job job_xxxxxx_xxxx running in uber mode:false/true
如果作业足够小,则所有的task在一个JVM(mr app master)中完成作业,比每个task启动一个container更划算
手动设置参数:maPReduce.job.ubertask.enable 默认为 false
notepad+FZ+SecureCRT这个组合还不错
新闻热点
疑难解答