读书人

hadoop的5个守护进程

发布时间: 2012-07-03 13:37:42 作者: rapoo

hadoop的五个守护进程

一般如果正常启动hadoop,我们可以在master上通过jps命令看到以下5个daemons:

[root@master ~]# jps
19803?SecondaryNameNode
19994?TaskTracker
31144 Jps
19571?NameNode


19672?DataNode
19887?JobTracker

?

下面依次介绍这些进程:

1.?NameNode

它是Hadoop 中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问。

参考资料:

http://www.linuxidc.com/Linux/2012-01/51614.htm

2.?SecondaryNameNode

它不是 namenode 的冗余守护进程,而是提供周期检查点和清理任务。

出于对可扩展性和容错性等考虑,我们一般将SecondaryNameNode运行在一台非NameNode的机器上。

参考资料:

http://www.linuxidc.com/Linux/2012-01/51628.htm
http://www.linuxidc.com/Linux/2012-01/51622.htm

3.?DataNode

它负责管理连接到节点的存储(一个集群中可以有多个节点)。每个存储数据的节点运行一个 datanode 守护进程。

4.?JobTrackerTaskTracker

JobTracker负责调度?DataNode上的工作。每个?DataNode有一个TaskTracker,它们执行实际工作。

JobTracker和?TaskTracker采用主-从形式,JobTrackerDataNode分发工作,而?TaskTracker执行任务。

JobTracker还检查请求的工作,如果一个?DataNode由于某种原因失败,JobTracker会重新调度以前的任务。


读书人网 >软件架构设计

热点推荐