读书人

Nutch相干框架视频教程17

发布时间: 2013-05-02 09:39:29 作者: rapoo

Nutch相关框架视频教程17

第十七讲

优酷在线视频地址?(31分钟)
压缩超清下载地址?

Ganglia主要是用来监控大规模分布式系统的性能,如:cpu 、内存、硬盘、负载、网络流量等。Ganglia支持通过浏览器访问,强大的图表展示方式很容易直观地了解每个节点以及整个集群的工作状态,对集群运行参数调整、提高系统整体资源利用率起到重要作用。

1、? 配置服务端

host6作为服务端:

创建用户和组:

addgroup?ganglia

adduser?--ingroup ?ganglia ?ganglia

安装:

apt-get?install? ?gmetad

apt-get?install? ?rrdtool

apt-get?install? ?ganglia-webfrontend

apt-get?install? ?ganglia-monitor

配置gmond

vi/etc/ganglia/gmond.conf

先找到setuid= yes,改成setuid=no;

在找到cluster块中的name,改成name=”hadoop-cluster”;

配置gmetad

vi/etc/ganglia/gmetad.conf

在这个配置文件中增加datasource,即增加以下内容:

data_source?“hadoop-cluster”? 10?host2? host6? host8

gridname?"Hadoop"

指定web文件夹:

ln ?-s ?/usr/share/ganglia-webfrontend?/var/www/ganglia

指定主机名:

vi/etc/apache2/apache2.conf

添加:?ServerName?host6

重启服务:

/etc/init.d/gmetadrestart

/etc/init.d/ganglia-monitor? restart

/etc/init.d/apache2restart

2、? 配置客户端

在host2和host8上安装数据收集服务:

创建用户和组:

addgroup ?ganglia

adduser ?--ingroup ?ganglia ?ganglia

安装:

apt-get ?install? ?ganglia-monitor

配置gmond

vi/etc/ganglia/gmond.conf

先找到setuid= yes,改成setuid=no;

在找到cluster块中的name,改成name=”hadoop-cluster”;

重启服务:

/etc/init.d/ganglia-monitorrestart

3、? 访问页面

http://host6/ganglia

如果页面中的Choosea Source有unspecified,重启gmetad即可:

/etc/init.d/gmetad?restart

4、? 集成hadoop

vi conf/hadoop-metrics2.properties

设置内容为:

??#大于0.20以后的版本用ganglia31??

*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31
??*.sink.ganglia.period=10
??# default for supportsparse is false
??*.sink.ganglia.supportsparse=true
?*.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both
?*.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40
??#广播IP地址,这是缺省的,统一设该值(只能用组播地址239.2.11.71)

??namenode.sink.ganglia.servers=239.2.11.71:8649
??datanode.sink.ganglia.servers=239.2.11.71:8649
??jobtracker.sink.ganglia.servers=239.2.11.71:8649
??tasktracker.sink.ganglia.servers=239.2.11.71:8649
??maptask.sink.ganglia.servers=239.2.11.71:8649
??reducetask.sink.ganglia.servers=239.2.11.71:8649
??dfs.class=org.apache.hadoop.metrics.ganglia.GangliaContext31
??dfs.period=10
??dfs.servers=239.2.11.71:8649
??mapred.class=org.apache.hadoop.metrics.ganglia.GangliaContext31
??mapred.period=10
??mapred.servers=239.2.11.71:8649
??jvm.class=org.apache.hadoop.metrics.ganglia.GangliaContext31
??jvm.period=10
??jvm.servers=239.2.11.71:8649

?

把配置文件复制到集群其他节点,重启集群。

读书人网 >互联网

热点推荐