读书人

ZooKeeper监控-转从淘宝技术

发布时间: 2012-06-30 17:20:12 作者: rapoo

ZooKeeper监控-转自淘宝技术

?在公司内部,有不少应用已经强依赖zookeeper,比如meta和精卫系统,zookeeper的工作状态直接影响它们的正常工作。目前开源世界中暂没有一个比较成熟的zookeeper-monitor,公司内部的各个zookeeper运行也都是无监控,无报表状态。于是开始zookeeper监控这块工作。

目前zookeeper-monitor能做哪些事情,讲到这个,首先来看看哪些因素对zookeeper正常工作比较大的影响:

  1. 用于zookeeper写日志的目录要有足够大小,并且强烈建议在单独的磁盘(挂载点)上,这是影响ZK性能最大因素之一。
  2. 连接数。
  3. 注册的Watcher数。
  4. ZNode是否可读,可写。
  5. ZK事件通知的延时是否过大。

围绕以上几点展开,完成了taokeeper一期的开发,目前主要完成以下方面的监控:(项目地址:https://github.com/nileader/taokeeper)

l??CPU/MEM/LOAD的监控

l??ZK日志目录所在磁盘剩余空间监控

l??单机连接数的峰值报警

l??单机 Watcher数的峰值报警

l??节点自检:是指对集群中每个IP所在ZK节点上的PATH: /YINSHI.MONITOR.ALIVE.CHECK 定期进行三次如下流程 : 节点连接 数据发布 修改通知 获取数据 数据对比, 在指定的延时内,三次流程均成功视为该节点处于正常状态。

读书人网 >软件架构设计

热点推荐