MongoDB运行状态、性能监控与分析
?
它的输出有以下几列:
inserts/s 每秒插入次数 query/s 每秒查询次数 update/s 每秒更新次数 delete/s 每秒删除次数 getmore/s 每秒执行getmore次数 command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令 flushs/s 每秒执行fsync将数据写入硬盘的次数。 mapped/s 所有的被mmap的数据量,单位是MB, vsize 虚拟内存使用量,单位MB res 物理内存使用量,单位MB faults/s 每秒访问失败数(只有Linux有),数据被交换出物理内存,放到swap。不要超过100,否则就是机器内存太小,造成频繁swap写入。此时要升级内存或者扩展 locked % 被锁的时间百分比,尽量控制在50%以下吧 idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了 q t|r|w 当Mongodb接收到太多的命令而数据库被锁住无法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,一般队列值会升高。 conn 当前连接数 time 时间戳使用profiler
类似于MySQL的slow log, MongoDB可以监控所有慢的以及不慢的查询。

?
Profiler默认是关闭的,你可以选择全部开启,或者有慢查询的时候开启。
>?use?testswitched?to?db?test
>?db.setProfilingLevel(2);
{"was"?:?0?,?"slowms"?:?100,?"ok"?:?1}?//?"was"?is?the?old?setting
>?db.getProfilingLevel()
查看Profile日志
>?db.system.profile.find().sort({$natural:-1}){"ts"?:?"Thu?Jan?29?2009?15:19:32?GMT-0500?(EST)"?,?"info"?:
"query?test.$cmd?ntoreturn:1?reslen:66?nscanned:0?query:?{?profile:?2?}?nreturned:1?bytes:50"?,
"millis"?:?0}?...
3个字段的意义
ts:时间戳 info:具体的操作 millis:操作所花时间,毫秒不多说,此处有官方文档。注意,造成满查询可能是索引的问题,也可能是数据不在内存造成因此磁盘读入造成。
使用Web控制台
Mongodb自带了Web控制台,默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000,如果是默认的Mongodb数据服务端口(Which is 27017),则相应的Web端口为28017

?
这个页面可以看到
当前Mongodb的所有连接 各个数据库和Collection的访问统计,包括:Reads, Writes, Queries, GetMores ,Inserts, Updates, Removes 写锁的状态 以及日志文件的最后几百行(CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)可以参考上图
db.stat()
获取当前数据库的信息,比如Obj总数、数据库总大小、平均Obj大小等
>?use?testswitched?to?db?test
>?db.stats()
{
"collections"?:?9,
"objects"?:?4278845,
"avgObjSize"?:?224.56603031892953,
"dataSize"?:?960883236,
"storageSize"?:?1195438080,
"numExtents"?:?59,
"indexes"?:?13,
"indexSize"?:?801931264,
"fileSize"?:?6373244928,
"ok"?:?1
}
db.serverStatus()
获取服务器的状态
{"version"?:?"1.6.5",
"uptime"?:?7208469,
"uptimeEstimate"?:?7138829,
"localTime"?:?"Wed?Oct?26?2011?22:23:07?GMT+0800?(CST)",
"globalLock"?:?{
"totalTime"?:?7208469556704,
"lockTime"?:?4959693717,
"ratio"?:?0.000688036992871448,
"currentQueue"?:?{
"total"?:?0,
"readers"?:?0,
"writers"?:?0
}
},
"mem"?:?{
"bits"?:?64,
"resident"?:?3131,
"virtual"?:?6172,
"supported"?:?true,
"mapped"?:?4927
},
"connections"?:?{
"current"?:?402,
"available"?:?2599
},
"extra_info"?:?{
"note"?:?"fields?vary?by?platform",
"heap_usage_bytes"?:?832531920,
"page_faults"?:?8757
},
"indexCounters"?:?{
"btree"?:?{
"accesses"?:?2821726,
"hits"?:?2821725,
"misses"?:?1,
"resets"?:?0,
"missRatio"?:?3.543930204420982e-7
}
},
"backgroundFlushing"?:?{
"flushes"?:?120133,
"total_ms"?:?73235923,
"average_ms"?:?609.6236920746173,
"last_ms"?:?1332,
"last_finished"?:?"Wed?Oct?26?2011?22:22:23?GMT+0800?(CST)"
},
"cursors"?:?{
"totalOpen"?:?0,
"clientCursors_size"?:?0,
"timedOut"?:?238392
},
"repl"?:?{
"ismaster"?:?true
},
"opcounters"?:?{
"insert"?:?269351,
"query"?:?19331151,
"update"?:?14199331,
"delete"?:?1,
"getmore"?:?145575,
"command"?:?55982302
},
"asserts"?:?{
"regular"?:?0,
"warning"?:?0,
"msg"?:?0,
"user"?:?27,
"rollovers"?:?0
},
"ok"?:?1
}
需要关心的地方:
connections 当前连接和可用连接数,听过一个同行介绍过,mongodb最大处理到2000个连接就不行了(要根据你的机器性能和业务来设定),所以设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的连接请求,避免被太多的连接拖垮。 indexCounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确建立。你看我的”missRatio” : 3.543930204420982e-7,很健康吧。所以miss率在mongostat里面也可以看 其他的都能自解释,也不是查看mongo健康状况的关键,就不说明了。db.currentOp()
Mongodb 的命令一般很快就完成,但是在一台繁忙的机器或者有比较慢的命令时,你可以通过db.currentOp()获取当前正在执行的操作。
在没有负载的机器上,该命令基本上都是返回空的
>?db.currentOp(){?"inprog"?:?[?]?}
以下是一个有负载的机器上得到的返回值样例:
{?"opid"?:?"shard3:466404288",?"active"?:?false,?"waitingForLock"?:?false,?"op"?:?"query",?"ns"?:?"sd.usersEmails",?"query"?:?{?},?"client_s"?:?"10.121.13.8:34473",?"desc"?:?"conn"?},字段名字都能自解释。如果你发现一个操作太长,把数据库卡死的话,可以用这个命令杀死他
>?db.killOp("shard3:466404288")MongoDB Monitoring Service

?
MongoDB Monitoring Service(MMS)是Mongodb厂商提供的监控服务,可以在网页和Android客户端上监控你的MongoDB状况。