监控系统
- 手把手实现企业级开源监控软件cacti+nagios+ntop整合(图解)
- 监控宝:http://www.jiankongbao.com/
- rrdtool:
- 告警平台: http://www.onealert.com/ (短信/微信/邮件/QQ/电话告警)
2022
- Zabbix
- Prometheus
- Grafana
-
TICK
-
Telegraf+influxDB:
- go开发的监控工具,可以用来收集和报告指标,通过输出、转换、输出插件等将数据从目标采集并发送给其他的数据存储、服务或者消息队列
- go开发的时序数据库,为带有时间戳的数据编写
- chronograf:开源可视化引擎
- grafana:可视化工具,比较流行的时序数据可视化工具
- Kapacitor:数据引擎,可以处理来自influxdb的流数据,并且可以监控和报警
-
Telegraf+influxDB:
Collectd
Collectd 和Munin以及Cacti一样是注重图形式的系统指标显示方式。与众不同的是,它是专门为性能和可移植性而设计的。这意味着它适用于那些粗糙的、低端的 和嵌入式的系统。高性能低资源占有率的设计使得Collectd可以在不干扰你的服务进程的条件下,每10秒钟收集一次数据,提供高清晰的结果。你可以用 C、Perl或是Java给它写扩展程序。
Zenoss
Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统, 以协助提高各类事件和提醒的管理效率。
-
优点:
- Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet
- 每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户
- 强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控
- 采用基于HBASE的opentsdb存储任意时间段的数据
- 将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合
-
缺点:
- 对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。
- 针对windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。
Open-falcon
Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。
Cacti
Nagios
- nagios配置记录
- Naigos设置smtp方式告警
- Nagios官方网站: http://www.nagios.org/
- Nagios中文项目:
- Linux下Nagios的安装与配置(原理,安装,配置,NRPE,NSclient++): http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html
- nagios安装与配置脚本: http://blog.linuxeye.com/46.html
- CentOS 6.4安装Nagios(中文版): http://www.linuxidc.com/Linux/2013-08/88419p2.htm
- Nginx环境下构建Nagios监控平台: http://www.linuxidc.com/Linux/2011-07/38112.htm
- Nagios与NConf整合与使用: http://www.linuxidc.com/Linux/2014-02/96086.htm
- Nginx环境下构建Nagios监控平台: http://www.linuxidc.com/Linux/2011-07/38112.htm
- Nagios搭建与配置详解: http://www.linuxidc.com/Linux/2013-05/84848.htm
- CentOS中Nagios用第三方SMTP邮件服务实现告警: http://freman.blog.51cto.com/1309295/1216126
- Nagios 监控系统架设全攻略: http://www.ibm.com/developerworks/cn/linux/1309_luojun_nagios/index.html
-
Nagios性能分析图表的实现
- http://docs.pnp4nagios.org/pnp-0.6/start
- http://huangrs.blog.51cto.com/2677571/1050614
- http://www.ithov.com/linux/129729.shtml
- Nagios图形化界面之三(nagiosgraph): http://wushank.blog.51cto.com/3489095/1294969
- Nagios图形化界面之二(pnp4nagios): http://wushank.blog.51cto.com/3489095/1294784
- Nagios的配置攻略: http://www.ithov.com/linux/129727.shtml
- Ganglia 和 Nagios,第 2 部分: 使用 Nagios 监视企业集群: http://www.ibm.com/developerworks/cn/linux/l-ganglia-nagios-2/index.html
- Nagios MAP问题:http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=1934591
Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等
Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。
Nagios 有一个 Windows 下的客户端NSClient++:http://www.oschina.net/p/nsclientpp
Nagios的主要功能特点:
- 监视网络服务 (SMTP, POP3, HTTP, NNTP, PING等)
- 监视主机资源 (进程, 磁盘等)
- 简单的插件设计可以轻松扩展Nagios的监视功能
- 服务等监视的并发处理
- 错误通知功能 (通过email, pager, 或其他用户自定义方法)
- 可指定自定义的事件处理控制器
- 可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等
- 可以通过手机查看系统监控信息
- Fully Automated Nagios
FAN是 “Fully Automated Nagios” 的缩写。FAN的包含了由nagios社区提供的所有nagios工具包,同时FAN提供iso镜像,使得nagios安装非常容易。
FAN是基于centos 系统之上的。
参考:
- http://fannagioscd.sourceforge.net/drupal/?q=node/1
- http://www.fullyautomatednagios.org/wordpress/?q=node/1
- FAN(Fully Automated Nagios)使用问题汇总: http://wangmukun.blog.51cto.com/651644/999499
FAN包含以下工具:
- Nagios: Core monitoring application(核心监视应用)
- Nagios plugins: plugins to monitor servers (监视服务的插件)
- Centreon: web frontend for Nagios (Centreon is one of the better tools for that!)(更好的网页界面展示工具)
- NagVis: a great tools for configuring maps (不错的图形配置工具)
- NDOUtils: Nagios module to store monitoring data in MySQL (将数据存入mysql的Nagios 模块)
- NRPE: the check_nrpe plugin (NRPE daemon is not provided) (check_nrpe 插件)
- NaReTo (Nagios Reporting Tools): a great tool for getting availabilty report(状态报告配置工具)
-
OMD:Open Monitoring Distribution
- OMD,全称Open Monitoring Distribution,是一个围绕Nagios core构建的分布式开源监控集。在nagios基础上融合了NRPE、NSCA、check_mk、mod_gearman、pnp4nagios、nagvis、rrdcached等插件,以完成高性能的、可视化的,分权限管理的监控系统。
- http://chenlinux.com/2011/12/19/omd_intro_install_on_centos5/
- http://omdistro.org/
Ganglia
- http://ganglia.info
- Ganglia 和 Nagios,第 1 部分: 用 Ganglia 监视企业集群: http://www.ibm.com/developerworks/cn/linux/l-ganglia-nagios-1/
- Ganglia汇总监控搭建和配置详解: http://slaytanic.blog.51cto.com/2057708/808981
- ganglia快速开始向导(翻译自官方wiki): http://cryinstall.com/?p=180
- Ganglia汇总监控搭建和配置详解:http://slaytanic.blog.51cto.com/2057708/808981/
zabbix
- http://www.zabbix.com/
- http://itnihao.blog.51cto.com/1741976/d-3
- 企业应用监控利器-ZABBIX:http://waringid.blog.51cto.com/65148/904201/
- CentOS 6.7安装zabix 3.0: http://www.centoscn.com/zabbix/2016/0218/6768.html
- CentOS6下yum升级Zabbix2.2到Zabbix3.0:http://www.tuicool.com/articles/AnqMvq
- 实战:Zabbix 聚合功能配置与应用: http://opsnotes.net/2014/10/24/zabbix_juhe/
- 基于dropwizard/metrics ,kafka,zabbix构建应用统计数据收集展示系统: http://blog.csdn.net/hengyunabc/article/details/44072285
- 使用Zabbix监控ZooKeeper服务的健康状态: http://www.tuicool.com/articles/AZ7V3qr
-
http://www.cenhq.com/tag/zabbix/
- zabbix监控mongodb:http://www.cenhq.com/2015/12/30/zabbix-monitor-mongodb/
- zabbix监控tcp连接数: http://www.cenhq.com/2015/09/06/zabbix-monitor-tcp-connection-number/
WhatsUp
centreon
centreon是开源的IT监控软件,由法国人于2003年开发,最初名为Oreon,并于2005年正式更名为centreon。
centreon作为nagios的分布式监控管理平台,其功能之强大,打造了centreon在IT监控方面强势地位,它的底层使用nagios监控软件,nagios通过ndoutil模块将监控数据写入数据库,centreon读取该数据并即时的展现监控信息,通过centreon可以简单地管理和配置所有nagios,因此,完全可以使用centreon轻易的搭建企业级分布式IT基础运维监控系统。
在功能方面,将它与nagios+cacti方式对比,说一下优点:
- gui方式添加host,支持hosttemplate与servicestemplate,自动建立关联服务,与nagios+cacti相比配置方便简单。
- 支持graphtemplate,添加servcie时自动添加graph,不必象nagios+cacti监控与流量图设置2步走。
- host监控可以全部采用nrpe方式,不必象nagios+cacti生成流量图必须使用snmp。
- 支持多节点分布式监控,nagios+cacti的分布式监控现在想起来都头痛。
- 支持acl权限管理方式,对用户权限限制到菜单项,nagios+cacti一个帐号大家用过时啦。
- 详细的日志管理功能,日志搜索过滤都支持
- 功能模块化管理,想要新功能官方没有怎么办,自己写去。