Nagios的使用技巧
创始人
2024-07-24 22:30:12
0

  Nagios的使用技巧

  大家用nagios一般是用来监控内网的机器,其实如果网络情况良好的话,它用来监测公网的机器也是可行的;我们以前用来监测我们公网的28台SQL Server2008数据库(电信对电信),事实证明,效果也是可以的。

  nagios不仅仅可以检测linux/unix服务器的即时状态,而且检测windows服务器效果也是非常好的;配置熟练的话,我感觉在windows下配置nsclient也是非常方便的,不过记得开启windows防火墙的12489端口,记得检测一下;什么,不会?你在别的机器上telnet windows机器IP 12489,依此状态来检测你的windows到底开启了12489端口没有;

  大家的业务网站最好置于自己机房内,这是因为nagios对于内网监控效果是非常好的;因为nagios是依靠ping来检测服务器是否存活的,如果网络情况不好或别的原因造成nagios检测不到监测服务器的话,会造成一个啼笑皆非的问题,它会狂报警,说此服务器已宕机,非常critical;但事实上此服务器情况良好,仅仅只是跟nagios机器的网络不通而已;这种情况希望大家能甄别下。

  如何正确判断我们的网站是否真正的挂掉了呢?nagios其实只能即时检测你的服务器情况,如果是你的防火墙或机房都挂掉了呢,这种情况怎么办呢?建议大家可购买一项即时扫描的服务(如Alertbot),它会即时扫描你的网站,如果遇到问题也会向我们的邮箱发送邮件;如果你的邮箱同时收到Alertbot和nagios的报警,一定要慎重对待。

  有时我们的系统组有这个需求,特别是系统繁忙时希望能留下日志,以供分析:到底是受到了攻击,还是开发人员设置不当,亦或是运维人员改动了系统配置等。机器少时可能问题不大,但公司的CDN服务器集群是一百多台,目前看形势还在增长,所以我们设计了nagios+vmstat的shell脚本来作Nagios的方式,在系统繁忙时分离出日志,供系统组同事们一起分析问题,得出问题的症结所在,具体可参考我在51cto.com的其它文章,这里就不重复叙述了。

  短信报警这块我没有用短信猫,但我推荐大家可以用飞信试下效果;我这边因为有更好更简便的办法,所以我暂时没采用短信猫和飞信;不是说这些不好,而是我嫌其繁琐了。

  我们这边的system admin一直是采用移动的139邮箱来接收nagios的报警邮件,效果一直都很好;不过好像是全球通的效果最好,如果是神州行或动感地带的,效果也是很不好,时常收不到报警邮件。因为我看见同事用的全球通效果不错,我特的也去买了神州行的卡,结果杯具了,居然收不到报警短信。而我一直用的是联通的如意通手机,只有一开始收到短信,其余时间基本无视nagios的存在了。后来我一狠心算了款黑莓的商务手机,开通了手机邮,直接将我的163邮箱绑定了我的联通手机号才算是彻底解决了手机报警短信的问题;这些方法都不错,有兴趣的朋友们都可以尝试下;

  nagios可以结合cacti或MRTG等流量监控软件一起来查找系统故障等,也可以结合awstats来分析Apache或postfix日志,不过我现在嫌awstats配置过于繁琐,直接用shell脚本来分析的。

  如果有某台服务器的某一项,比如我们的jail,本来就是8台子虚拟机一起用于线上环境,负载很大,但nagios就不停的报警,认为这是不正常的,搞得人很烦燥,这时直接就可以点中此服务器的负载项,然后选择” Disable notifications for this service”,世界清静了。我们直接用FreeBSD的jail用于线上环境,由于配置起来很方便和高效,但jail有个缺点,由于下面的子机全都是共用原宿机的cpu和内存及磁盘,任何一台子jail机的负载过高或使用磁盘空间,都会导致原宿机的nagios报警;这个目前也没有什么好的办法,只能尽量优化吧。

  个人上班时需要实时关注监控服务器主机及服务的 Nagios系统,觉得需一直开着一个网页页面自动刷新,感觉有点麻烦、而且浪费资源。虽说同事有分享一款Nagios辅助小软件,可以最小化到任务栏,有异常时会有浮动提示窗口,挺方便的。但是对于自己一向喜欢尽量将所有东西都嵌入到浏览器中进行操作的癖好者,便更希望能找到一款Firefox插件来实现类似于此辅助软件的功能,这插件即是Nagios Check插件。(这里提及一些题外话:不知为何如今自己越来越依赖于浏览器,想把所有的事情工作、生活涉及到的东西都看能不能只打开一个浏览器便可操作完成,而尽量不用开太多的应用程序,即将尽量多的应用程序使用插件功能进Firefox浏览器中进行使用)安装方法非常简单,不过在IE或chrome上一直没找到相关的插件,这不是不说是一种遗憾了。各人有各人的办法,这里就不多费篇幅了。

 【编辑推荐】

Nagios使用飞信Robot发送报警短信

配置nagios客户端

Nagios的安装配置记录

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...