数据中心需要监控什么?
寒冷和喧嚣的数据中心需要哪些监控? 包括服务器操作系统和应用软件的监控,还有,比如,保持数据中心温度恒定的监控就很重要。多数服务器都有内置的安全装置, 如果服务器的温度超出了特定的临界值,安全装置就会在危险发生之前关闭服务器。好的监控解决方案应该能够告诉你数据中心周围环境的温度,如果指定服务器的 温度开始接近临界值时,监控解决方案就会向你发出警报。
动力/电力管理也是如此。如果电源发生故障,备份电池应该能让服务器在线维系一定的时间。规格更高的数据中心可能还会配备备份发电机。无论如何,都必须对电源故障提高警惕,你还需要有到位的解决方案来了解在某个指定时间能提供多少备份电源。
一项好的监控解决方案必须向管理 员发出有关服务器硬件,操作系统错误,应用软件错误,网络硬件和环境改变的各项警报。这是一项苛刻的要求,退一步 说,这也是为什么说正确的规划如此重要的原因。目前,没有单一的监控解决方案能执行所有的这些功能。
网络架构师典型的做法是购买几种监控解决方案, 对他们进行设置以统一的方式发出警报。这种警告可能是以文本信息的方式发送到管理员的移动设备或者电子邮箱,或者是以其他类型的警报形式发送到技术支持。 重要的事情是所有的警报都到达同一地点。
选择统一的监控平台非常重要,应易于扩展定制,接口标准而丰富,容易学习,成熟稳定,价格应尽量实惠。经过检验,用户可以从开源软件中选择,例如Hyperic HQ,Zenoss, Nagios, Cacti,..... 一长串名单。