Foglight巡检需要做哪些事?

Foglight运行稳定,一般无需担心数据库已满或意外宕机问题。不过以防万一,为保证Foglight的正常运行,需要定期对Foglight进行巡检。具体内容包括:

Foglight Server运行状态

确认Foglight Server是否正常运行的步骤如下:

1.确认是否可以登录Foglight 控制台界面:http://foglightServerIp:8080

Foglight Server JVM使用

检查Foglight Server JVM使用状况主要是确认内存堆(Heap)使用状况。具体步骤为:

1. 登录Foglight控制台:http://foglightServerIp:8080
2. 进入到左侧Dashboad:Foglight->Servers->Management Server View。
3. 查看视图JVM,检查和对比指标totalMemory和freeMemory,如果freeMemory长期处于非常低的水平,需要增加内存堆大小。

Foglight历史信息存储库

检查Foglight历史信息存储库大小,防止PostgreSQL数据库存在空间不足,导致Foglight无法正常运行。具体步骤为:

1.登录到 foglight server

2.进入到 Foglight 目录

3.运行df  命令,检查剩余空间大小。

Foglight Agent运行状态

确认Foglight Agent是否正常运行的步骤如下:

1.登录Foglight控制台:http://foglightServerIp:8080
2.进入到左侧Dashboad:Management Server->Diagnostic->Foglight Agent Manager,检查Foglight Agent Manger运行状况。如下图所示:

3.进入到左侧Dashboad:Administration->Agents->Agent Status。查看各收集器是否运行良好。
4.以Foglight Agent安装使用用户登录进被管理机器,运行如下命令:

5.可以登录进被管理机器,运行ps –ef|grep Foglight,确认Foglight Agent通讯进程是否正常运行。