Hyperic的数据存储结构

Hyperic 可采集大量丰富的数据,是大数据的一个重要来源,如何保存这些数据,并分析和利用,是发挥这些数据价值的重要环节。这里,将逐步探讨基于Hyperic的数据存储和数据挖掘问题。这是第一篇。

Hyperic 数据库表结构

Hyperic重要的表结构包括资源,指标集合和度量值等信息。

EAM_RESOURCE

每行表示一个个被管理资源,包括:

操作系统,平台和服务器,以及服务.

虚拟或网络主机平台,以及服务器和服务等。

组和应用.

用户

升级

具体资源类型表

EAM_PLATFORM:每行表示一个平台

EAM_SERVER: 每行表示一个服务器

EAM_SERVICE:每行表示一个服务

EAM_RESOURCE_GROUP:每行表示一个资源组

平台,服务器和服务类型表

EAM_PLATFORM_TYPE: 每行表示一个平台类型

EAM_SERVER_TYPE:每行表示一个服务器类型

EAM_SERVICE_TYPE:每行表示一个服务类型

指标信息表

这些表不存放指标的具体值,存放的是指标的定义:

EAM_ MEASUREMENT_TEMPL

EAM_MEASUREMENT

构建指标数据仓库

Hyperic 能够保存最少的数据用于性能分析,诊断。最详细的原始数据的默认保留时间是2天。之后,数据将被压缩和归档,保留每小时的平均值,最大值和最小值。详细数据的最大保留时间是7天。

为了能够保留更长时间窗口的数据,可以将数据复制到一个从数据库中保存。采用复制方法从主数据库向从数据库复制数据。从数据库可只有一个表 EAM_MEASUREMENT_DATA。

从数据库有一个到主数据库的数据库库连接,以及五个指向主数据库的视图。资源数据不物理地存放在从数据库中。这几个视图是:

EAM_PLATFORM

EAM_SERVER

EAM_SERVICE

EAM_RESOURCE

EAM_MEASUREMENT_TEMPL

EAM_MEASUREMENT

Hyperic数据压缩和清洗行为

如前所述,Hyperic将过期数据压缩和归档。

对于警报和事件数据,直接删除,不归档。

Hyperic定期将指标数据压缩和归档,详细数据最多7天,归档数据最多保持2年。

参考下图设置。