Hyperic的数据存储结构
Hyperic 可采集大量丰富的数据,是大数据的一个重要来源,如何保存这些数据,并分析和利用,是发挥这些数据价值的重要环节。这里,将逐步探讨基于Hyperic的数据存储和数据挖掘问题。这是第一篇。
Hyperic 数据库表结构
Hyperic重要的表结构包括资源,指标集合和度量值等信息。
EAM_RESOURCE
每行表示一个个被管理资源,包括:
操作系统,平台和服务器,以及服务.
虚拟或网络主机平台,以及服务器和服务等。
组和应用.
用户
升级
具体资源类型表
EAM_PLATFORM:每行表示一个平台
EAM_SERVER: 每行表示一个服务器
EAM_SERVICE:每行表示一个服务
EAM_RESOURCE_GROUP:每行表示一个资源组
平台,服务器和服务类型表
EAM_PLATFORM_TYPE: 每行表示一个平台类型
EAM_SERVER_TYPE:每行表示一个服务器类型
EAM_SERVICE_TYPE:每行表示一个服务类型
指标信息表
这些表不存放指标的具体值,存放的是指标的定义:
EAM_ MEASUREMENT_TEMPL
EAM_MEASUREMENT
构建指标数据仓库
Hyperic 能够保存最少的数据用于性能分析,诊断。最详细的原始数据的默认保留时间是2天。之后,数据将被压缩和归档,保留每小时的平均值,最大值和最小值。详细数据的最大保留时间是7天。
为了能够保留更长时间窗口的数据,可以将数据复制到一个从数据库中保存。采用复制方法从主数据库向从数据库复制数据。从数据库可只有一个表 EAM_MEASUREMENT_DATA。
从数据库有一个到主数据库的数据库库连接,以及五个指向主数据库的视图。资源数据不物理地存放在从数据库中。这几个视图是:
EAM_PLATFORM
EAM_SERVER
EAM_SERVICE
EAM_RESOURCE
EAM_MEASUREMENT_TEMPL
EAM_MEASUREMENT
Hyperic数据压缩和清洗行为
如前所述,Hyperic将过期数据压缩和归档。
对于警报和事件数据,直接删除,不归档。
Hyperic定期将指标数据压缩和归档,详细数据最多7天,归档数据最多保持2年。
参考下图设置。