Elasticsearch索引增量统计及定时邮件实现

yyd2000
发布于 2022-10-18 11:17
浏览
0收藏

0、需求

随着ELKStack在应用系统中的数据规模的急剧增长,每天千万级别数据量(存储大小:10000000*10k/1024/1024=95.37GB,假设单条数据10kB,实际远大于10KB)的累积成为日常需求。 
如何以相对简单的图形化效果展示数据的增量呢? 
本文给出思路和实现。

1、问题分解

1.1 ES集群的数据量统计

ES自带的命令行统计举例:

curl 'localhost:9200/_cat/indices?v'

1.2 如何实现增量?

简化思路: 
1)每天的固定时间,如早晨00:00统计一次当天的数据量,形成日志文件存储如:20180228-00:00.log 
2)20180228的增量为:20180229-00:00.log的数据值-20180228-00:00.log的数据量。(下一天-前一天)

1.3 如何实现统计

简化思路: 
1)shell脚本获取每天统计的数据量 
2)Excel公式简单计算增量

1.4 如何实现定时邮件统计

简化思路: 
1)java + 邮件程序 + 读取脚本实现。 
2)crontab实现定时任务处理。

2、具体实现

2.1 单日数据量统计

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区


返回结果如下: 

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区

2.2 Java读取Shell脚本

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区


2.3 增量数据统计

步骤1:单日数据统计。

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区

 步骤2:增量数据统计。 步骤1,步骤2数据可以Excel统计得出。 

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区

其中单日数据的拷贝shell脚本如下:

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区


步骤3:Excel生成图表。 

Elasticsearch索引增量统计及定时邮件实现-鸿蒙开发者社区

3、难点

4、小结

通过shell脚本+Excel数据统计,简单实现了数据增量可视化。 
通过java+邮件处理+定时任务,实现了数据的定时统计以及定时邮件预警功能。 
可以,在此基础上,做更多的扩展应用,比如: 

  • 1)集群监控状态监控; 
  • 2)集群堆内存使用监控; 
  • 3)开发中其他相关物理机器内存、CPU、磁盘读写性能等指标的监控等。

 


本文转载自公众号铭毅天下Elasticsearch

分类
已于2022-10-18 11:17:34修改
收藏
回复
举报
回复
    相关推荐