南京大数据监控平台如何实践
3年前 (2021-11-25)行业资讯
南京大数据监控平台指出,日志和监控开发人员是他们工作中必不可少的眼睛。日志用于快速定位和排除故障,监控用于发现潜在的问题并及时发出告警。它是故障诊断和分析的重要辅助工具。同样,监控系统对大数据平台的重要性不言而喻。在事故发生前进行预警,使系统故障率降到最低,是监控的终极目标和价值体现。本文旨在帮助您了解大数据监控平台系统,快速搭建公司的监控平台。
监控系统
监控粒度、监控指标的完整性和实时监控是评价监控系统的三个要素。从分级系统上看,监控系统可分为三个层次:
业务层:业务系统的根本目的是实现业务目标。因此,监视业务系统是否正常的最有效的方法是监视业务目标是否从数据中实现。监控业务运行数据,可以及时发现程序bug或业务逻辑设计缺陷,如登录失败率、注册失败率等。
应用层:了解和控制应用的整体运行状态。南京大数据监控平台指出,如果将应用程序视为黑匣子,开发、运维人员将无法了解应用程序的当前状态,也无法及时发现潜在的故障。应用监控不应该局限于业务系统,还应该包括各种中间件和计算引擎,如 jstorm, zookeeper, spark,redis,Kafka等。常用的监控数据:CPU利用率、线程数、JVM堆内存、GC、TPS、吞吐量等。一般通过抽象出来的统一指标采集组件采集应用级指标。例如,无论是支付系统还是事务系统,都应该监视JVM内存使用情况。
系统层:实时掌握服务器的工作状态,内存消耗、关注性能、容量和系统整体健康状况,确保服务器稳定运行。