首页 > 动态中心 > 技术文章  >  正文

基于Zabbix 的开源监控探索与实践

2023-06-15 00:00:00

文章摘要:引言随着G行业务的高速发展,业务系统的规模日益增长,监控管理的成本也随之升高,现有的监控手段已无法很好的满足监控管理的需求。因此G行启动了ZABBIX开源监控项目,通过该项目的建设工作,在节约监控管理成本的同时,也完善了国产软件和开源软件的监控手段,提升了G行的自动化监控能力和自主可控能力。一、ZABBIX开源监控建设背景不少行业和单位都使用商业监控软件实现本单位的信息系统的日常运行监控,但商业监

引言

随着G行业务的高速发展,业务系统的规模日益增长,监控管理的成本也随之升高,现有的监控手段已无法很好的满足监控管理的需求。因此G行启动了ZABBIX开源监控项目,通过该项目的建设工作,在节约监控管理成本的同时,也完善了国产软件和开源软件的监控手段,提升了G行的自动化监控能力和自主可控能力。

一、ZABBIX开源监控建设背景

不少行业和单位都使用商业监控软件实现本单位的信息系统的日常运行监控,但商业监控软件在管理上存在较多痛点。

图1 监控管理的痛点

为了解决传统监控管理在日常运维中存在的痛点和问题,G行通过对数款开源监控软件的监控能力、灵活性、兼容性以及易用性等多方面进行对比选型,最终选择ZABBIX作为行内今后主要的监控工具。ZABBIX是一款功能强大的开源监控软件,它操作简单,适用于多种平台,能够支持虚拟化、云环境等多种场景的监控,且提供开放的、通用的API接口,在各个行业都有广泛的使用。

  • 支持多平台的企业级分布式开源监控;
  • 可实现复杂多条件告警;
  • 提供多种API接口,支持二次开发;
  • 自动发现和低级别发现功能
  • 有丰富的社区资源支持

图2 ZABBIX支持多种监控场景

二、G行ZABBIX开源监控项目

经过前期的调研选型,确定选用ZABBIX作为行内主要监控工具,并以开源软件监控、开发测试环境监控为起点,逐步推进到总、分行生产环境所有主机、所有监控指标全部覆盖,平稳替换行内传统商业监控软件,并且在其基础上逐步实现平台化、自动化的监控统一管理。下面分别从监控部署架构、监控采集方法、监控告警策略和监控自动化四个方面,介绍G行在ZABBIX开源监控的实践历程。

2.1 监控部署架构

根据总、分行以及生产、测试划分使用多套ZABBIX软件,并采用Server-Proxy-Agent的分布式监控架构,有效地降低Server端的采集压力;同时,根据不同环境的特性采用不同的监控方案:

图3 总分行生产、测试环境监控架构

开发测试环境

监控策略的开发测试与验证环境,同时结合开发测试环境的特性(被监控主机的生命周期较短),采用自动发现+自动注册的监控方式进行自动监控。

总行生产

按监控对象类型进行分组,每组Proxy承担不同的监控职责,实现监控压力的平衡,并准确定位不同组件的作用范围。

分行生产

  • ZABBIX Server部署在总行,集中化统一管理。
  • 按地域划分,每家分行部署独立Proxy,Proxy各模块容器化部署,灵活调度、易于迁移和扩展。
  • Proxy与Server之间数据采用压缩模式、加密传输,保障网络无压力和数据安全

2.2 全面支持开源/信创

依赖ZABBIX开源属性,全面支持行内开源软件及信创产品的监控纳管,推进监控自主可控,具体包括:

  • 操作系统:中标麒麟LINUX,银河麒麟ARM等;
  • 数据库:DAMENG,MySQL,KINGBASE等;
  • 中间件:宝兰德,NGINX,ROCKETMQ等;
  • 大数据:KAFKA,SPARK,ES等。

2.3 监控采集方法

ZABBIX支持多种采集方式,根据监控项的不同自由定制:

  • 使用Agent或SSH、WMI监控服务器软件运行情况。
  • 使用DBforBix插件、JDBC协议或Agent监控数据库。
  • 使用JMX(java管理扩展)、T3协议监控java类服务。
  • 使用ping及web检测监控WEB应用。
  • 使用log日志主动监控及时发现应用的异常。
  • 使用system.run调度现有监控脚本与工具,保证现有监控工具的顺利切换。
  • 使用相关项与预处理功能对监控结果解析解析拆分使用,实现一次采集多次使用,提高监控效率,降低被监控端性能压力。

图4 异构对象全面监控

2.4 监控告警策略

ZABBIX支持通过邮件、短信、微信、接口等方式发送到指定人,行通过调用ZABBIX API,读取告警数据,对告警数据进行规则解析、丰富处理和维护期处理,告警数据推统一监控管理平台后进行集中展示和告警。

2.5 监控自动化

G行数据中心的管理已实现标准化,标准化是实现监控自动化的前提。

  • ZABBIX Agent通过母带、SMDB下发或脚本一键式自动部署。
  • Agent开机自启动、状态检测,支持远程重启及停用。
  • LLD自动发现,可自动发现系统分区、网卡,还可自定义发现主机上的数据库或中间件多实例。
  • 自动注册,自动监控新设备、创建主机、关联模板、开启监控。
  • 通过API实现批量添加监控主机,关联监控模版。
  • 统一的监控模版与组合告警触发器相结合,满足多种监控场景。
  • 简单故障自愈功能,可对报警进行分类、分级,结合脚本对一些低级本的告警固化处理方法,满足条件即可自动进行相应操作(如指定文件清理、服务拉起等),达到快速恢复故障,保障系统可用率。

三、ZABBIX开源监控阶段性成果

经过四期持续的建设,G行基本完成对商业软件的监控覆盖,在开源软件监控能力、监控自服务能力等各方面都取得长足的进展,丰富并完善监控手段,并在总、分行生产系统监控管理中发挥重要作用。ZABBIX已完成开发测试环境、总行、39家分行监控全覆盖,使用ZABBIX系统对生产环境HPUX系统进行细粒度监控,实现对商业监控软件的能力替代,同时完成39家分行的全面覆盖,正在进行商业监控软件的全面替换。

图5 ZABBIX阶段性建设成果

四、总结与展望

数字化银行离不开强有力的科技支撑。我们将不断紧跟新技术发展步伐,从基础设施、技术架构、新技术应用等多领域夯实科技基础支撑能力,为众多新技术、新架构的引入,提供全方位的监控服务。

监控思维的转变

数字化思维需要运维人员建立数据意识,以业务价值为导向,以数据服务为目标,实现监控数字化转型。

监控智能化

依赖于大数据技术,通过海量数据和机器算法,实现告警根因分析、动态基线和自动预测等智能化场景的监控应用。

技术创新

保持技术创新能力,更多新技术、新架构的使用,帮助我们更方便、高效的应对数字化转型中遇到的各种问题。

监控管理+服务

强化监控标准化的管控能力,以监控标准化作为基准,进一步优化自服务、自助式的运维监控模式,提升监控服务的覆盖度。来源:匠心独运维妙维效

上一篇 : 客户数据信息“后台”裸奔,世纪佳缘致歉
  • 相关推荐
  • 2024年超好用的公司加密软件分享|十款加密防泄密软件推荐

    随着信息技术的飞速发展,企业数据的安全性问题日益凸显。为了防止敏感信息泄露,文件加密软件成为企业保护数据的重要工具。1. 洞察眼MIT系统洞察眼MIT系统是一款专业的电脑监控与文件加密软件,它不仅提供全面的电脑活动监控功能,包括屏幕监控、聊天软件监控、文件使用和外发监控等,还集成了高效的文件加密技术。该系统通过记录屏幕...

  • 十款好用的电脑监控软件推荐丨2024年干货整理

    在数字化时代,电脑监控软件已成为企业管理和个人安全的得力助手。面对市场上琳琅满目的产品,如何选择一款既高效又可靠的电脑监控软件成为了许多人关注的焦点。一、洞察眼MIT系统核心优势:洞察眼MIT系统以其全面的监控功能和强大的数据安全防护能力脱颖而出。它不仅支持屏幕监控、聊天软件监控、文件使用监控等常规功能,还具备文件外发...

  • 最受欢迎的监控电脑屏幕的软件|五款电脑屏幕监控软件分享

    在数字化办公日益普及的今天,实时屏幕监控软件成为了企业管理和个人安全的重要工具。这些软件不仅能帮助管理者实时掌握员工工作状态,还能有效防止数据泄露和不当行为。一、洞察眼MIT系统洞察眼MIT系统以其全面的监控功能和智能分析能力,在众多实时屏幕监控软件中脱颖而出。它不仅能够实时监控电脑桌面活动,包括屏幕截图、视频录制等,...

  • 推荐分享:企业文件加密软件的功能,看过秒变大神

    在数字化时代,企业数据的安全性问题日益凸显。无论是商业秘密、客户资料还是内部文件,一旦泄露,都可能对企业造成不可估量的损失。因此,选择一款功能强大的企业文件加密软件,成为了企业保护数据安全的重要措施。本文将深入探讨企业文件加密软件的主要功能,让您在看过之后秒变数据安全领域的“大神”。本文将以洞察眼MIT系统为例,为大家...

    2024-09-07 16:27:09
  • 干货推荐:怎么给文件加密?加密文件的软件分享

    文件加密的重要性不言而喻。在信息化时代,数据安全是企业和个人不可忽视的关键问题。文件加密能有效保护敏感信息不被未经授权的人员访问或窃取,确保数据的机密性、完整性和可用性。无论是商业机密、个人隐私还是重要文件,加密都是防范数据泄露和非法篡改的第一道防线。通过加密,即使数据在传输或存储过程中被截获,也无法轻易被解密,从而大...

    2024-09-07 16:11:28
  • 公司电脑能监控聊天记录吗?讲讲监控软件的功能

    在数字化时代,企业对于信息安全和内部管理的需求日益增加。为了维护企业数据的机密性、完整性和可用性,同时确保员工遵守公司政策和工作规范,许多公司选择在员工电脑上安装监控软件。这些软件不仅具备监控聊天记录的能力,还集成了多种功能,以全方位地保护企业利益和提升管理效率。今天以洞察眼MIT系统为大家科普电脑监控:1.实时屏幕监...

    2024-09-07 15:38:03
  • 精选局域网管理软件,打造高效安全的企业网络环境

    局域网管理软件的关键要素全面监控与管理:优秀的局域网管理软件应具备全面的监控能力,能够实时掌握网络流量、设备状态、用户行为等关键信息,同时提供丰富的管理功能,如设备配置、软件部署、补丁更新等。安全性与合规性:随着网络安全威胁的日益严峻,管理软件的安全性成为企业关注的重点。软件应具备强大的病毒防护、入侵检测、数据加密等功...

    2024-09-07 14:27:10
  • 看看简单易用的公司盗版检测软件助手,如何避免使用到盗版软件?

    在数字化办公日益普及的今天,企业面临着越来越多的软件版权管理挑战。盗版软件不仅侵犯了软件开发商的知识产权,还可能给企业带来法律风险、数据安全隐患以及系统不稳定等问题。因此,一款简单易用的公司盗版检测软件助手成为了众多企业保障软件正版化的得力助手。公司盗版检测软件助手1.洞察眼MIT系统除了作为企业级的数据加密与安全解决...

    2024-09-07 11:41:17
  • 怎么设置员工访问指定网址?(老板必看的软件推荐)

    在现代企业中,为了提升工作效率、保护企业信息安全以及维护良好的工作环境,合理控制员工的网络访问权限显得尤为重要。作为老板,了解并应用合适的软件工具来设置员工只能访问指定网址,是一项既必要又高效的管理手段。本文将为您详细介绍如何设置员工访问指定网址,并推荐几款实用的软件工具。1. 洞察眼MIT系统特点:功能全面,能够实时...

    2024-09-07 10:08:27
  • 好用的上网行为管理软件有哪些(五款上网行为管理系统介绍)

    在当今数字化时代,企业的网络安全与合规性已成为不可忽视的重要议题。随着员工对网络依赖性的增加,如何有效管理上网行为,确保网络安全、提升工作效率并保护敏感数据,成为了企业管理者面临的一大挑战。为此,我们精心挑选了五款顶尖的上网行为管理软件,旨在为企业提供全方位、高效的网络行为管理解决方案。上网行为管理的重要性上网行为管理...

    2024-09-07 09:18:53

大家都在搜的词:

微信扫一扫联系售前工程师