《信创服务器中间件数据库监控方案设计与实现.docx》由会员分享,可在线阅读,更多相关《信创服务器中间件数据库监控方案设计与实现.docx(15页珍藏版)》请在第一文库网上搜索。
1、信创服务器、中间件、数据库监控方案设计与实现4【摘要】国家战略、大势所趋,信创设备、软件将越来越多,其监控是全新课题,本文探讨、分享了相关方案设计及经验,供大家参考。1、背景当前趋势下,商业银行将逐步替代国外设备,采用信创服务器、信创操作系统、信创中间件、信创数据库进行替代,而信创服务器、信创操作系统、信创中间件、信创数据库的监控又是全新课题,本文将讨论如何将这些操作系统、数据库、中间件纳入监控。2、需求分析2023年10月20日,人民银行办公厅、中央网信办秘书局、工业和信息化部办公厅、银保监会办公厅、证监会办公厅联合发布关于规范金融业开源技术应用与发展的意见。意见指出:“探索自主开源生态,重
2、点在操作系统、数据库、中间件等基础软件领域和云计算、大数据、人工智能、区块链等新兴技术领域加快生态建设,利用开源模式加速推动信息技术创新发展。本次建设的服务器有海光、鳏鹏两种类型,海光使用的芯片架构为X86架构,鳏鹏使用的架构为ARM架构,操作系统均为银河麒麟V1O,数据库使用了达梦数据库,Web中间件使用的是TOngweb,满足监管要求和保障系统安全稳定运行。3、解决方案3.1 总体思路及架构设计1、目前我行大部分设备、软件、数据库均采用IBMTivo1i进行监控,但是信创设备、数据库IBMTivo1i不支持,我们将采用Prometheus作为信创设备监控系统,通过A1ertManagerS
3、NMP_notifier通过SNMPTrap协议跟集中监控平台实现告警集成。2、操作系统采用OSexporter进行数据采集。3、TongWeb采用MIDexporter进行数据采集。4、达梦数据库采用DBexporter进行数据采集。3.2 操作系统监控设计与实现1、监控指标CPU、内存、磁盘使用率、分区使用率、系统平均负载、网络流量、磁盘读写速率、温度2、方案1)采用Prometheusexpoter作为采集代理AMD架构使用的采集代理为node_exporterT.3.1.Iinux-amd64ARM架构使用的采集代理为node_exporter-1.3.1.Iinu-arm642)操作
4、系统监控数据展现如下:3)告警ru1es4)跟集中监控平台集成通过a1ertmanager与集中监控平台集成,a1ertmanager,ym1需要修改以下配置a1ertmanager,ym1receivers:-name:,snmp-notifier,webhook_configs:-ur1:,http:/x.x.x.x:9464a1erts,send_reso1ved:true同时运行SnmP_notifier,运行参数如下.snmp-notifier-web.1isten-address-:9464-a1ert,severity1abe1-severity-a1ert,severities
5、-5,4,3,2,1-a1ert,defau1tseverity-5-snmp.destination-X.X.X.:162一snmp.retries=3一snmp.trap-oid-1abe1=oid-snmp.trap-defau1t-oid=1.3.6.1.4.1.1664.2snmp.trap-description-temp1ate=description-temp1ate,tp1一1og.1eve1=info-1og.format=1ogger:stderr3.3 数据库监控设计与实现1、达梦数据库监控指标包括状态、内存使用情况、表空间、TPS、会话信息、DM1信息等A、数据库状态
6、se1ect*fromv$dsc_ep_info;B、数据库内存使用情况(se1ectsum(n_pages*(page_size/1024)/1024fromvSbufferpoo1)+(se1ectsum(tota1size)10241024fromv$mem_poo1)MBasTOTA1_SIZE,(se1ectsum(n_pages*(page_size1024)/1024fromv$bufferpoo1)+(se1ectsum(tota1_size)/1024/1024fromv$mem_poo1)/512000*1001%,asUSED_SIZEfromdua1;C、表空间D、TP
7、S(每秒事务数)E、会话信息(active,inactive,maxsession,id1esession)F、DM1信息(se1ect,insert,update,de1ete)G、DB1Oad信息(dbtimecputime,io响应时间)2、通过定制开发达梦数据库的exporter进行监控1)定制开发达梦的exporter2)达梦数据库监控数据展现如下:3.4 3)告警ru1e3.5 中间件监控设计与实现1、监控指标jvm_memory_poo1_bytes_maxpoo1=,CodeCache,jvmmemory_poo1bytes_maxPoo1=wCompressedC1assSp
8、acem)jvm_memory_poo1bytes_maxpoo1-uMetaspacew)jvmmemory_poo1bytes_maxPoOI=PSEdenSpace0jvm_memory_poo1_bytes_maxpoo1=,PSO1dGen,jvm_memory_poo1_bytes_maxpoo1=,PSSurvivorSpacen)jvm_buffer_poo1_used_bytesPOOI=direct”jvm_buffer_poo1_used_bytespoo1=umapped)jvm_gc_coI1ection_seconds_countgc=nPSMarkSweep)Sc
9、avenge,jvm_gc_co11ection_seconds_countgc=PSMarkSweepw)jvm_gc_coI1ection_seconds_sumgc=,PSjvm_gc_co1Iection_seconds_sumgc=,PSScavenge”、进程、端口、日志、UR1监控2、方案1)采集JVM监控采用JVM的exporter,进程、端口、日志、UR1监控可以通过Python定制开发实现。2)展示3)告警ru1es编写4)跟现有的集中监控平台集成,修改a1ertmanager配置如下j一4、总结及展望信创的操作系统和中间件可以使用社区开源的exporter采集数据,在实施
10、过程中比较顺利,但是达梦数据库的exporter需要自主研发,经过与我们的DBA以及厂商专家沟通,最后确定指标对应的SQ1,起初因某些原因参数或者公式不正确,数据也不准确,经过多次沟通、测试、完善后最终展示了准确的数据。另外,达梦数据库V8不是很成熟,RAC模式下某个指标的两个实例采集的数据不一样,经过我们DBA和厂商的优化,终于采集到准确的数据,目前运行正常。此外监控告警如何与现有的集中监控平台集成也是一个棘手问题,经过研究、分析发现a1ertmanager提供SNMP_notifier组件,通过SNMPTraP协议与现有的集中监控平台集成。信创是国家战略、大势所趋,信创设备、软件将越来越多,监控也是需要持续关注的课题,我们将持续学习、研究信创设备、软件,不断纳入新的信创设备、软件、持续优化监控,实现监控无盲区,保障生产安全、稳定运行。-全文完一