《云主机与k8s的node监控方案.docx》由会员分享,可在线阅读,更多相关《云主机与k8s的node监控方案.docx(6页珍藏版)》请在第一文库网上搜索。
1、云主机与k8s的node监控方案来自twt社区同行交流,欢迎更多同行参与交流400台云主机+100台k8s的node,用什么方案监控好呢?Zabbix?Prometheus?还是两套都上?问题来自社区会员,探讨来自twt社区众多同行的分享,欢迎大家参与交流,各抒己见。*“争议”栏目内容来自同行分享的一手体验和观察,仅代表个人观点jason2006xu昆仑银行技术经理:个人建议直接上PrOnIetheus,理由如下:1、PrOnIetheUS可以监控主机(cpu、内存、磁盘空间等)、网络。2、PrOmetheUS是K8s的李生兄弟,可以监控docker、pod,还有master,比zabbix有
2、天然优势。4、Prometheus可以定制开发exporter轻松实现采集代理定制开发。Jiaoyutwt系统运维工程师:400台云主机+100台k8s的node。没有说要监控容器,监控的是节点与主机。ZabbiX和PrOnIetheUS都可以。推荐Zabbix,如果要监控容器,当然用Prometheus,不过现在Zabbix也支持监控k8s,要看模板的支持度能否满足自己的监控需要。自己是做IT基础设施的,当然比较偏向ZabbiX,对硬件监控支持度更好、更全面。天衣无健杭州市中医院工程师:上只能建议上一套,两个同时上性能开销太大,资源利用率随之下降,两者选其一即可。Prometheus呢直接原
3、生的方案可以直接搞定大批量的资源监控并发,Zabbix呢可能因为并发的限制要稍微设计下架构。qiuhaovs交互工程师:Prometheus是最棒的方案,如果你python和go特别好的话,还可以做定制化。xyIonxiang湖南高阳通联运维经理:如果没有特殊要求,建议使用PronIetheUS监控体系就可以了,只不过部署方案上可能是部署两套。Prometheus,一套在k8s集群外,一套在k8s集群内,通过PrometheUS联邦方式把监控数据集中到k8s集群外的Pron1etheUS中,再配置相应的监控告警规则。zhangfan13cmbc中国民生银行项目经理:容器云平台的监控首选Prom
4、etheuso从监控指标这个角度,因为PrOn1etheUS天然就和k8s监控做了集成,监控指标几乎是开箱即用(这点是最重要的,不管k8s如何升级迭代,我们都不用花精力去适配开发监控指标,因为k8s已经提供了基于ProITIetheUS的专业监控能力),一些特殊的监控需求也可以定制开发exporter来实现。从性能容量这个角度看,400台云主机+100台k8s的node只能算是比较小规模的环境了,一套PrOmetheUSserver完全够用,如果后续规模扩大,可以通过PrOnIetheUSserver集群的方式来扩大性能容量,支撑能力完全没问题。从以上两个角度看,只用PrometheUS就够了
5、,除非你的项目之前主要使用的是Zabbix,你不想彻底用Pro1netheUS替换ZabbiX(毕竟要花巨大的人力物力),那就可以考虑用PrOInetheUS做容器云平台的监控采集,把数据集成到ZabbiX里去,这样两套工具就结合起来了。powertiandi李宁(中国)体育用品有限公司系统架构师:因为不涉及硬件的监控,OS+容器Prometheus作为趋势和整体方案更为合理些。目前ZabbiX监控k8s成熟度还有待提高。hufeng719某钢铁企业系统工程师:看作者主要关心什么指标。正如大家所说ZabbiX偏物理主机、网络、磁盘、资源、进程、服务等综合性较好。Prometheus主要偏向于容
6、器、POd监控。各有各的优点。个人感觉Zabbix简单一些,Prometheus+grafana+a1ertmanager一直是我的梦想,至今都没完整的搭建出来。尤其是a1ertmanager配置个性化设置较为复杂。具体效果还不太了解。上面jiaoyutwt的老师说ZabbiX也支持监控k8s,不知道监控到什么粒度?有没有模板?能否与大家一起分享下?jiaoyutwt:zabbix6.0官方已经提供了模板ChineSeZZqiang信息技术经理:Zabbix虽然是一个开源产品,但是其本身对容器的监控说实话没有Prometheus好,比较适合主机、网络、存储等常规的环境监控。PySXO503系统工程师:按现在主流的方式来说,好像Prometheus对容器的监控更好一些。按我的理解应该会用Zabbix监控网络和主机性能,Prometheus来主要针对容器监控,形成一个互补的监控方案。-全文完-