钉钉开发文档

监控及报警最佳实践

更新时间: 2018-10-25

本文将基于E应用解决方案、稳定性验收报告给出钉钉E应用/微应用监控的最佳实践。最佳实践将指导你如何完善你的应用的监控及报警,提高应用的可用性及稳定性,减少故障对客户的影响。同时最佳实践也将大大节省你在应用上架审核流程中的稳定性验收环节所需要的时间。

基础监控

ECS监控

ECS的基础监控主要包括CPU使用率,内存占用率,网络流量,磁盘利用率等。ECS的监控有两种类型:ECS自带监控项和主机监控插件支持项,具体关于它们的介绍参见监控项说明。建议对所有的主机安装监控插件,这样可以获取额外的监控项,具体的方式如下图:

image.png

手动安装方式参见这里:https://help.aliyun.com/knowledge_detail/38859.html

安装完插件稍等几分钟你就可以查看到更多到监控项了,具体的监控页面如下:

image.png

image.png

image.png

image.png

image.png

云数据库RDS监控

RDS的监控主要包括磁盘、IOPS、连接数使用率、CPU、内存和网络流量,具体查看的入口及监控图表见下图。

image.png

image.png

数据库缺省配置的报警规则如下:

image.png

负载均衡(SLB)监控

image.png

image.png

image.png

image.png

弹性公网IP(EIP)监控

image.png

image.png

NAT监控

image.png

image.png

应用分组

应用分组是以应用的维度来进行资源的监控,可以将相关的资源整合在一起,能够更方便的进行监控的查看及分析,提供了更加友好的界面及操作。

image.png

image.png

依次添加相关的资源到应用分组内

image.png

在监控视图可以进行相关监控的查看,支持分组及实例,不同的时间周期等

image.png

监控大盘 Dashboard

你可以定制自己的监控大盘,把你最关心的监控加入自定义大盘中,这样有助于快速的发现问题。

image.png

报警

如何想快速的设置报警,请使用“一键报警”功能,入口见下图。

image.png

报警联系人管理:你可以根据自己的需要设置不同的报警联系人或者报警联系组。

image.png

报警联系人可以设置手机、邮箱、旺旺及钉钉机器人,联系人可以加入联系人组。

image.png

image.png

报警规则的创建

image.png

image.png

以上内容是否对您有帮助:
在文档使用中是否遇到以下问题(多选):
  • 内容错误
  • 更新不及时
  • 链接错误
  • 缺少代码/图片示例
  • 太简单/步骤待完善
手机号
更多建议
提交成功,感谢您的反馈!