什么是稳定性

是指一个系统或服务在面对各种负载、错误、异常情况或外部环境变化时,仍能保持正常运行、提供可靠服务的能力。

为什么要关注稳定性

  1. 用户体验。 频繁的宕机或错误会导致用户流失和失去产品信任度;
  2. 经济损失。 电商、支付、云厂商等业务需要24/7运行,服务不稳定会导致直接经济损失;
  3. 团队协助。 频繁的线上事故导致内部业务方对研发团队失去信心。

如何保障稳定性

  1. 事前降发生
  2. 事中降影响
  3. 事后优改进


文章来源于