本文目录导读:

这是一个无法直接回答“是”或“否”的问题,因为“服务可用性是否达标”取决于具体行业标准、服务级别协议以及用户的容忍度。
为了帮你判断,我们需要明确以下几个关键因素,你可以对照检查:
你的服务可用性目标是多少?
这是最核心的指标,通常用几个9来表示:
- 99%(2个9): 允许每年宕机 65天,通常只适用于内部工具或非关键业务。
- 9%(3个9): 允许每年宕机 76小时,这是大多数SaaS、电商、普通Web应用的常见达标线。
- 99%(4个9): 允许每年宕机 6分钟,适用于金融交易、核心支付、云基础设施。
- 999%(5个9): 允许每年宕机 26分钟,电信骨干网、关键军事/航空系统。
判断标准: 如果你的业务是向外部用户提供关键服务(如收付款、登录),通常9%是及格线,如果是内部OA系统,99%可能就达标。
你的实际表现是多少?
你需要用公式计算近一个周期的可用性:
[ 可用性 = \frac{总时间 - 不可用时间}{总时间} ]
- 不可用时间:指用户无法正常使用核心功能的时间(不包括计划内维护)。
- 例如:一个月有 30天 × 24小时 = 720小时,如果本月发生了 2 次故障,共宕机 1 小时,则可用性 = (720-1)/720 = 86%。
有哪些细节可能让你“不达标”?
即使数字好看,这几个细节也可能导致“事实上的不达标”:
- 核心功能 vs 边缘功能:首页能打开,但支付接口挂了,在用户和业务方眼中,这等于服务挂了,如果你的SLA(服务水平协议)只算了首页访问,而没算支付成功,那就是欺诈性达标。
- 定义不一致:你的“可用”是指服务器跑着,还是指API响应时间低于200ms?如果响应特别慢(慢到用户刷不出来),即使服务没断,用户感知也是“不可用”。
- 计划内维护:如果你的服务协议里写了“周末凌晨做维护”,而你在这期间做了升级,这部分时间通常不计入不可用时间,但如果用户服务协议里没写,或者维护时间过长(超过合同约定的窗口),则算不可用。
- 第三方依赖:你的数据库供应商宕机了,导致你的服务也宕了,如果在SLA里没有写明“因第三方不可抗力免责”,那这笔账得算在你头上。
速查指南:如何判断自己是否达标?
请拿出最近的SLA协议,按以下顺序自查:
| 检查项 | 达标标准 | 常见不合格情况 |
|---|---|---|
| 承诺级别 | 写了“99.9%”就是99.9% | 实际只做到了99.5% |
| 计算周期 | 按自然月还是自然年 | 把上个月的好表现来冲抵本月的高故障 |
| 排除项 | 是否排除了“计划内维护”、“DDoS攻击”等 | 把超出预期的普通故障归为不可抗力 |
| 用户体验 | 用户正常完成操作 | 用户点按钮转圈30秒没反应,但服务端日志显示“未断开” |
如果你的目标是:
- 普通商业网站/App:实际可用性≥ 99.9% → 通常算达标。
- 金融/医疗/核心系统:实际可用性≥ 99.99% → 达标。
- 实际可用性低于99% → 绝对不达标,这代表你一年有超过3.5天在中断服务,对任何商业服务都是重大事故。
建议行动: 如果你不清楚具体数值,可以查看最近一个月的监控告警报告,计算故障总时长,如果总时长超过 43分钟(一个月),你的99.9%目标就破防了。
如果你能提供具体的目标值和实际故障时长,我可以帮你精确计算是否达标。