记录一次遇到线上问题处理的步骤.
线上问题处理步骤
- 评估影响 影响范围以及严重程度.
- 是不是核心路径
- 影响级别, 是显示问题还是必现崩溃
- 影响用户量级
- 如果有线上上报, 查询上报数据库可知道影响量级.
- 根据当前版本 DAU 以及反馈数推测影响量级.
- 统计每个用户触发次数.
- 定位问题, 及时或定时(半小时或一小时)同步结论.
- 确定引入问题时间以及原因.
- 评估修复方案.
- 是否需要紧急合入代码, 如果是灰度发现问题, 就可以通过合代码解决.
- 总结问题出现原因, 以及避免方案.
- 确定是否有线上修复方案.
- 配置文件修改能否屏蔽问题.
- 后端配合修改能否解决.
- 是不是有热修复方案(Hotfix).