晚上业务报警,老哥们咋处理
資深大佬 : fishofcat 10
老哥们,作为程序员,业务晚上会报警,自己一个人还好,影响家里人休息,大家咋处理的。
大佬有話說 (36)
老哥们,作为程序员,业务晚上会报警,自己一个人还好,影响家里人休息,大家咋处理的。
多来几次,业务就会自己分析问题和初步处理了。
当然实际上我静音了,听不见。
PS:开发经理肯定有外包回扣的,所以,如果他分比例给你的话,也可以考虑,没利益,干毛线
我们公司用的 Opsgenie,可以和各个平台集成,设置消息优先级和通知渠道,以及设定规则自动轮班。
– 能采取自动措施的就自动解决,如果自动解决失败就 escalate 到 oncall DRI
– 多地运行,每个 region 内再分 shard,如果只是区域性问题的话就把所有 traffic 迁移到下一个可用区域,然后等到上班了再来处理
– Oncall 有 Primary 和 Secondary,多人一起备份
– 印度 /Sunnyvale/NYC 多个组一起 oncall shift,这样大家都能睡觉