今天是8月30日,星期三,娃的幼儿园过两天开学,需要开个家长会,时间是下午两点半。考虑到上班来回的路程,加上最近也想在工作日放松一天了,索性就请了一整天的假。
昨天运维在切换一台生产环境网关机的时候,我们有一个调用第三方的业务产生了大量报错,出现了一段时间不可用。可能是我们的调用方式有问题,原因还没有查清楚。
那个业务重要程度不高,而且是最近刚上线,用来提升用户体验的一个功能。但因为影响的请求数超过了天级的千分之一,按照惯例需要进行复盘。
因为影响的业务不太重要,而且原因还没查清楚,需要查一下根因,我就没有准备复盘工作。今天早上 SRE 直接给我定了会议室和时间,要求我复盘,看到我请假了就问我能否让另一个同事参加。我的防御心理一下子就开启了,在我的潜意识中认为复盘是我做错了什么事情。另外一点是我不想让其他人的时间被这种偶然复杂事件耽误,况且那段代码的底层调用逻辑也不是他写的,写这段代码的人已经离职了。因为这也算做一个故障,让同事参与可能会让他认为需要他来背故障责任。
当时我就一下子就暴怒了,在群里用比较激动的言辞指责SRE。结果就是整个上午我都在和SRE那边掰扯这件事,心情非常糟糕,而且那个群里还有我组内的其他同事,他们也看到了我情绪激动的言辞。
等我情绪宣泄完,心情平复后我就又开始后悔了,事后还跟SRE那边委婉的道了歉。
我当时的处理方式也有问题,SRE本来的计划是我如果不方便参加,他就和我另一个同事排查一下问题,把复盘做了,我因为在气头上,不让我同事配合,跟SRE说后边我查清楚了再和他们复盘。我做错了两点,首先我不应该认为这个事情会耽误其他同事工作,这也许是一个锻炼他排查问题的好机会,他可能也很乐意排查。其次我不应该把这件事揽到自己头上,我今天请假,本该今天做的事情挪到了周四周五,排查这个问题可能就要占用我一天的时间,时间根本不够用。
我当时正确的做法应该跟SRE和我的同事说先尝试定位下问题,能定位到今天就进行复盘,定位不到就等我回去了再一起看下。这样既可以留下今天先不复盘的 buffer,也可以让同事没那么大压力。
以后千万不能再在情绪激动的情况下发消息回消息了😭
休假期间也尽量不回消息、不读消息。
时刻牢记宝钗的金玉良言「事不关己莫开口,一问摇头三不知」。