P0级故障!唯品会 329 宕机事件相关负责人被开除

新闻
唯品会在公告中指出宕机事故暴露出容灾应急预案和风险防范措施不到位,公司决定对此次事件严肃处理,对应部门的直接管理者承担此次事故责任,基础平台部负责人予以免职做相应处理。

6 月 5 日,唯品会发布《关于 329 机房宕机故障处理的公告》,宣布了 3 月 29 日唯品会宕机事件的最终处理结果,将 3 月 29 日发生的机房宕机故障判定为 P0 级故障,并开除了平台部相关负责人。

宕机事件还要追溯到 3 月 29 日,当天唯品会发生突发宕机事件,系统短时故障导致“加购”等功能出现异常,#唯品会 App 崩了#、#唯品会怎么了#等话题冲上当天各大社交媒体平台热搜。

1686020351_647ea0ff0bfe306bb9d7a.png!small

公告中,唯品会表示发生于 2023 年 3 月 29 日(00:14-12:01)的宕机事件原因是南沙 IDC 冷冻系统故障导致机房设备温度快速升高宕机,最终造成线上商城停止服务。南沙机房重大故障影响时间持续 12 个小时,导致公司业绩损失超亿元,影响客户达 800 多万,公司将此次故障判定为 P0 级故障。

此外,唯品会在公告中指出宕机事故暴露出容灾应急预案和风险防范措施不到位,公司决定对此次事件严肃处理,对应部门的直接管理者承担此次事故责任,基础平台部负责人予以免职做相应处理。

公告的最后,唯品会强调工作不到位将导致功亏一篑,每一位员工都应当以 329 事件为戒,反思自己的日常工作,检视交付上的漏洞,梳理设计上的短板。勇于面对问题、主动反思和警醒,希望大家以此为戒,痛定思痛,警钟长鸣。

责任编辑:武晓燕 来源: FreeBuf.COM
相关推荐

2023-12-05 09:46:30

2009-07-16 08:19:46

魔兽网易

2017-03-13 15:40:42

2014-05-21 16:04:38

面试面试规则

2012-09-26 13:44:52

Android谷歌阿里云

2013-08-22 10:37:59

2011-09-05 10:37:41

Linux基金会开源

2012-12-13 11:12:24

戴尔

2011-08-23 17:02:37

FedoraLinux 20周年

2015-11-16 10:16:56

技术蜕变创业

2011-08-23 18:07:42

QomoLinux 20周年

2023-09-11 11:14:54

IT团队CIO

2014-06-27 14:49:41

SDN

2009-09-15 10:45:52

Linux驱动Linux微软

2016-01-15 10:47:08

技术团队能力

2017-03-13 15:30:22

慕尼黑WindowsLiMux

2021-05-06 11:54:40

大数据Flink

2019-07-29 15:24:34

CEO技术负责人加班

2011-12-28 15:16:33

Sencha开发者负责人

2009-03-05 09:27:31

点赞
收藏

51CTO技术栈公众号