作业帮一课研发负责人:业务大爆炸让我们有机会接受挑战

开发 前端
回想起一年前的10月19日,作业帮一课做寒假班大促的场景,洪定乾仍会感到手脚发软、头皮发麻。

回想起一年前的10月19日,作业帮一课做寒假班大促的场景,洪定乾仍会感到手脚发软、头皮发麻。

“血的教训啊,网站后台挂了,一整个晚上,完全打不开。”

洪定乾负责作业帮一课技术研发,他说责任完全在己,一顿火锅的时间,系统瘫痪了。

“我正在外面吃火锅,觉得不会有问题。同事打电话问我,能不能开闸,我说没问题,开吧。技术团队预估系统能够扛住,当时大家都很平和。”

结果,晚八点,时间一到,全国各地报课的家长们蜂拥而入,作业帮后台秒瘫。直到第二天早晨六点才修好。

那之前,洪定乾就清楚,经过数年沉淀积蓄,在线教育行业和作业帮已经踩上了风口,他们预估那次“大促秒杀”会有几倍增长。但他们根本没想到,是数量级增长。

“系统一旦受损,恢复很复杂,我们刚把系统恢复一部分,马上家长又冲进来,又扛不住了。当时家长为孩子抢课杀红了眼,系统越卡,家长越觉得课程火爆,抢的就越激烈。就这样,反反复复,整个系统瘫痪了一晚上。”

考验

一课研发团队“败走麦城”,除了对业务暴涨预估不足,还在于他们的“傲娇”。作业帮创始团队脱胎于百度,以人工智能、大数据等硬核技术起家,有极强的互联网基因,“我们一直以为技术不是我们的短板,我们的技术不会有任何问题。后来才恍然这块成短板了。”

痛心疾首,痛下决心,去年下半年开始,作业帮不断加大技术投入。“我们当时定了一个目标,今年无论如何必须拿下2019暑期班这场战役。”

类似电商行业的双十一、618,在线教育每年有寒假班、暑期班两次大促,每次大促又有两次峰值,10月份寒假课的报课峰值和寒假期间的上课峰值,4月份暑假班报课峰值和暑期上课峰值。每次峰值都形成对后台系统的一轮猛烈冲击。

每到课程开售那一刻,家长和学生们就会疯狂哄抢心仪的主讲老师的课程。一课研发团队在年初预估今年暑期班报课笋尖峰值将达到平时流量的180-200倍。

闯过了秒杀报课的瞬时爆炸性冲击,洪定乾很快迎来漫长暑假直播课的高并发大流量长周期考验。

“对于直播课场景来说,容错几率很低,老师讲课具有逻辑和连贯性,一环扣一环,如果出现卡顿、黑屏等故障,用户有几秒钟没听懂,可能这节课就听不懂了。课上有很多强交互场景,一旦有闪失,这门课的互动效果就大大折损。直播课面对的是重度付费用户,他们对产品和服务质量要求非常高,这无形中就把技术难度提高了很多。”

在线教育近年虽然大火,但是能否在技术上承接住持续的学员指数级增长,是各家公司首先要面对的。

备战

2019年春节一过,一课研发团队就全面投入到暑期备战。当时,在线教育暑期招生大战,已经磨刀霍霍,沉寂多时的互联网江湖,战火再起。

一课研发团队的工作集中在两方面:一是招兵买马,二是技术与架构升级。

作业帮与互联网巨头激烈争抢人才,众多技术大牛纷纷加盟,“他们看中我们对技术的重视和投入,看中在线教育有更广阔空间。”

与此同时,一课研发团队基于百度云打造自己的基础架构层,在底层架构上构建PaaS体系。在应用层全面迭代升级了一课的售卖、直播、课后、算法数据等几大技术系统。第一,交易中台。支撑在线购买课程,以及物流物料等。第二,教学中台。支持视频直播场景,是用户量、并发量最大的业务系统。第三,课后系统。支撑班主任、客服等课后服务场景。第四,算法+数据系统。赋能教研、教学、服务、营销等全场景。

其中,针对今年暑假可能比去年寒假更猛烈的爆炸式增长,制定一系列应对预案,“直播场景对系统流畅性和互动的要求非常高,光提高系统吞吐能力是远远不够的,我们对很多特殊场景做了优化和多级缓存来应对,同时准备了备用方案来保证直播顺畅。”

洪定乾介绍,直播课涉及多业务部门协同,导致技术链条长且复杂,对技术更考验的是系统间的联动和稳定性。一些看似简单的场景背后却需要多个系统间的支持,每一环的配合要求都很高。此外,当流量增长数倍,并不是普通人以为的服务器增长几倍就能应付,量变冲击系统必须质变,导致架构颠覆性改造甚至推到重来。

“好在我们的技术底子厚。”首先,作业帮的技术积累丰富,从创始人到技术团队的背景,都有强大的工程师文化基因以及技术基因。第二,一课拥有先进的底层架构和技术选型。第三,对高并发大流量场景下的优化,即直播的稳定性领先。

就这样,一课研发团队终于完成作业帮一课技术系统全面升级。然后,静静等待大考来临。

大考

4月17日,数百倍于平时流量的暑假班大促冲击波如期而至,作业帮后台最终成功经受住了考验。

7月15号开始,又进入长达一个多月的直播高峰期,系统始终平稳高质量运行。

“作业帮的学生覆盖全国各地,很多来自不发达地区,设备和网络差异性确实非常大。其他行业完全可以放弃这极少数用户,但作业帮不能,任何一个孩子因为卡顿、黑屏哇哇大哭,都让人舍不得。”

直播课系统设计之初,作业帮就尽量降低对于终端设备性能的依赖。对于小部分性能确实较差的设备,采取临时降级措施,首先保证直播体验的流畅和稳定,确保学生在课堂完整学习,对次要功能体验则做出一些取舍。

日前,作业帮创始人兼CEO侯建彬在某会议演讲透露,今年暑假作业帮一共实现了总量200万的招生人次,秋季预计能有同比400%的增长。

“不是所有公司都经历这样的业务大爆炸,让我们有机会去迎接挑战,是非常难得的机会。”洪定乾说。

他表示,未来一课研发团队将保持稳定性这一行业绝对优势。继续推进中台战略,打好系统基础,加快技术在更多场景落地,以更好服务业务发展。

责任编辑:张燕妮 来源: 51CTO
相关推荐

2012-12-13 11:12:24

戴尔

2013-04-17 10:56:10

ONFOpenDayligh标准协议

2016-09-14 16:30:24

Windows微软移动

2014-05-21 16:04:38

面试面试规则

2011-03-21 09:12:24

英特尔CEO惠普

2015-10-26 13:07:01

京东唐志雄京东白条

2011-08-23 17:02:37

FedoraLinux 20周年

2018-03-30 09:54:37

微软业务重组Windows

2011-05-19 09:26:52

Windows 8Intel

2012-05-09 15:18:24

APP推广

2020-04-07 15:36:25

IBM云计算克里希纳

2014-06-27 14:49:41

SDN

2017-03-13 15:30:22

慕尼黑WindowsLiMux

2009-09-15 10:45:52

Linux驱动Linux微软

2011-08-23 18:07:42

QomoLinux 20周年

2023-09-11 11:14:54

IT团队CIO

2016-01-15 10:47:08

技术团队能力

2020-07-29 19:07:59

戴尔

2015-11-03 15:00:09

技术周刊

2018-07-05 14:29:58

大数据
点赞
收藏

51CTO技术栈公众号