系统管理自测32问之11:有关操作文档

译文
运维 系统运维
每项服务都应该建立独立的小站点,其中必须包含下列七类标签:概述,创建,部署,常见任务,呼叫范本,灾难恢复,服务等级协议。从DNS这样最基础的服务项目着手,努力培养我们的备档习惯,并逐渐增加备档工作量与自动化处理能力。为业务流程创建主体骨架,让其他人将工作转化为填写缺失的部分。

【51CTO精选译文】本文是《Limoncelli的测试:有助于提高系统管理员团队工作效率的32个问题》当中的第11题:每项具体服务都具备操作文档吗?

每项服务都应该建立独立的小站点,其中必须包含下列七类标签:

1.概述,顾名思义就是服务内容概述:具体是何种服务、能够发挥怎样的作用、主要服务于什么样的用户群体、如何报告bug、设计文档链接以及其它相关信息。

2.创建:如何创建软件以提供服务、从哪里进行下载、源代码库来自何处、创建的具体步骤以及软件包的生成或分配机制等各类说明。如果大家所调用的是经过修改的软件(例如我们有所贡献或是本地类型的开源项目),还应包含针对新开发者的指导说明。

3.部署:如何部署软件。怎样从头到尾创建服务器:内存/硬盘要求、操作系统版本及配置、需要安装哪些软件包等等。如果这些工作是通过诸如cfengine/puppet/chef等配置管理工具自动完成的(实际上也理应如此),别忘了告知用户。

4.常见任务:一步一步对常见内容进行讲解,包括基本操作(添加/变更/删除)、常见问题以及解决方案等等。

5.呼叫范本:这是一份清单,内容应囊括服务中可能出现的每条来自监控系统的警示信息,并一步步指导用户“何时该进行何种操作”。

6.灾难恢复:灾难恢复计划及具体流程。如果某台服务用设备发生故障,我们要如何通过无缝或者暂时中断的方式进行设备切换。

7.服务等级协议:主要内容即大家与客户间签署的合同(分通常内容与专有内容两种)。通常情况下会涉及正常运行时间目标之类内容(就是我们经常接触的小数点后多少个9啥的)、恢复机制目标以及恢复时间目标等。

打造一套模板,借以为团队中的其他成员造福,你就是人们心中的英雄。从DNS这样最基础的服务项目着手,努力培养我们的备档习惯,并逐渐增加备档工作量与自动化处理能力。为业务流程创建主体骨架,让其他人将工作转化为填写缺失的部分。最后,一定在启动任何新项目的同时将这个小网站打理好。

 

【51CTO.com译文,转载请注明原文作译者和出处。】

原文:http://everythingsysadmin.com/the-test.html

Limoncelli的测试:有助于提高系统管理员团队工作效率的32个问题:

【编辑推荐】

  1. JSP应用服务器搭建实施文档(Nginx+Tomcat)
  2. Nagios+139邮件短信通知报警文档
  3. 系统管理员应该怎样高效的书写文档

 

责任编辑:yangsai 来源: 51CTO.com
相关推荐

2011-09-29 11:09:00

系统管理设计文档标准化

2011-09-29 09:41:24

系统管理项目管理系统

2011-09-30 10:36:07

系统管理测试

2011-09-30 09:50:55

系统管理服务监控

2011-09-29 10:49:39

系统管理Bug跟踪系统

2011-09-29 11:20:04

系统管理故障

2011-09-29 10:39:29

2011-10-20 15:32:07

系统管理访问管理

2011-09-29 10:28:07

系统管理维基

2011-09-29 10:01:08

系统管理策略

2011-09-29 10:54:11

系统管理优先级

2011-09-29 10:35:35

2011-09-29 10:13:13

系统管理指标量化

2011-09-30 10:12:58

2011-10-19 10:22:17

2011-10-20 14:25:24

系统管理账户管理

2011-10-19 11:01:30

系统管理灾难恢复

2011-10-19 11:17:39

系统管理电源控制

2011-09-30 09:54:31

系统管理呼叫轮换

2011-10-09 13:55:40

点赞
收藏

51CTO技术栈公众号