如何避免中小网络中的单点故障

运维 网络运维
本文主要给大家详细的介绍了对于网络中单点故障的解决办法,那么我们对于这种问题如何避免呢?相信看过此文会对你有所帮助。

本文主要给大家详细的介绍了对于网络中单点故障的解决办法,那么我们对于这种问题如何避免呢?相信看过此文会对你有所帮助。

在我的小公司里,我们使用活动目录(AD)。直到前不久,我们还是在本地和远程办公室各有一台域控制器(DC),总共管理65台用户终端以及从文件到打印服务和电子邮件服务等各种应用。远程办公地点只有五个用户,并且都在一个办公室里,因此那个单独的域控制器工作的很顺利。

而在总公司这边,有60台终端连接到同一个域控制器上。这种设置一直以来也没有什么问题,能够如实地完成我们所希望的各种任务,直到本周。

一天早上,当我走进办公室,那里已经有几个同事在等着向我反映他们无法使用日常的应用服务了。

初步检查后我发现 DNS工作不正常。同时DC本身运行的非常缓慢,看上去应该重新启动一下了。最开始,我希望重新启动后的DC能以正常速度运行,这样我才能更好的查找DNS的问题根源。但是重新启动后,系统运行的依然很缓慢。由于活动目录对DNS的以来较少,因此用户还可以登录,磁盘映像也可以使用。

作为一个小型店铺,我们的很多设置都是按标准来的,这应该是个单点错误,但是看上去问题并不大。毕竟我们在远程办公室还有一台域控制器,能够胜任其余的工作。当然,如果两个办公室间的网络连接速度快的话,那就没问题,但如果通过广域网来传输服务器数据就太慢了。

后来我重启了服务器。重启后虽然很多应用可以正常工作了,但是我还是很担心,因为我知道一旦再有较大的负载,所有的问题又都会出现,并导致企业网络掉线。于是我首先想到了再买一台新服务器,以便我能将DC替换下来进行配置。但是尽管现在服务器便宜了,但也不是白给的。因此我决定利用一下网络环境中的其它服务器。

在我们的网络中,有一台服务器运行各种关于Web的应用程序,我们将这些应用都移动到了另一台网络接入速度更快的服务器中。这么做让我们空余出了一台性能强劲但是又没有什麽负载的服务器,完全可以用作备用DC。

单点故障之设备多了性能就上去了

现在我们总公司这边有两台域控制器同时在运行活动目录了,每台服务器都运行着完整的DNS,整个系统的当机时间大大缩短了。另外总公司的员工登录速度以及访问互联网的速度都有所提升。

在AD范围外,我利用ScriptLogic 的Desktop Authority软件来管理用户环境,打印机以及驱动管理等事项。由于我在目录中加入了另一台DC,我也同时在其上安装了Desktop Authority 服务来确保从登录到登录后的各项应用都能正常运行。

除了在网络中添加了一台 DNS服务器/DC以外,我还为新DC添加了Global Catalog角色。这个动作可以让AD的各项功能在其中一台DC挂掉后还能连续运转。

单点故障之需要特别注意的网络区域

在很多Windows环境中,活动目录都扮演者重要的角色,一旦配置失误或没有很好的为其进行资源分配,将导致严重后果。但是还有一些区域,就算是在小型或中型网络中,如果没有仔细对待,也会成为一个单点错误。以下就是我们应该注意的地方:

网络交换机: 根据企业的用户数量不同,在网络中保留额外的交换机并不一定可行。不过一般建议还是应该有一定数量的备份交换器,随时可以用来更换现有交换机。

磁带机: 在IT行业,备份和恢复是最基本的需求,如果没有良好的备份和恢复机制(定期备份并测试),企业环境中的数据就处于最薄弱的境地。在我的公司里,有两台磁带机。我们的公司不大,因此一台磁带机就已经能应付全部备份工作了,但是为了防范万一情况,我们还是多配备了一台。

网络接口卡(NICs): 如今大部分服务器都带有多个网卡,这样做的好处有很多,其中之一是,万一一个网卡损坏,还可以有备份网卡使用。

互联网连接: 接入互联网的线路是否需要冗余链接,取决于企业的规模和业务模式,这也是预防单点错误的一个重要因素。对于非技术行业的小型企业来说,处于成本考虑可以只选择两家网络接入商。

以上列出的重点区域并不完全,但是对于大多数企业来说,应该在网络设计时考虑到这些方面。当所有系统都运行正常时,很少有人能体会到冗余设计重要性。

经验总结

文章中提到的故障是我们公司近年来遇到的最大系统故障,虽然我很高兴自己能够及时修复这个故障,但是我更希望我在一开始就能预见到这个问题,并尽早在网络中添加一个额外的域控制器,因为这样做可以完全预防此类问题的出现。

 

责任编辑:chenqingxiang 来源: IT实验室
相关推荐

2015-09-08 10:30:48

单点故障风险评估虚拟化

2015-09-08 15:37:32

虚拟化虚拟基础设施

2023-08-24 07:34:28

2011-08-18 13:40:47

网络系统

2014-04-11 09:22:17

MySQL双主架构单点故障

2017-08-04 08:48:33

公有云云存储故障

2021-04-30 17:46:33

区块链数据信息

2022-05-12 10:53:42

keepalivevrrp协议

2021-01-09 14:03:37

Vrrp协议网关

2021-05-12 09:15:48

Facebook 开发技术

2019-02-11 10:00:23

云网络云平台微服务

2018-02-10 11:11:01

网站技术架构负载均衡

2013-04-07 17:18:16

僵尸网络变色龙

2020-01-16 11:23:32

Zookeeper数据结构API

2009-05-13 11:13:07

MySQL定位性能故障

2022-08-26 10:24:48

架构Golang

2015-10-10 11:23:17

Java常量反模式

2015-09-22 10:56:13

Java反模式

2022-05-26 09:51:50

JavaScrip内存泄漏

2022-06-23 12:03:00

网络安全网络安全事故
点赞
收藏

51CTO技术栈公众号