路由器故障:A个平面业务中断

运维 网络运维
本文主要向大家介绍了承载网B平面NE40E主备倒换导致A个平面业务中断的故障的解决过程,希望文章的内容能够帮助到大家。

网络环境

承载网有主备两个平面,A平面流量模型为:UMG1-CE1-AR1-BR1-AR3-CE3,回来路径相同。

但在对B平面的AR2设备进行主备倒换时,发现A平面流量有少量丢包现象(1秒左右)。同样,对A平面AR1做主备倒换时,发现B平面也有丢包现象。

承载网主备双平面组网图

路由器故障:A个平面业务中断

故障分析

从现网拓扑和路由情况来分析,主备平面是相互独立的,不可能出现一个平面主备倒换影响到另一个平面的情况。

经过分析配置发现,在现网所有相关AR路由器上,OSPF多实例下都配置了路由聚合命令:

步骤 1     在所有AR路由器上执行display current-configuration检查配置文件。发现所有AR路由器上的OSPF多实例都配置了路由聚合:

ospf 1 vpn-instance 123

asbr-summary 10.0.0.0 255.0.0.0

步骤 2     然后在BGP上通过network方式把路由发布出去。这样,到远端路由会被聚合成一条10.0.0.0/8的路由。根据OSPF ABR的聚合原则,聚合后的路由的cost值为所有被聚合具体路由中cost值最大者(我司ASBR和ABR聚合后一样选cost值最大的下发)。举例说明,假设有如下三条路由:10.1.1.1/24 cost 10;10.2.1.1/24 cost 100;10.3.1.1/24 cost 1000;那么聚合后路由为:10.0.0.0/8 cost 1000 。

步骤 3     在备用平面主备倒换后,AR2上的私网路由将重新收敛;假设AR2先收到一条cost值小于200的10.x.x.x的路由,此时AR2向CE2发布的10.0.0.0/8的聚合路由的cost值就会比原来的小,通过ospf扩散到CE1。这时,主平面的流量模型变为:UMG1-CE1-CE2-AR2-BR2-AR4-CE4,但由于网络规模较大,这时AR2还未完全收敛,也就是AR2还没有目的地对应的明细路由,就发生如上现象。

----结束

操作步骤

步骤 1     在系统视图下执行ospf process-id vpn-instance vpn-instance-name。

步骤 2     输入命令abr-summary ip-address mask cost cost,配置OSPF的ASBR路由聚合及cost值。

步骤 3     输入命令quit返回到系统视图。

步骤 4     保存配置。

配置如上命令后,CE1与CE2之间的链路上不再有流量经过,主平面的流量能够一直保持在主平面转发。另外,如果在AR上向CE下发明细路由也不会遇到这样的问题。

----结束

案例总结

网络部署时注意避免双平面相互影响的隐患,比如ISIS的checksum-error问题,ospf cost值问题,ISIS的cost值问题等。

【编辑推荐】

  1. 路由器故障:路由环路
  2. 路由器故障:OSPF路由选路失败
  3. 路由器故障:静态ARP配置不生效
  4. 路由器故障:OSPF邻居无法正常建立 
责任编辑:佚名 来源: 51CTO
相关推荐

2011-04-08 18:01:58

路由

2011-04-08 15:56:02

路由器Ip

2011-04-08 18:05:31

2011-04-08 17:10:54

路由静态路由

2011-04-08 17:22:40

路由

2011-04-06 16:41:29

网段

2009-11-09 16:30:11

路由器故障

2009-12-22 15:18:10

2010-08-25 14:10:34

2011-04-11 16:36:45

OSPF路由

2011-06-07 11:30:31

路由

2009-11-09 15:35:47

2011-05-17 13:31:31

出口路由器路由

2011-04-08 15:08:23

DNSSNMPSNMPTRAP

2011-04-06 17:19:20

ACL

2010-08-10 11:19:28

路由器故障

2009-11-09 16:09:21

路由器故障

2010-07-29 08:41:11

路由器故障

2009-09-10 18:55:07

2009-11-23 10:19:54

路由器故障
点赞
收藏

51CTO技术栈公众号