51CTO首页
AI.x社区
博客
学堂
精品班
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
AIGC创新中国行
IT证书
公众号矩阵
移动端

详解数据中心网络高可用的技术

服务器 数据中心
MTTR(MeanTimetoRepair),即系统平均恢复时间,是描述整个系统容错能力(fault-tolerantcapability)的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。

一、高可用性的定义

系统可用性(Availability)的定义公式为:Availability=MTBF/(MTBF+MTTR)×100%

MTBF(MeanTimeBetweenFailure),即平均无故障时间,是描述整个系统可靠性(reliability)的指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。

MTTR(MeanTimetoRepair),即系统平均恢复时间,是描述整个系统容错能力(fault-tolerantcapability)的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。

从公式可看出,提高MTBF或降低MTTR都能提高网络可用性。造成数据中心网络不可用的因素包括:设备软硬件故障、设备间链路故障、维护升级、用户误操作、网络拥塞等事件。针对这些因素采取措施,如提高软硬件质量、减少链路故障、避免网络拥塞丢包、避免用户误操作等,使网络尽量不出故障、提高网络 MTBF指标,也就提升了整网的可用性水平。然而,网络中的故障总是不可避免的,所以设计和部署从故障中快速回复的技术、缩小MTTR指标,同样是提升网络可用性水平的手段。

在网络出现故障时,确保网络能快速回复的容错技术均可以归入高可用技术。常用的网络高可用技术可归为以下几类:

l单设备的硬件冗余:冗余电源、冗余风扇、双主控、板卡支持热插拔;

l物理链路捆绑:以太网链路聚合,基于IRF的跨设备以太网链路聚合;

l二层冗余路径:STP、MSTP、SmartLink;

l三层冗余路径:VRRP、ECMP、动态路由协议多路径;

l故障检测:NQA、BFD、OAM、DLDP;

l不间断转发:GR、热补丁升级;

lL4-L7多路径:状态热备、非对称路径转发。

在进行高可用数据中心网络规划时,不能只将上述技术进行简单叠加和无限制的冗余,否则,一方面会增加网络建设整体成本,另一方面还会增加管理维护的复杂度,反而给网络引入了潜在的故障隐患。因此在进行规划时,应该根据网络结构、网络类型和网络层次,分析网络业务模型,确定数据中心基础网络拓扑,明确对网络可用性最佳的关键节点和链路,合理规划和部署各种网络高可用技术。

二、数据中心网络高可用部署方案

1.数据中心服务器区典型组网

 

 图1.高可用扁平化架构典型组网

图 1是典型的数据中心服务器区分层网络拓扑(接入、汇聚、核心)。接入层交换机为服务器提供高可用网络接入。汇聚层设备做为服务器的网关,并通过部署应用优化设备(如服务负载分担设备)以减轻服务器的处理负担,并提高服务器系统的可用性。汇聚层部署的安全设备(如防火墙)做为整个服务器区的安全边界,为服务器提供访问控制。建议在汇聚层采用与交换机一体化的应用优化或安全插板部署方式,以代替传统的独立盒式设备。采用插板方式的好处是降低能耗、减少布线复杂性,从而提升网络的整体可用性。

2.网络接入层高可用部署方案

接入层到汇聚层有4种连接方式,如图2所示,分别为:倒U形接法(拓扑1)、U形接法(拓扑2)、矩形接法(拓扑3)和三角形接法。不同类型的接法以二层链路的物理拓扑为评判依据,比如对于矩形接法(拓扑3),接入交换机之间、接入交换机与汇聚交换机之间、汇聚交换机之间均以二层链路互联,并且两台接入交换机与两台汇聚交换机构成了矩形的二层互联拓扑。

 

图2.高可用扩展多级架构典型组网

接入层的四种拓扑的比较:

 

 表1.四种拓扑连接方式的对比

由上表可以看出,三角形组网(拓扑4)提供了更高的接入可用性以及更灵活的服务器扩展能力,所以对于数据中心独立服务器的接入,建议采用三角形组网方式。

由于接入层三角形组网存在二层环路,所以需要在交换机上使能多生成树协议MSTP(MultipleSpanningTreeProtocol)。汇聚层交换机(或汇聚交换上的L4/L7层设备)部署虚拟路由器冗余协议(virtualrouterredundancyprotocol,VRRP),并将 VRRP组的虚拟IP地址作为服务器网关。对于接入层这种典型的MSTP+VRRP部署方式,还应关注以下几点:

l利用MSTP多实例特性,合理规划VLAN与实例映射关系,实现业务流量的负载分担。如图3,VLAN50对应的STP实例的根桥在AGG_SW2(VLAN50在 ACC_SW1与AGG_SW1、及ACC_SW2与AGG_SW1之间的转发被阻塞),VLAN30对应的STP实例的根桥在 AGG_SW1(VLAN30在ACC_SW1与AGG_SW2、ACC_SW2与AGG_SW2之间的转发被阻塞)。

l规划多个VRRP 组,实现服务器网关的备份和负载分担。如图3,在正常转发时汇聚交换机(AGG_SW1、AGG_SW2)分别作为VLAN30和VLAN50的 VRRPMaster设备。如汇聚层部署了L4/L7设备(如防火墙),则在L4/L7设备上规划VRRP组,并将VRRP的虚拟IP作为服务器的网关。

 

 图3.接入层MSTP+VRRP部署

l在汇聚交换机上指定根桥。恰当放置根桥不但可优化生成树协议所选择的路径,还可以为数据提供明确的路径,明确的路径使排错和配置网络变得更为容易。通过在汇聚层交换机上手工配置根桥的主、备策略,确保生成树在二层链路形成最佳的树型拓扑。

l汇聚交换机上联的三层接口配置“STPDisable”命令。对于不需要参与STP的端口应关闭STP特性,由此可节省设备的CPU资源和BPDU报文的发送范围,以降低网络发生故障的几率。

l接入交换机与服务器直连端口设置为“边缘端口”。网络拓扑变化时,边缘端口不会产生临时环路。因此,如果将服务器接入端口配置为边缘端口,则该端口可以快速迁移到转发状态,降低网络的故障收敛时间。。

l接入交换机与服务器相连的端开启“BPDU保护”功能,如图3。边缘端口正常情况不应收到生成树协议的配置消息,如有人伪造配置消息恶意攻击设备,会引起生成树重新计算,启动BPDU保护功能可防止这种攻击,避免发生网络拓扑震荡。

l 接入交换机上行端口开启“环路保护”功能,如图3。如果接入交换机上行端口发生链路拥塞或者单向链路故障时,环路保护功能会将根端口的角色变为指定端口,端口的状态为Discarding;原来被阻塞端口同样也变为指定端口,状态为Discarding状态,不转发报文,从而不会在网络中形成环路,避免引起网络拓扑震荡。

l汇聚交换机(根桥和备份根桥)与接入交换机互联的端口开启“root保护”功能,如图3。当开启“root保护功能”的端口收到优先级高的配置消息时,该端口的状态将被设为Discarding,不再转发报文。当足够长的时间内没有再次收到更优的配置消息时,端口会恢复正常状态。这种功能可避免错误的配置或网络攻击造成汇聚交换机失去根桥地位而引起网络拓扑变化。

l交换机上开启“TC-BPDU保护”功能。为了避免交换机频繁收到TC报文而去频繁删除MAC和ARP表项,继而引起CPU繁忙并造成网络业务中断的情况,应在交换机上开启TC保护功能。

l在交换机上开启loopback-detection(端口环回检测)功能,防止错误的配置或连接形成端口自环。

l汇聚与接入层交换机相连的端口避免配置trunkall,只允许使用的Vlan通过,如图3中(只允许TrunkVLAN30和TrunkVLAN50),各个双归属环用Vlan隔开,防止一个环上的广播泛到另一个环上去。

#p#

3.网络汇聚层高可用部署方案

网络汇聚层作为网络接入层的流量会集点和服务器的网关,需要部署防火墙做为整个服务器区的安全控制边界,还需要部署应用优化设备(服务负载分担、SSL卸载等)用以减轻服务器的负担,提高应用响应速度。建议在服务器群区域网络汇聚层采用集成在机架式交换机上的安全和应用优化多业务板卡,优点在于简化机架布线、提高系统可用性、降低设备整体功耗。

图4是汇聚层交换机上部署防火墙插板(FW)和负载分担插板(LB)时的路由设计。FW板卡作为服务器网关,采用三层路由模式为访问服务器的流量提供转发,并提供攻击防御、策略管理等功能。LB板卡采用单臂旁挂部署方式。缺省网关指定在汇聚交换机上。外部用户访问虚服务的流量在LB板卡上进行负载分担与源目的地址变换后,再通过FW访问内部服务器。

 

 图4.汇聚层FW+LB的部署

图 5是汇聚层FW与LB的双机高可用部署方案。核心与汇聚交换机间运行OSPF协议。当任一节点整机或链路故障时,网络依靠OSPF进行故障收敛。两个LB 之间运行VRRP,汇聚交换机将去往服务器IP地址的下一跳指向LB的VRRP虚IP地址,当LB主路径板卡故障时,通过VRRP可以切换到备份卡上继续流量转发。两个FW之间也运行VRRP,FW主路径板卡故障时,通过VRRP可以切换到备份卡上恢复流量。汇聚交换机之间需要 TrunkV100/V400/V500

 

 图5.汇聚层FW+LB的部署

汇聚层到核心层间采用OSPF等动态路由协议进行路由层面高可用保障。常见连接方式有两种,如图6。拓扑1采用了三角形连接方式,从汇聚层到核心层具有全冗余链路和转发路径;拓扑2采用了四边形连接方式,从汇聚层到核心层没有冗余链路,当主链路发生故障时,需要通过路由协议计算获得从汇聚到核心的冗余路径。所以,三角形拓扑的故障收敛时间较小,但三角形拓扑要占用更多的设备端口,建网成本较高。

 

 图6.汇聚层与核心层的拓扑

4.IRF虚拟化技术高可用最佳实践

 

 图7.传统架构服务器群网络拓扑与IRF架构服务器群网络拓扑对比

对于接入层而言传统架构为保证网络高可用性通常采用MSTP+VRRP,这种组网需要在接入交换机与汇聚交换机间运行MSTP协议,管理和维护较复杂。但当接入交换机和汇聚交换机都采用IRF架构之后,可将每两台交换机(也可以是多台)配置成一个IRF堆叠组,两台汇聚交换机也配置成一个堆叠组,接入交换机与汇聚交换机之间通过捆绑链路连接,如图7。从逻辑上看,一个堆叠组就是一台设备,因此接入交换机和汇聚交换机间不存在二层环路,可以避免MSTP的配置管理,简化网络设计。

图8是采用IRF设计时的网络高可用性切换方式。情况A是正常转发路径,服务器流量经过网络接入层和汇聚层的IRF堆叠组。情况B,当接入层IRF堆叠组的一台交换机出现故障,服务器网卡进行切换,通过IRF另一台交换机即可恢复网络通信,而汇聚层设备无需任何变化,数据流仍从同一聚合链路进入网络。情况C,汇聚层设备出现单台故障,服务器不感知,只由接入交换机将流量转发到聚合链路,汇聚层存活的交换机感知的仍是从现有聚合链路接收数据流。情况D,发生捆绑链路故障,交换机会将数据流转发到捆绑组存活链路上,对于IRF交换机组来说,数据流转的逻辑接口并未改变。

 

 图8.IRF组网的HA部署

三、结束语

对数据中心而言,高可用性永远是必不可少的重要需求。数据中心的核心是业务数据,网络作为承载层需要保证运行于其上的数据的安全性与可用性,尤其是在网络节点链路发生故障情况下要确保业务可用与数据零丢失。从传统的环路冗余到现在的IRF堆叠,数据中心网络高可用技术将会不断优化进步,更好的满足高速发展的数据中心业务应用需求。

责任编辑:何妍 来源: 搜狐
相关推荐
详解数据中心绿色分级评估
为提高我国数据中心绿色节能水平,云计算发展与政策论坛开展了对数据中心绿色分级评估工作,并制定操作方法。企业可自愿申请参加数据中心绿色分级评估,符合标准的可获得由论坛颁发的《数据中心绿色分级证书》。

2013-04-25 11:52:34

数据
详解数据可用架构之路
数据库高可用架构对于应用端开发的人来说可能是一个比较陌生的领域,是在具体的数据库产品之上搭建的环境,需要像DBA这样对数据库产品有足够的了解才能有所涉及,虽然不能深入其中,但可以通过一些经典的高可用架构学习其中的思想。

2015-05-04 14:17:16

数据库架构 高可用
详解数据可用架构之路
在今天,我们将讨论的是数据库高可用架构的实施之路,虽然我们没有DBA那样的深度,但是也可以是我们的进取之路。

2010-10-28 15:37:36

高可用架构
模块化数据中心解数据中心“三”难题
用户HPC选型,最重视什么毫无疑问是性能。用户部署HPC就是需要超高的计算性能。当然,HPC系统的高可靠性、易维护性以及价格和功耗成本,也是用户会关注的重要因素。

2017-02-17 14:41:33

解数据中心网络性能瓶颈问题
解决日益增加的网络流量问题,方法可不止一种,从廉价的快速修复战略,到高级战略投资与资本重组。新技术可以提高网络容量并改进网络结构,解决骨干网性能瓶颈以及大多数以太网连接问题。某些情况下,简单的操作,就可以减轻不少压力。

2015-06-16 13:26:54

数据中心 数据中心优化
详解数据中心交换机关键参数
随着数据流量的爆发式增长,数据中心的建设标准也在不断提升,显然普通的交换机已经无法满足数据中心的需要,数据中心交换机具有高容量、大缓存、虚拟化、二层TRILL等技术方面的特征,可以满足需求。到底数据中心交换机应该具备哪些关键参数

2014-01-06 09:48:40

广域网优化技术如何缓解数据中心网络瓶颈
离线数据和远程用户可能会让你的广域网出口不堪重负,要防止你的网络过载,已经有一些广域网优化方案可以实现。

2013-09-25 09:19:44

广域网技术 数据中心网络
解数据中心边缘未来
随着Kubernetes和微服务的采用,边缘已从简单的硬件负载平衡器演变为包括API网关,内容交付网络和负载平衡器的完整的硬件和软件代理堆栈。理解这种转变对于数据中心主管来说至关重要,因此他们可以做出正确的架构,策略和运营决策。为了了解转变,快速的历史旅程会有所帮助。

2020-04-17 10:45:21

数据中心 IT 技术
被雷劈了咋办 详解数据中心防雷问题
夏季的数据中心除了要承受酷暑的考验之外,还要抵挡频繁的雷电冲击,每逢这个时候,网络设备遭受雷击的事件便一浪接一浪。

2010-06-18 16:33:08

数据中心防雷
OpenFlow协议如何缓解数据中心网络流量?
随着工作负载竞争有限的带宽,重点已经转换到更好的运输效率。新出现的OpenFlow协议就旨在提供这种效率。

2013-05-10 09:40:46

OpenFlow 标准接口协议 SDN
详解数据中心运维自动化和DevOps
现在“运维自动化”、“云计算”、“DevOps”很热,也有很多解释,但很多人的理解是狭义的甚至错误的。本期分享嘉宾智锦将分享其在大型互联网企业和大型传统行业的工作感受,并从整个数据中心的运维管理体系建设出发,分享这几年他亲身实践所总结出来的一些观点。

2015-12-10 10:14:10

运维 自动化 DevOps
浅谈数据中心网络SDN技术
SDN除了为网络设计带来了极大便利,也便于对数据中心网络进行管理,可以说SDN就是升级版的网络管理软件。

2014-11-26 10:23:34

数据中心 SDN
数据中心面对网络监听技术
数据中心里最宝贵的就是数据,这些数据里隐含着很多私有的、机密信息,小到个人隐私,大到国家安全,所以保护数据是数据中心最为关键的任务,数据一旦被窃取被泄露,给数据中心带来的损失无法估计。

2017-06-28 10:29:48

数据中心容器网络技术
容器的到来给数据中心网络提出了一些新的挑战,为了适配容器,网络部分也需要随之调整,所以围绕容器产生了很多不同的网络解决方案,本文主要来介绍一下几种容器网络方案技术。

2019-03-29 14:45:29

数据中心 容器 网络技术
如何衡量数据中心可用及容灾水平
不少的数据中心评价机构尽量保证数据的真实性和权威性,一定要将数据中心分个三六九等,这其中就有两项非常重要的参数,就是一个数据中心的高可用性和数据中心的容灾能力。往往这两项会在整个数据中心评价中占据相当大的权重,很多数据中心在建设时考虑最多的也是这两个方面。下面就展开来谈谈高可用性及容灾。

2017-01-12 17:22:34

数据中心VXLAN技术应用详解
虚拟化是云数据中心的关键技术,然而,传统的虚拟局域网(VLAN)技术已经不能满足现在云数据中心规模化运营发展的需求,VXLAN(VirtualeXtensibleLocalAreaNetwork)虚拟扩展局域网是一种进行大二层虚拟网络扩展的隧道封装技术,可以很好地解决上述问题,目前这个技术已经成为各种规模化运营的云数据中心不可忽视的关键应用技术。

2015-07-08 11:01:26

云计算 VXLAN技术 云数据中心
【对话专家】设计院专家详解数据中心空调方案
云计算的火热,推动了数据中心更大发展。在规模的日益庞大,功率密度持续提高的当下,合理、良好的规划和设计对打造优质的数据中心越来越关键。如何有效地利用当地的环境与资源条件、合理规划与设计空调系统、并采用最适合的设计方案,既能保障数据中心安全运行,同时还取得最大化的节能效果,已经成为业内普遍关心的热点话题之一。

2016-09-07 14:42:30

艾默生 云计算 网络能源
全面了解数据中心能源消耗!
IT设备使用的电力最终会转化为热量,数据中心必须通过使用同样消耗能源的冷却设备来去除热量。

2023-06-29 15:35:44

数据中心 IT设备
全面了解数据中心能源消耗!
将数据中心想象成互联网的大脑——处理、存储和传输所有的数据,从社交媒体到科学计算。

2023-04-23 15:59:10

数据中心 存储
数据中心网络技术面临难题
本文就来详细说一说,当前摆在我们面前的几大技术难题,如果能够尽早攻克,数据中心的前途一定会一片光明。

2018-01-08 23:13:01

PHP网站源码吉祥SEO按天扣费广州seo网站优化同乐优秀网站设计宝安网站优化永湖网络推广宝安建站西乡优秀网站设计大运网站推广方案坑梓阿里店铺托管横岗seo网站推广木棉湾百度网站优化排名龙岗SEO按天扣费福永网站优化排名荷坳设计网站松岗外贸网站建设塘坑SEO按效果付费大运网站制作塘坑百度竞价南联百度竞价沙井标王永湖seo网站推广福田企业网站建设罗湖网站推广方案观澜外贸网站制作宝安网站优化按天扣费丹竹头关键词按天计费平湖网站改版塘坑网站建设设计大浪网站设计大芬高端网站设计歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化