小白网-奉贤部落-奉贤免费信息发布平台

查看: 66|回复: 0

自动化驱动的高可用收集:爱奇艺B2收集流量自动调剂系统扶植理论

[复制链接]

2万

主题

0

回帖

8万

积分

论坛元老

Rank: 8Rank: 8

积分
88256
发表于 2025-7-26 13:04 | 显示全部楼层 |阅读模式
面临高昂的专线本钱和复杂的营业需求,每一个优异的收集扶植和运营团队都在摸索更先辈的技术处理计划,在保证收集SLA的根本上,不竭进步带宽操纵率,构建低本钱高可用的收集他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。今朝支流的流量调剂系同一般都是经过SDN平台实现流量自动调剂他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。在保证办事质量的根本上,不竭进步高本钱洲际和省际专线的操纵率,从而到达节省带宽本钱的目标他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。爱奇艺收集团队持久跟踪研讨RSVP、SR-TE等多种流量调剂技术计划,并按照收集资本和营业需求,落地了一套基于营业优先级的全网流量自动调剂系统,不竭践行团队对高可用、低本钱的极致追求,终极实现分钟级自动调剂,链路可用率从99.524%提升至99.999%他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
爱奇艺全网流量自动调剂系统分为B1(外网)调剂和B2(内网)调剂,这里首要分享B2流量自动调剂系统他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。B2收集采用两级组网架构:省际主干网和省内城域网他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。主干网分为主干焦点层和主干接入层;城域网是毗连到主干网的树形结构他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。全网采用BGP协议,主干焦点节点、主干接入节点、城域网均装备自力AS,为流量调剂供给了杰出的架构根本他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
1.流量调剂的底层逻辑并不复杂:流量突发是静态的,而带宽设备是相对静态的他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。流量调剂需要做的是将跨越阈值的流量调剂到操纵率相对较低的链路上,避免当地流量忽然增加影响办事可用性他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
该计划的关键在于我们需要按照分歧的收集架构挑选合适的流量调剂计划他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。省际主干网是网状网,流量模子复杂,转发途径环路风险高他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。省际主干网多级AS的组网架构供给了丰富的路由调剂手段,是以采用BGP路由战略来实现省际主干网的流量调剂他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。城域网组的架构和流量模子相对简单,但希望在城域网中实现单个营业甚至单个主机的流量控制,所以挑选战略路由实现流量调剂他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
图2-1全网调剂表示图
主干网调剂计划
交通调剂系统由五个模块组成:监控报警、信息收集、信息整理、调剂分析和调剂发送他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。架构图以下:
图2-2调剂逻辑架构
监控警报:
  • 经过SNMP收集每个端口的流量;
  • 经过报警系统发出警报他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。信息收集:
  • 经过LLDP、ARP和BGP peer收集并相互考证全部收集拓扑;
  • 经过BMP收集全网的BGP路由段;
  • 经过sFlow采样收集每个端口的流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。信息整理:
  • 经过优化的DFS算法计较肆意两点之间的顺序备份途径;
  • 按照资产信息,sFlow收集的流量的目标IP与办事相关联;
  • 按照营业优先级肯定营业优先级;
  • 将IP婚配到BMP收集的路由段中;
  • 计较由IP地址组成的路由地址段在当前链路上的优先级;
  • 计较当前链路上每个地址段流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。计分别析:
  • 综合各系统信息计较出方针途径和待调剂的地址段,并同步到调剂公布系统他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。派遣:
  • 天生并登录装备,在次优途径偏向调剂或取消BGP路由战略,将相关流量调剂到次优途径或退避;
  • 分发完成后,检查装备设置;
  • 告诉邮件调剂成果他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。具体调剂流程:
    图3调剂进程
  • SWC注①假如流量监控发现switch-1到switch-2的流量跨越设定的阈值,会告诉告警系统,如图①所示,并将链路信息和当前流量信息发送给调剂分析系统,如图②所示;
  • 调剂系统按照链路信息从拓扑计较成果当挑选响应的备份链路,如图③所示;
  • 从SWC交通监控系统获得备份链路确当前流量;
  • 按照异常链路之外的流量和备份链路可以承载的流量计较可调剂的流量范围;
  • 从NTA Note ②流量分析系统中获得异常链路的总流量和各目标地址段的流量,经过sFlow采样和反算获得,如图④所示;
  • 连系SWC流量和NTA流量,计较每个地址段的现实流量;
  • 按照地址段的优先级,从低优先级起头,增加流量以构成合适可调剂流量范围的地址段;
  • 将备份链路信息和调剂地址段信息同步到调剂分发系统,如图5所示;
  • 调剂系统天生设置,并将响应的设置发送给装备的预置战略,如图⑥所示;
  • 分发完成后,考证分发设置没有题目,邮件告诉调剂,如图⑦;
  • SWC继续实时监控流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。假如异常链路流量继续上升,将反复上述进程他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。相反,当流量下降到可以承载被叫流量时,调剂战略将被自动撤消,流量将被切换返来他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。邮件告诉:
    日程放置:
    前进:
    城域网实施计划
    城域网的实现计划与主干网类似,首要区分是拓扑计较经过Dijkstra算法;调剂方式是将战略路由发送到装备他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。可以在城域网中实现基于五元组的流量调剂,比主干网更邃密他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    第二,题目息争决的正确性他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    正确的流量调剂计划是可行的条件,包括对当前收集流量的正确统计和对换剂范围的正确评价他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    正确统计当前收集流量:再比如,sFlow采样计较的流量有误差,所以我们按照SNMP获得的流量和sFlow计较的总流量,经过SWC计较出一个比例,然后将这个比例乘以NTA每个目标地址段的流量,计较出目标地址段的现实流量;固然,这个算法只限于流量没有到达100%的情况他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。假如流量跨越100%,SNMP收集的流量会不正确他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。我们会经过sFlow确当前和历史情况来分析能否存在严重的地址段爆发,并做出响应的封堵或升级处置他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    切确评价调剂范围:除了收集合单个途径的堵塞、延时、丢包,当一个偏向有多个平面负载,一个平面有多个链路负载时,若何计较某些链路的高流量?我们经过SDN平台实时感知具体的收集拓扑和协议组成他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。流量分析基于收集平面,支持多平面和穿插互联下的前向和后向分析他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。同时监控可用带宽、中断平面、中断接口数等的静态变化他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。,并分析多连杆和多平面载荷他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。经过这些算法,可以综合判定和计较出正确公道的可用链路和调剂流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    实时的
    除了正确性,实时性在交通调剂中也很重要他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。对于sFlow的采样和分析,为了进步精度,需要进步采样率他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。与此同时,随着DC和收集装备的覆盖面越来越大,天天收集的数据也只要几十吨他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。为了满足实时调剂,必须可以实时分析海量数据流他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。这就应战了我们最早的分析架构,数据提早越来越大他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    针对这一题目,我们调剂了架构:前端加载到多个flow-agent,数据流标志从Logstash调剂到Vflow,在拆包的同时标志相关标签,分析落后入一级Kafka,对接Flink流数据处置,处置统计数据,导入ES集群和二级Kafka,终极实现提早分钟的营业数据查询他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    图3-1 NTA的逻辑架构
    此外,经过升级SWC流量监控组件,增加对端口OID更快频次的并发SNMP扫描,SNMP流量统计周期提升至1分钟,同时在支持遥测的装备上利用计量监控实现秒级端口流量统计他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。由于节点是多端口多平面互联的,流数据能够会连续到达分析平台,所以我们需要统计每个端口的收支流量之和他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。这个时辰,有两种处理方式他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。一种是利用轮询算法他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。在期待一段牢固的时候后,我们检查缓存的数据能否已经到达,以及能否触发了调剂阈值他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。另一种基于epoll思惟的机制为每个实时数据流供给轮询方式来驱动检测阈值他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。明显,第一种方式的实时调剂依靠于轮询周期,而第二种方式使我们可以实时驱动调剂,所以我们挑选第二种方式来实现实时计较他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    平安
    虽然自动排班可以更快的处理题目,可是若何保证自动排班不会形成新的题目,我们也对能够出现的题目做出响应的处理计划他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。比如在路由战略处理计划中,我们制定主干网路由战略标准,一切装备都有同一的预设战略;在路由计划中,规定已经调剂过一次的装备不再下发战略;当备份流量较高时,优先斟酌调剂和回退他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    可用性
    由于全部系统是由大量的数据驱动的,而且数据传输很是依靠于收集的硬朗性他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。这里有一个冲突他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。原本调剂是为领会决收集题目,可是由于收集题目,调剂系统落空了感知,致使系统形同虚设他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。究竟上,在系统的迭代进程中,1s就填满了一条专线,致使监控数据提早到达,调剂失利,甚至ssh没法登录像应的收集装备他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    图3-2
    针对以上题目,需要将数据单元和计较单元下沉到地区内,异地调剂分发模块;增加自力的调剂履行代理;;支持rpc办事轮询,保证ssh有用登录;调剂模块摆设在分歧的地方;对接swc数据异地消耗;同时,进步收集装备治理和监控相关协议的Qos水平他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。以避免收集题目致使的调剂失利他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    图5 SWC逻辑架构
    三他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。流量调剂计划结果评价爱奇艺自动流量调剂系统实现了基于IP地址段和婚配营业优先级的自动流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。采用自立研发的SDN平台停止同一治理,实时办事保障,也可以采用野生干涉的方式按需调剂流量他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。今朝,该流量调剂系统已运转一年,可自动避免流量突发、链路中断等影响办事可用性的故障跨越2000分钟他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。已实现:
  • 分钟级自动调剂,高流量致使的故障处置时候从小时级下降到分钟级他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
  • 办事不晓得链接故障他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
  • 在不增加本钱的条件下,链路可用性从99.524%进步到99.9999%他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。四他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。流量调剂计划的技术展望今朝流量调剂的实现计划是基于IP大概路由的,不成能完全基于营业他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。我们正在研讨若何经过可编程交换机、智能网卡等新硬件实现营业与收集的联动,让收集装备更好地识别营业,实现基于营业的调剂他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    由于今朝的收集是全交换机组网,其功用和性能有限,所以用来实现调剂的计划和技术都不是最优的,没法覆盖一切场景他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。我们也在研讨经过增加办事器和路由器来实现SR形式的流量调剂作为扩大,今朝已经小范围摆设他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。请关注后续先容他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。同时也期待读者的疑问大概更好的处理计划与我们分享他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    留意事项:
    ①SWC:经过SNMP收集装备信息的系统他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
    ②NTA:对sFlow收集的收集流量停止分析、标志和分类的系统他早就发现系统有个隐藏的缝隙私下花了好几个早晨优化了代码。
  • 回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|小白网-奉贤部落-奉贤免费信息发布平台  

    GMT+8, 2025-11-11 17:28 , Processed in 0.214326 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表