加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

浅谈SDN架构下的运维

发布时间:2018-10-24 20:41:04 所属栏目:教程 来源:SDNLAB
导读:目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命。什么破网络怎么又断了,我去,服务器宕机啊,这个网速慢的跟乌龟爬的一样,这些埋怨声每天都在运维人员耳边回荡。运维人员只能埋头查找系统运行的日志,耗时耗力,老眼昏花不

SDN运维用到的工具和传统网络运维类似,主要有 Cacti、Smokeping、Nagios、Zabbix。但是现在更加讲究开源,开源更能促进SDN和网络技术的发展,运维工程师可以从中学到更多关于网络的知识,对于网络会拥有更多的自主管理权,工程师还可以在开源的软件上根据自己需求做二次开发,较传统的封闭式运维大大减少网络运维成本和提高运维效率。

SDN自动化运维

运维包括告警监控、变更、排障三个阶段。在介绍告警之前谈一下运维人员需要关心的SLO和SLI,其次会简要分析监控,分析,变更和排障。

1. 运维服务质量设计

在传统的网络运维中,网络工程师们都关注SLA,但作为运维的人都会关注SLO和SLI。我们需要找到服务质量的指标是什么,根据指标制定目标。SLI是经过仔细定义的测量指标,它根据不同系统特点确定要测量什么,SLI的确定是一个非常复杂的过程。SLI要回答要测量的指标是什么,测量时系统状态怎么样,如何汇总处理测量的指标,测量指标能否描述服务质量,测量指标的可信度。主要关注性能、可用性、质量、内部指标和因素人这几个方面。SLO(服务等级目标)指定了服务所提供功能的一种期望状态。SLO里面应该包含所有能够描述服务应该提供什么样功能的信息。服务提供者用它来指定系统的预期状态;开发人员编写代码来实现;客户依赖于SLO进行商业判断。SLO里没有提到,如果目标达不到会怎么样。网络时延、丢包率以及端到端都可以作为衡量的指标,我们根据这个指标制定SLO。

SLA是一个涉及双方的合约,双方必须都要同意并遵守这个合约。当需要对外提供服务时,SLA是非常重要的一个服务质量信号,需要产品和法务部门的同时介入。

2. 监控告警

SDN能更多的进行白盒监控,即通过对系统内部的性能指标进行监控了解系统的运行状态。从南向接口看,SDN只需要监控少数几种协议,监控相对简单,而面对业务变更时更是可以随着API变更而变更。主要复杂度集中在控制平面和业务编排,监控业主要集中在控制平面健壮性,用户业务状况以及控制转发的一致性等方面。在大型网络里因底层链路故障导致的大量路径计算和重新优化需要控制及时,反应要快。面向最终用户的web接口又会需要对各种请求和配置变更做出实时响应和分析。

运维系统中监控告警设计,通常从最底层的采集开始,自上而下设计,其次是存储、功能模块开发、上层告警通道、用户侧。从采集的方式上来说要根据网络架构来选择是采用集中式的,还是分散式的。如果网络中的转发节点较多,那么在这种情况下就无法采用集中式。需要根据自己的业务分布点,制定不同区域性的分布采集,包括存储。部署中央存储和分布式存储,分布采集后实时同步到中央存储,同时需要在本地存储后做备份。

功能模块方面通过在底层采集原始数据,根据原有系统的规则,从监控告警到告警通道,做一个中间层,这网络管理人员可以根据自己网络情况做的自定义的规则。

拿到原始数据后,如何将数据更好的展现出来,将有用的信息实时同步。SDN中实时告警不像传统网络只在底层转发,现在它可以对业务系统和网元进行实时监控(操作系统的稳定性)。有了告警信息以后,对它进行分类,然后才能做接下来的告警分析。

3. 日志统计分析

日志统计分析,现在大多是公司都使用ELK来分析。该软件可以根据自己的业务做不同的开发。

日志包括整个SDN系统。从上层的控制系统,中层操作系统、存储、业务编排,底层转发网元,最后底层传输。这些在传统的网络中,运维人员是不会关心的,只会关心网络设备。

4. 流量统计分析

流量统计分析,现在网管系统和运维人员关注设备流量、端口流量,SDN 需要关注整条链路端口,更重要的是业务流量,SDN 最大的特点是能够跟业务系统做到关联,能够通过运维系统查看所有业务相关的流量信息。

5. 变更

在传统的网络中,由于时间还有业务对网络不同的需求后,很难有统一的配置模板。各种临时的配置在不同的设备上安家。现在的网络维护人员不敢删除上一个运维人员的设定。天长日久,人,设备、需求的变换会导致配置和实际状况脱节。SDN则基本摆脱了设备配置问题。基础架构数据通过自发现和初始定义可以在GUI上实现。业务数据通过GUI和API实现,软件升级时,控制平面的前端、后端、业务编排、底层控制器各组件既可以分开升级也可以统一升级,对转发也没有明显的影响。

6. 自动化排障

SDN排障更多的是与Devops结合,通过软件化手段解决。一个好的故障处理系统能够自愈和关联分析。当出现多个警告时,如何让这些警告自动关联,然后生成一个真正一个有用的。故障自愈就是在关联以后,故障不需要人为的干预就可以自愈。

未来传统的运维人员将何去何从

基于SDN技术的未来电信网络架构的演进对运维流程产生了深刻的影响,电信技术与IT技术的融合对参与系统的运维团队也提出了技能方面的新要求。

对于SDN的运维人员除了要知道传统的运维技能和运维工具以外,还要了解SDN运维体系目前从SDN系统来讲从最底层的资源,网络设备、转发网元、设备、服务器。采集部分主要涵盖 SNMP 的采集,对传统设备Netconf命令下发,对新设备 Openflow 的协议,对CLI的管理。

浅谈SDN架构下的运维

SDN运维体系架构

中间的存储是独立分开的,中间有日志、配置库、知识库,在存储部分独立分开。功能方面包括监控告警和数据采集,数据分析和统计,流程管理和项目管理,有很大一部分是资源管理,资源管理包括文档配置,这部分主要基于CMDB,功能非常强大,如何结合SDN系统用起来,要根据自己网络底层和控制器开发做制定。

SDN现在越被大多数公司采用,那对于企业来说如何培养出一个合适的SDN运维小能手呢?一般公司会选择培训现有的员工,因为他们觉得培训现有员工比寻找和招聘新员工更具经济效益。投资现有员工需要积极主动的自上而下战略,提供大量培训机会。其次从个人的角度来说网络专业人士应该把握好自己的未来和职业生涯。并不是每个网工都需要成为程序员。相反,SDN需要更广泛的网络概念和基础知识。要理解软件系统是如何工作的,但并不意味着你必须编写代码,可需要了解整个生态系统是如何运作的,以及事情是在哪里完成的。除了这些基础知识,网络专业人员还应利用任何学习的机会,建议网络专业人士在制定计划后需要坚持下去。仔细规划并专注于自己的轨迹,不要被外界情况所影响。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读