加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

顺丰IT基础架构运维的焦虑与进化

发布时间:2021-01-18 15:41:50 所属栏目:电商 来源:网络整理
导读:《顺丰IT基础架构运维的焦虑与进化》要点: 本文介绍了顺丰IT基础架构运维的焦虑与进化,希望对您有用。如果有疑问,可以联系我们。 作者简介: 周辉 顺丰科技 基础架构规划副总监 自名甲骨君,2002年OCP.曾有幸在金融数据大集中的黄金年代负责某金融集团保险
副标题[/!--empirenews.page--]

《顺丰IT基础架构运维的焦虑与进化》要点:
本文介绍了顺丰IT基础架构运维的焦虑与进化,希望对您有用。如果有疑问,可以联系我们。

作者简介:

周辉

顺丰科技 基础架构规划副总监

自名甲骨君,2002年OCP.曾有幸在金融数据大集中的黄金年代负责某金融集团保险、银行、证券、投资、基金、信托数据库运维工作,完成其庞大数据库群标准化规划和改造过程.

在快递物流飞速发展的当下主导了顺丰科技基础架构自原生态到标准化、系统化、半自动化的运维模式转型,完成了顺丰集团新数据中心、容灾中心的规划建设和迁移等IT底盘建设工作.现致力于顺丰科技运维基础软件研发和智能化运维平台领域工作,是 DevOps 的践行者.

前言

顺丰的数据中心工作内容可能和其他公司的基础架构部门不一样,基础设施、网络、存储、服务器、数据库、中间件等基础组件规划、设计、建设和运维全部都在其工作范畴.

接下来的谈及的内容不会涉及太多具体的技术细节内容,更多的是顺丰在基础架构方面的治理和演进的过程,包括了组织结构和团队组建的过程以及流程管理的内容.

1、顺丰科技介绍

顺丰科技服务于顺丰集团,主要专注于物流行业信息技术研究、开发和运维,以及信息技术引领业务创新.

2、 顺丰科技的创新与发展演进

2010年前,主要是技术起步和积累阶段,通过科技手段将下单、收派、中转、运输等业务流的信息化,实现快件路由跟踪、手持终端收派、自动分拣,并进行大规模的系统整合,支撑并推动业务的高速发展.

2010-2014年商业快速成长,是新技术新应用的爆发期,期间实现了电子支付业务与客户系统的无缝对接和数据的自动交互;移动端与互联网接轨,改善客户体验;使用大数据提供决策支持、舆情分析、行业分析,培养新的增长点.

2015年以来,为了使人们的生活更加便利,顺丰科技一直没有停下技术创新的脚步.

 顺丰科技

3、科技重塑业务流程,让人们变得更便捷

在快递的下单、收件、中转、运输、派送、支付等各业务环节,科技成为优化和重塑业务流程的重要力量,让人们的生活变得更加便捷.

3.1 莽荒纪-运维原生态(原生态)

在运维原生态这个阶段,新上IT系统、用什么基础软件和何种设备、用多少等事项,都是研发在规划和设计,运维按照研发的要求安装就可以了,基本上业内有些名气的基础软件,都会出现在需求清单上.

而怎么用运维也没有发言权,往往是运维按照研发的要求拿一个安装包,安装上去能起来用就行,其实完全没有来得及掌握这些软件的使用和最佳实践.而且的系统是没有容灾,也没有备份的,数据安全性很脆弱.相信很多企业经历过这个阶段,也有一些企业还在这个阶段.

3.2 莽荒纪-运维原生态(被动式)

在原生态的运维模式下,没有良好的规划能力、计划能力、专业能力和有效的工作流.这种情况让运维非常被动,资源永远不够用,只要起新项目、新系统必须买设备,而且新设备的采购周期很长,严重影响交付时效.

同时,缺乏计划能力时,需求总在不经意间冒出来,需要资源的时候,往往是项目要上线的时候,基础架构只能东拼西凑到处找设备,甚至找厂商借设备.专业战线太长,运维人员根本来不及形成专业能力,系统故障的出现频率不低.

3.3 莽荒纪-运维原生态(焦虑之源)

近五年快递业务增长很快,系统数在增长,业务量也在持续增加.快递行业业务工作系统化,自动化程度变得更高,对IT系统的可用性要求越来越高,大概五年前,很多快递企业没有自动化.

当年开始试行半自动化和自动化分拣的时候,区别很明显,IT系统的问题往往导致整个中专场分拣作业的停摆,最终影响到派送时效和用途体验.而这时基础架构还停留在“搬运工”阶段,且异常多,运维很多人里都陷在异常处理的泥潭,这时候整个运维团队压力都很大,处于无限焦虑的状态.

4、出发-集中填坑和还债

4.1 建立标准,完成标准化改造

我们大概花了6个月时间完成基础加过运维的各种标准.到底该使用什么软件,要不要百花齐放,如果人力资源有限、时间有限,如何让运维人员做到熟练的掌握所采用的基础软件?答案是明显的,基础软件需要在考虑适用性、适应性的基础上标准化,兼顾研发能力成熟情况.

定了软件的使用标准以后,从接入层开始至数据存储层,每个组件都需要考虑高可用和弹性的设计,故软件架构标准是在软件好用标准明确后接着需要完成的作业.我们大概用了1年多的时间完成绝大部分业务系统的标准化改造.

同样的道理,当初我们的设备类型非常多,包含存储、小机等,市面上主流厂商有的设备我们都有,无法有效形成这些设备的运维经验和能力积累,硬件的异常频率也不低,在设备的引入和使用标准制定并执行了一年多以后,基本上没有再由于硬件原因导致的重大故障出现.基于同样的原因,我们制定并执行了基础设施建设标准.

4.2 培养专业,术业专攻,服务统筹

基础架构标准解决了,专业能力怎么办?我们进行了专业分工,按照专业条线组建运维团队,在专业方向上进行深耕,收效比较明显,半年左右可以形成各基础架构专业领域的战斗力.

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读