加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

IDCC2018|民生银行毕永军:智能运维处于1.0阶段,要从痛点出发

发布时间:2018-12-14 14:48:42 所属栏目:云计算 来源:中国IDC圈
导读:中国IDC圈讯 12月11日-13日,由中国IDC产业年度大典组委会主办,中国IDC圈、CloudBest承办的以赋能企业数字化转型为主题的第十三届中国IDC产业年度大典(简称IDCC2018)在北京国家会议中心隆重召开。 13日上午,IDCC2018分论坛智能运维安全论坛正式召开!
副标题[/!--empirenews.page--]

中国IDC圈讯 12月11日-13日,由中国IDC产业年度大典组委会主办,中国IDC圈、CloudBest承办的以“赋能企业数字化转型”为主题的第十三届中国IDC产业年度大典(简称“IDCC2018”)在北京国家会议中心隆重召开。

13日上午,IDCC2018分论坛智能运维安全论坛正式召开!本次论坛由威客安全和中国IDC圈承办,汇聚了来自来自运营商、互联网、数据中心、云计算等多领域多行业的企业高管、嘉宾、媒体等。与会嘉宾们在大典现场,共话数字经济时代,聚焦数据安全问题,探讨智能化与可视化运维的新方向与新趋势。

微信图片_20181213120011

中国民生银行信息科技部应用运维二中心负责人毕永军

会上,中国民生银行信息科技部应用运维二中心负责人毕永军先生,为大家带来《民生银行的AIOps实践之路》的主题演讲。以下为演讲实录(未经本人核实):

大家好!我是民生银行的毕永军,因为大家知道AIOps这两年比较火,也有人把2018年当作AIOps的元年,我们今年也做了一些实践,下面我花一点时间跟大家分享一下我们在AIOps这边做了哪些事情。

分四个部分来讲一下,首先看一下为什么要做这个智能运维。现在大家提得非常多的,都在做数字化转型,其实在银行的领域,今年出现了金融科技,大家都在提这个事情,民生银行也有自己的定位,要在十年之内成为科技金融的银行。民生银行的战略目标,会向数字化、轻型化、综合化的标杆银行转变。民生银行在转型方面也做了很多工作,在2月份上线了分布式核心系统,以前的核心系统是基于小型机跟ICP,但是成本是非常高的,上线了分布式核心系统之后,单账户的成本从原来的2.5块降到8分钱,在节省成本方面的效果是非常好的。另外5月份成立了民生科技公司。金融科技公司,今年人员规模也在不断扩大,开始要在金融科技方面要做一些发力。

看民生银行这几年的发展趋势,在2000年初的时候,当时也是契合IT的发展规划,开始有网络,当时做的是老核心系统,是八大系统,在银行当时应该是比较早的做了全国集中的系统。民生银行在2012年投产的一个核心系统是面向服务的架构,金融科技主要还是基于分布式架构、业务架构的创新,这个发展过程也体现了科技在银行业当中,从成本中心逐步转变,给业务赋能,协同业务创新一起去发展。

涉及到业务创新,之前讲了分布式核心,以及新零售用的一些大数据、机器学习的手段来做智能的风控,还有新技术的演进,微服务,以及容器平台的引入,民生银行的投入运行还是需要运维来支撑,这个技术的发展对运维带来了很大挑战。比如软硬件数量,老核心技术系统,两台小机运行了民生银行绝大多数的业务,但是到了民生银行(SAB)系统,发现这个系统规模一下扩大了,从原来的一百多套系统到四百多套系统,现在还在持续增加。所以,对于运维来讲挑战比较大。对于银行业来讲,稳定运行是非常重要的,故障处理难度很大,运维数据也需要去做进一步的分析,我们的组织和人才在新技术方面也面临着转型。

这个解决方案,要用民生银行现在新的技术,用智能运维的技术,从传统运维去走向智能运维,我们认为这是必由之路。右侧这个Gartner的报告,这是2016年画的图书,其实很契合银行的现状,传统银行在监控管理自动化方面已经大量的工作,已经比较成熟,接下来智能运维是基于这个体系的基础上,运用新的大数据技术、机器学习的技术,引入对数据进行进一步的挖掘和分析,得出智能的结果,进行智能的决策,给出相应的解决方案,智能运维是下一代运维技术的必然选择。

智能运维为民生银行带来的价值是什么?我自己的理解,智能运维对民生银行来讲,引入大数据和人工智能技术,从海量数据中进行智能分析和决策,最终目的是提升系统的可用性,降本增效,,也是企业的永恒的话题。相对来讲分几块,第一感知体系,更多的是监控体系,收集数据。第二是数据体系,这些数据除了结构化的数据,很多是非结构化的数据,需要大数据平台来做存储,做统一的标准化。第三个是决策体系,需要引入人工智能,加入一些算法,得到一些启示,或者是对事件的预先的发现,或者是有一些其他的事情可以通过这个决策体系得到。第四个是操作体系,跟自动化体系结合起来,针对比较标准化的场景可以做自动的处理,目前来看这种不算太多,主要原因还是在于现在IT复杂度太高,没有达到标准化的程度,不像现在的商品化,看电视按开关就可以打开和关掉。但是有一些操作,是可以通过这个体系来运作的。

我们也总结了一下运维场景,一种是质量保障,还有是效率提升和成本优化。我们对于日常运维的一些工单,智能工单处理,包括智能机器人,还有容量规划,性能优化,资源调度方面,我们都会做一些尝试。

总结来看,智能运维的几个核心价值,从三个方面去看,对做数据中心运维的人来讲,我们重要的是提高对系统的感知能力,降低故障的持续时间,很多业务都是移动化、互联网化,我们有的时候也学互联网公司做一些促销。我们平时系统的交易量是很低的,每天几万笔交易,但是促销活动来了就对运维挑战很大,如果做了预测之后就可以感知到异常,可以提前感知这个事情,再有是降低故障的持续时间。银保监会的底线是30分钟之内一定要恢复服务,我们提的目标是10分钟之内故障定位,10分钟故障解决,这样才能满足半个小时之内把问题解决掉的目标,这是对运维来讲。对科技来讲,对科技价值来讲,提高了系统可用性和成本节约,集中式系统已经达到极致之后,垂直扩展是很难的,通过分布式架构可以容纳10亿以上的账处理,交易量也可以大幅度的增加,响应时间得到持续的降低,可以到50毫秒,也是体现科技的价值。从业务价值来讲,系统性能提升了,稳定度提高了,做很多秒杀,做促销的时候,系统能够支撑得住,对用户体验来讲就是好的提升。    

民生银行在里面做了一些探索跟实践。在做智能运维的时候发现有很多挑战,原来建设IT管理系统的时候也是做统一的规划,包括监控系统,包括流程系统,但是做智能运维,想把运维的数据打通,能够用的数据获得一些动态的信息,发现数据还是比较分散,结构还是非常多样化,引入了数据治理,把我们的数据做标准化。再有是技术挑战,包括自动驾驶,包括语音识别,发展得还是比较好的,但是对运维场景来讲,标准化程度没有那么高,场景非常复杂,对于研发来讲挑战就很大。举个例子,做故障预测,有监督学习的时候就需要样本,一年真正对业务产生影响的可能就是10个、20个事件。数据量大了之后怎么进行实时的计算,需要有大的计算机群来支撑这个计算,这样才可以克服这方面的挑战。第三是人才和组织的挑战,民生银行还是传统架构的技术人才,包括组织架构,有网络管理人员,有存储管理人员,有系统管理人员,有应用管理人员,我们要做智能运维这件事情需要的算法人才是没有的,这对我们的挑战很大。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读