加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

现场直播|包商银行生产运行中心总经理 李甦:《包商银行数据中心运维经验分享》

发布时间:2018-10-20 12:09:26 所属栏目:站长百科 来源:中国IDC圈
导读:10月16日,2018年开放数据峰会(Open Data Center Summit 2018)于上午在北京国际会议中心开幕。作为数据中心行业的一大盛事,ODCC每年都将汇聚数千名数据中心专家与几十名主流媒体。本届峰会时间为16日-17日,ODCC将发布最新研究成果,碰撞尖端热点技术,

这个就是过程管理中的认为操作精细化的例子,设备上下电就像刚才提到的,设备上下电的问题应该怎么上解决了,比如我们单独设一个柜子和整个生产分开,现在把机器保证它的电流模块没问题,不会导致机柜单漏掉电的情况下,我们还做了工具操作的精细化。工具操作为什么要做精细化管理?比如说有量电压、电流的设备,我们之前也有过往机器上一插漏掉电了,这个设备在使用之前应该在非生产区域进行测试,确保测试设备是安全的然后再进到机房里去使用,这就是工具操作精细化。

还有设备搬迁,其实怎么保护地板,怎么保护设备,其实都是我们精细化管理其中的一部分内容。还有系统运维的操作,我们一线运维人员发现了问题应该怎么具体操作,变更怎么实施,通过这几方面形成了我们标准的SOP体系。

这是举一个例子,这是巡检,当时2012年的时候我们已经实现了PAD的巡检。之前我提过其实人是没有责任心的,尤其是外包人员,你安排他巡检,他能保证每一个柜子都巡检到吗,光靠人是不行的。SOP里指定了,他要通过PAD扫描二维码接任务,如果有故障拍照把故障上报给后续运维平台的方式,来确保每一个点、每一个机位都巡检到,这个模式一直保持至今,这就是我们SOP的样子,其实每一个SOP都有自己不同的内容。

这张图是成果,推动精细化的管理两到三年的时间,我们在理论探索的基础上结合实际,初步实现了一套可供中小商业银行借鉴、复制或者说做裁减的精细化运维管理体系。这个体系我们在内蒙银监会也是认可的,在2016年的时候组织全内蒙地区的银行还有银监会的监管处领导一起来把这个体系在我们的数据中心做了一下相当于调研和讲解。

第二是人为操作的事件,我们从精细化之后就没有再发生过人为操作导致非计划停机的事件,这个风险大幅降低了。

最后是我们的获奖情况,2014年获得了中国人民银行科技发展三等奖,这也是我们整个内蒙地区第一次在人民银行获得这种数据中心的奖项。

下面是第二部分了,做了这么多事情,我们发现又不能满足我们业务发展的要求了,这就是在2013年的时候,整个宏观的经济形势对银行业的经营产生影响。包商银行内部也开始进行相应的组织变革、事业部的改革。我们当时从2013年8月15日起开始做了一个815的项目,项目简单来讲在业务领域,客户关系管理、客户视图、流程、作业渠道、量化管理方面一次性地开发建设150套应用系统,同时我们新建了一个数据中心,然后我们又把原有的数据中心做改造,这三件事合在一起,在2015年5月23日进行一次性投产切换成功。所以我们管这个叫815项目。

下面讲一下整个815项目数据中心建设的情况,我们其实管这个叫定制化的数据中心,我们跟我们的合作伙伴租了整整一层,这一层按照我们的要求做了一下规划、定制的数据中心。大家可以看到在这个位置,这一个数据中心5000平米,在这条线这边是我们运维的区域,所有的人都在这边进行相应的工作。在这条线的这边是我们机房的区域,我们现在有四个大的机房模块,周围有相应的空调间、UPS间、电池间等等,完成了整个数据中心的规划。

下面来看一下建设的情况,我这里标红了,35天把一个数据中心建成,我不知道大家能不能理解这是一个什么概念。2015年1月12日,我们2014年12月份做的商务谈判,确定了要在这里建机房,切实了规划。2015年1月12日,这张照片是2015年1月份的照片,我们把墙建好了、地板铺上了。2015年2月10日,我们的机柜接好了,线从上面甩下来,设备开始进机房。通过单侧的水系统,为了赶时间,单侧的水冷完成以后就把设备放进去了,2月14日机房正式上线运行。为什么这么急?因为领导说5月份全行生产系统要正式上线,而大家知道150多套系统的切换是不可能把机器放在那里安装好,系统自动切换就能切换成。我们当时的作业是三班倒24小时建设,我们包商银行的同事现场住在工地上,跟我们的合作伙伴一起去做,这个机房建设速度业内应该是最快的。

这是我们基础设施的情况,我跟我们的合作厂商,机房楼一共有8层,所有其他层用的都是华为的设备,因为他们有框架协议。只有我们这一层用的是进口的,这个机房大家刚才看到了我们是独立的,什么叫独立的概念?我们这个机房除了两路市电从楼上输下来,水冷环网从楼底下送上来以外,全部都是自给自足的,不需要任何外部干预包商银行的系统,支撑它的运行。为了保障员工的身体健康,我们在房顶和地板满铺了细铜网接地隔离辐射。同时我们的水冷系统ECC全部是UPS电的,都包含在电池的供应时间内。

这是我们西红门数据中心一个虚拟的图,我们也有自己机房三维环境监控的体系。大家看到这是3D的,我点到一个机房模块就显示这个机房模块的细节,再点到某一个冷通道,就进到某一个冷通道,再点到某一个机器,就能看到这台机器用了多少电、电流是多少。包括我们的电池,2000多块电池,每一块电池也是有电池监控来实现整个可视化的监控。

这是我们消防的监控,这是我们机房的温场。大家能看到我们是7台水冷对吹每一个模块,实际上在冬天和夏天我们在一面开三个、一面开四个,就能够保证整个机房模块的制冷需求了。这是我们的监控,我们有340多个摄象头,在5000平米没有任何一个平米有死角,除了卫生间。蓄电池的监控,经过两年多的时间,包商银行的第一批蓄电池有零星已经开始有内阻的问题了,已经开始进行更换了。整个数据中心的监控体系覆盖了消防、电力、各PDU电流、开关状态等等。

这是从2014年获奖了之后,我们新的数据中心依旧延续了精细化管理的体系,相应的流程都是按照精细化管理的流程做要求和做管理的。具体的不提了。我们现在除了人为的有保安、安检门我们还有人脸识别,通过这种管理我们能保证在物理安全上不出问题。我们刚才提到了一个叫自给自足,除了水和电进来自给自足,我们的人在里头也是自给自足的,这是给我们整个运维体系做支撑的电子化平台。我们有流程管理的平台,集中备份的平台,日志审计、移动巡检,我们自行开发的小微工具,还有堡垒机系统。开个玩笑,包商银行的5000平米,只要给水给电发工资,就能够保证全行生产系统在里面运转不出任何问题,当时设计的时候就是这么设计的。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读