加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

从运维到运营—物联网如何帮助数据中心管理者走出困境?

发布时间:2018-11-15 07:31:15 所属栏目:电商 来源:《UPS应用》杂志
导读:数据中心运维整体发展趋势分析 全球数据中心发展重心正从规模化建设向精细化运营转变。随着亚马逊、微软、阿里、腾讯、华为、中国移动、中国电信等巨头的进入,国内云服务市场竞争加剧,各云服务商在市场拓展的同时会持续降低运营成本。 华为云大数据产品线
副标题[/!--empirenews.page--]

数据中心运维整体发展趋势分析

12

全球数据中心发展重心正从规模化建设向精细化运营转变。随着亚马逊、微软、阿里、腾讯、华为、中国移动、中国电信等巨头的进入,国内云服务市场竞争加剧,各云服务商在市场拓展的同时会持续降低运营成本。

华为云&大数据产品线总裁马力在《智能运维,云数据中心运维的未来之路》一文中指出,未来的云数据中心运维必须:

提高运维效率虚拟化技术和众多开源技术的引入使得运维变得越来越复杂,传统人工运维模式处理速度慢、出错概率高。此外,传统人均50~100台设备的维护效率,在大规模云化环境下,需要投入大量人力。

保持低运营成本传统IT的资源使用率通常小于20%,在云化后资源使用率有所提升,但是个性化、按需弹性需求导致资源碎片化、负载不平衡以及扩容规划不精准,可能会造成整体资源利用率并没有达到规划目标,运维成本居高不下。

硬件即插即用,定期下线随着数据中心规模的增长,手工为主的硬件识别与安装方案将无法支撑资源的快速上线、扩容与下线。通过即插即用技术,只需要使用低技能人员将设备上架、上网和上电,运维系统就会根据该硬件的预期状态自动化完成端到端硬件系统的部署和上线;与此同时,通过云化隔离技术,硬件出现故障时也不再需要立即解决,只需让低技能人员定期替换即可。

数据中心运维技术发展的历史与现状

阻碍数据中心运维技术快速发展的历史原因

尽管数据中心的运维如此重要,但长期以来,相关运维的技术和手段仍然比较落后,“重建设,轻运维”成为行业普遍现状。甚至在很多人眼中,运维=酷炫的UI界面+超大拼接屏。数据中心的运维,尤其是基础设施运维长期以来之所以未能得到大规模的普及,笔者分析主要以下原因:

技术落后:早期基础设施运维软件多来自UPS、空调等设备厂家,他们采用动环(动力设备和机房环境)管理的理念。厂家大多对IT类设备缺乏了解,相关技术也主要来自运营商对通信机房的运维要求,明显滞后于IT技术的发展;

观念落后:早期IDC管理脱胎于电信运营商的“机房维护”思路,偏重于设备安全和日常维护,对资产(ROI)的价值认识不足,做不到精细化运营与管理;

需求不明显:早期机房数量规模较小,人工维护成本低,运营管理团队采用自动化管理方式的意愿不强烈;早期机房设备种类不多,运行业务简单,管理的复杂程度不高;早期数据中心本身并未成为社会生产与生活的核心,故障后造成的损失也较低;

系统架构简单:早期IT系统,普遍采用“烟囱式”架构,底层硬件与运行业务深度耦合,业务逻辑和物理逻辑有对应关系,故障后容易查找,定位简单,可以快速进行维修;

除此之外,还有国内长期以来对软件价值的低估,用户需求不明确带来的设计变更附加成本等。正是因为以上这些原因,在大型云数据中心出现之前的“互联网1.0”时代,智能运维技术和实践一直未得到用户普遍的重视。

目前的现状:数据中心数字化、精细化、自动化运营已形成行业共识

随着大型数据中心的增多,云计算相关技术的成熟,数据中心运维技术也日益受到大家的重视。究其原因可以归纳如下:CT机房互联网/物联化趋势受互联网影响,“数据中心云化”“软件定义数据中心”成为主流技术发展趋势。而传统CT的维护理念,也逐渐向物联网化的运营理念转变,精细化、自动化、智能化管理成为新需求。如某运营商对运维机器人的引入、互联网自建数据中心对人工智能技术的引入、对U位级资产管理技术的实践等。

市场需求快速增长:近年来的数据中心逐渐呈现“两极分化”趋势:即中型数据中心快速减少,一方面超大规模数据中心不断出现(云数据中心需求),一方面微型数据中心快速增长(边缘计算需求)。对于超大型数据中心,服务器规模动辄数万甚至数十万台,人工方式的资产管理已无法满足实际需求,急需自动化的管理方案;对于小微型数据中心(多是企业分支机构、连锁商超等行业用户),又大多缺乏专业运维人员,对易安装、已维护、可实现远程无人化管理的运维技术也有迫切需求。

云数据中心架构变化带来的影响:云计算技术的出现,使得传统的“烟囱式”IT架构被打破,计算、存储、网络统统变成了资源池,上层应用和IT硬件实现了解耦。弹性获取,随需扩容、灵活应用成为业务层面对IT资源的主要诉求。

这对IT硬件的影响主要有两方面:IT硬件的重要性下降(数据有备份),更换升级等操作更加频繁(坏了就换)。在数据中心的全生命周期内,IT硬件资产管理的工作量大幅提升(同一U位可能不同时间段安装不同设备运行不同程序),依赖人工已经很难管理;AI、机器深度学习等技术的发展,也需要打破企业各部门之间的传统物理壁垒,对数据进行融合处理与应用(如智慧城市工程,对目标对象的人脸识别,可能需要拉通交通、户籍、刑侦、市政等多套系统),数据层面拉通的同时也会带动跨领域、跨组织的物理资产的统一管理,必然需要统一的标准和规范来进行物理资产的统计和变更记录。

人力成本快速升高:据统计,中国60岁以上人口已超过2.41亿人,我国已全面进入老年化社会,劳动力成本上升是所有企业都要面对的问题。而数据中心的运维工作责任重大,通常涉及到多个领域学科知识,对人员技能和素质要求都比较高。

“人力成本太高”(一线城市)、“招不到人”(二三线城市)成了很多运维主管头疼的问题。其他因素,比如电信运营商利润下滑,传统IDC大户对能够降低运营成本(维护人力、电费等)的技术兴趣浓厚;各设备厂家的持续发力,对智能化基础设施的概念推广(主要体现在自动化运维、U位级精细化资产管理等方面);全行业数据安全意识的提升,导致越来越多用户(尤其是高端用户)对其IT资产安全的更加重视(自主可控、去IOE、国产化等要求),IT设备的变更、定期盘点、自动告警受到重视。

从“运维”到“运营”的观念转变

如上所述,数据中心的运维工作日益受到业界的重视,各种新技术也层出不穷,那么什么样的运维技术才是好技术,如何进行评判呢?笔者认为,只有真正能为用户创造价值的技术才能获得认可并实现规模化应用。换言之,能省钱(甚至赚钱)的技术就是好技术。笔者认为,从运维(核心是可靠不出错)到运营(核心是可靠还省钱/赚钱)的变化,是在数据中心从“企业成本中心”向“企业生产中心”转变的过程中,运维人员必须经历的观念转变过程。

那么,什么样的数据中心才是好(可靠又省钱)的数据中心呢?抛开“风火水电”等基础设施的架构不谈,仅从运营的层面来看,笔者认为需要考虑以下问题:

1、资产盘点问题:资产繁多、管理复杂

数据中心涉及多种产品和设备,对运维人员技能要求较高。同时资产管理和盘点工作浪费运维人员大量时间,造成数据中心运维人力开支居高不下。

2、容量管理问题:管理粗放、盈利困难

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读