加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

如何判断服务器产品是否优秀?

发布时间:2018-07-04 20:43:49 所属栏目:电商 来源:站长网
导读:对于一款服务器产品而言,我们可以从三个角度去评估它质量、功能和服务。 质量是产品可用的第一要素,这里主要是指硬件的故障率,这个数值应当低于2%,一些厂商的硬件质量甚至可以做到小于1%。不要小看这个数字的变化,对于海量模式的硬件平台,基数越大差
副标题[/!--empirenews.page--]

对于一款服务器产品而言,我们可以从三个角度去评估它——质量、功能和服务。

质量是产品可用的第一要素,这里主要是指硬件的故障率,这个数值应当低于2%,一些厂商的硬件质量甚至可以做到小于1%。不要小看这个数字的变化,对于海量模式的硬件平台,基数越大差距效果就越明显。假设服务器总量是三万台,多出一个1%就意味着平均每天会多触发一次故障事件。即便是更换硬盘的维修,也会对生产系统的运行产生一定影响。故障率如果控制不住的话,那么SLA的承诺就是一纸空谈。

同时质量也直指另外一个重要指标,那就是性能。在这里,我们把产品性能也纳入到质量里面去。为什么这样讲呢?如果一个产品的性能很差,意味着它的可用性就很差,一个不可用的产品,从概念上讲基本就等同于质量不合格。一个性能极差的产品基本上就是不可用的,对生产业务的正常运行是非常不利的。

功能是另外一个很重要的影响因素。如果说质量关系到业务的正常运行,那么功能就关系到业务的高效维护。一般所谓的功能主要是指服务器的带外管理功能。因为在硬件配置方面,除了RAID卡和电源以外,能够相互一较高下的地方并不太多。但是服务器的带外管理功能确实可以有效地拉大不同产品之间的距离。

质量和功能是在我们的技术评估中是占有很大比重的,而服务部分会相对偏轻一些。服务好不如质量好,手册好不如产品好。如果一款产品,质量可靠有保障,使用简单不求人,那么谁还会需要售后服务和说明书呢?如果产品的质量跟不上去,功能又有缺陷,那么服务再好也是没有意义的。相反的,如果产品功能强大且质量过关,我们反而很少会使用到售后服务。

在海量模式下的运维场景中,甲方都有自己专门的运维团队。当触发任何紧急事件时,第一时间都需要运维团队自己解决。我们不可能像过去传统的系统集成那样,把所有工作交付给厂商来完成。这涉及到一个时间成本的问题。一个线上系统发生故障了,难道你要我打800开Case,再等着厂商派工程师出现场吗?这显然是不可能的。业务就算停止一分钟的损失都难以估计,你根本就等不起。只有像硬件维修或是技术咨询这类不紧急的问题,我们才会依靠厂商来支持。

另外,服务是一个长期积累的过程。一个厂商的服务好与坏,在短期内是很难做出评判的。对于那些以前根本就没有使用过的产品,服务这一项也仅能通过测试阶段的售前表现来看。这也是不能把服务占比过重的一个客观因素。

带外管理有多重要

做系统运维的同学会经常提到带内管理与带外管理这两个名词。所谓的“内”、“外”之分,就是指管理通讯链路和业务生产通讯链路之间的关系。如果我们使用业务所在的链路进行消息传递和管理,我们就称之为带内(In Band),反之就是我们所讲的带外(Out of Band)。

我们日常维护生产环境,主要是通过带内网络进行管理。所依靠的手段,无非就是RDP、VNC、SSH、TELNET这些方式。但是,这些服务都运行在操作系统上面,并且通过网络远程访问,其中就存在很多不稳定的因素。比如硬件故障,操作系统崩溃,或者是人为操作失误导致系统无法访问等等。由此看来,带内管理这条通道是很脆弱的。我们需要使用另外一个备用的手段,来确保我们对设备和操作系统的控制权。

带外管理是完全独立于现有生产环境的,从硬件接口、网络链路,再到存储和操作系统都是单独分离出来的。带外管理系统存放在一个很小的控制芯片上面,里面是一个经过修剪的、只读的最小系统环境,通过单独的接口与网络去访问。所以它的可靠性比带内管理网络要高得多。只要控制芯片加电且带外的网络正常,我们就可以始终把控制权牢牢地掌握在手中。

当带内管理网络崩溃时,我们依旧可以凭借带外管理提供的虚拟控制台,远程登录生产系统的本地console界面,这相当于在机房里面直接接上KVM(Keyboard-Video-Mouse)设备。是我们处理故障最有效的保障手段。除了断后之外,带外管理也扮演着开路先锋的角色。在设备刚刚上架加电的时候,我们是没有带内环境的,系统的安装部署,服务器的开关启停都离不开带外管理。

也许在一些人看来,带外管理不过是提供了一个远程的虚拟控制台而已。但实际上,它所能完成的任务远远不止这些。优秀的带外管理可以说是提供了所有你在本地操作面前能做的一切功能,甚至还有额外的增值项目。我们可以借此获取详尽的硬件清单配置列表,收集监控数据信息,设置BIOS参数,甚至操控硬件。

异构平台融合能力

从管理角度讲,单一使用一家厂商的产品,对于资产的统一管理与配置是有利的。如果出货量大,双方相互之间还可以签署框架协议,进一步推动价格成本控制和产品定制化。这对于平台初期的快速建设是有一定帮助的。不过,当平台规模从溪流模式发展到江河模式或者海量模式的时候,一些政策法规不允许只此一家的这种采购形式的存在,同时单一化产品也存在品牌绑架的风险。这个时期,就会突然涌现出许多不同品牌,它们都有可能在未来同时入驻到我们的服务体系当中去。由于来自不同产品之间的差异会带来多样化管理的难题,这就对服务器的异构平台融合能力提出了严苛的要求。我们不希望看到,因为产品差异化而增加运维的管理成本。因此,必须弱化这种差异效应,让运维团队的成员感受不到不同产品之间的切换与变化。

支持并使用标准的公有开放式协议是异构融合的关键。私有协议不管做的多好,对于一统天下是没有任何帮助的。除非你没有竞争对手,或者你的私有协议能成为公认的标准。

IPMI协议尽管发展使用了将近20年的时间,可以方便地为用户提供电源控制、传感器监控等通用型功能,但是它已经是一个落后于时代的产物了。作为x86平台的工程师,我们一直都很羡慕小型机上面有专门获取硬件信息的命令。而IPMI对于这方面需求的发展一直是难有作为。事实上,一些厂商像Dell、联想在IPMI上也有oem接口,但是IPMI所能作的工作实在是太有限了,我们需要一个新的方案来解决异构平台上的管理难题。

WS-Management,全称叫做Web Services-Management,是DMTF组织基于SOAP(Simple Object Access Protocal,简单对象访问协议)制定的一种开源标准。该标准致力于在不同的x86设备厂商当中,提供一种IT基础架构信息访问与修改的统一接口。这对于那些支持该标准的厂商来说,会给用户有效地管理资产配置工作提供极大的帮助。例如,我们有很多来自不同厂商的服务器设备。如果它们都能够很好地支持WS-Management标准的话,那么就可以通过wsmancli工具,统一采集或修改所有服务器的硬件配置信息,而不必因为私有化工具分治的问题而形成多头管理的局面。像AMD、Dell、Intel、Microsoft这些知名厂商都是该项标准组的成员。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读