加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

【2018可信云大会】腾讯聂鑫: 腾讯AIOps实践演进

发布时间:2018-08-27 08:11:36 所属栏目:云计算 来源:中国IDC圈
导读:聂鑫:来腾讯工作快12年了。在腾讯服务的12年里都在一个部门没有变过。2006年去腾讯的时候正好赶上腾讯在做DO分离,第一代BAT企业应该也都是在那个时候开始推进运维和研发分离这件事。那时候的运维什么基础都没有,一穷二白,真的很艰难,除了不用扛设备,

最后是一个总结,也是一个小小的心得。做AI真的要数据。我们做AI的成绩来自于我们从2010年就开始累积大量的数据,现在发现这些数据是特别宝贵。第二个是一定要参与其中,除了AI的工程师以外,要有业务的工程师。通过打标,最终还是需要有很多的语料库,包括我们的标注库,能去发现一些问题,做合适的样本库。第三个部分就是一个演进,我也是做这个监控的一个回顾的时候自己总结的。比如说2012之前我们做的事情全是点,做了很多的事情,做了很多的监控,基本上是基于点,但是2012年之后有很多我们开始做面的,比如说ROOT的根源分析,今天先抛一个名词出来,还有微形分析,多元分析等等。到了2016年左右开始往深度去做,比如说AI的方式在数据挖掘,做去阈值的申请,这也是运维在监控领域演进的一个必经之路。方法也在不断变化。从传统的展现手段到通过大数据的分类具备的手段,到AI的去规则、去阈值,这个变化也是显而易见的。

最后我还一有本书,前面我们讲到20多套监控系统,有时候有朋友说有没有计划优化它?我把这个抛给大家,看看大家有什么优化的建议。

现场观众:可以整合一下。

聂鑫:大家可以一起探讨一下。这个问题其实和大家交流的时候,大家说到整合,就是把多个系统合并,这个是最常见的一个回答,我们过去也这么多做,想着20多套太多了,拼命的优化,优化到10套、8套、2套、3套,但是前面提到,存在必有价值,有时候做不了,没有办法说某一套系统没用,你会发现很少的系统被优化了,大多数的系统还存在。

我们怎么优化?就是监控数据基于数据本质优化。第一个是流监控,第二是多维,第三是日志。流监控的维度很低,一维两维左右,20多套系统里面80%、90%都是流式监控。现在我其实把这个流式监控的后台平台做好之后,把监控系统的数据迁移到新的体系架构下就行了,我们通过这种方式进行优化。多维也是2012年左右产生的,现在只有一套。日志这是新做的,也只有一套。我们通过数据本质的方法把未来想做的监控和已经存在的监控按这三种分类,把数据迁到新的体系架构上去,最终实现我们的优化。会发现我们监控系统可能还有10几20套,原来有的监控还有,但是后台的架构被集中了,这样子对运维不是一个问题。这是我们的一个简单的分享。

最后这是我们的一个希望,基于AI做优化,迟早有一天做成咖啡运维,喝着咖啡干运维。最后还是想说一下我们9月份会开源,有兴趣的同学可以用一下。今天的分享就到这里,感谢大家。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读