加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

微软、阿里巴巴积极推动SONiC技术和应用创新

发布时间:2019-06-26 01:40:35 所属栏目:运营 来源:中国IDC圈
导读:副标题#e# 2019年6月25日,由浪潮与OCP开放计算社区联合主办的首届OCPChina Day(开放计算中国日)在北京正式开启。本届OCP China Day聚焦人工智能、边缘计算、OpenRack、OpenRMC、SONiC、OAM等前沿技术话题,来自Facebook、LinkedIn、Intel、微软、百度、

对于今天这么大规模的互联网服务来说,一个最大的特点就是它的超大规模,在这个超大规模的背后给我们带来了非常多的挑战,这个超大规模大到什么程度呢,大家已经在前面很多嘉宾的分享里看到了,我们的网络连接的是上百万台的服务器、上千万个虚拟的虚机,我们要提供25G、100G,高性能和低延迟要支撑一张非常大规模的网络。同时在这么大规模的网络之后,我们每天都数以秒计的产生很多业务信息、网络信息和网络数据,我们必须有足够的能力去及时处理,对于故障的发现、恢复和隔离我们都能够做到快速有效的保障,这些都取决于我们怎么构建底层的基础设施。我们这么大规模的网络并不是一个静态的网络,它是一个动态的网络,我们的业务随时在交互,我们的用户需求随时在变化,我们的基础设施必须能够秒级的满足客户的需求,所以我们在背后要有一个算法驱动AI驱动的调度系统灵活调度我们的网络资源。这些东西都要求我们能够有一个非常稳健的基础设施去提供服务。

往我们网络底层的技术去看,这是对我们最近几年阿里巴巴在网络基础设施上面的技术演进的小总结。大家可以看到2014-2015年这个时间段,我们更多的网络研发的重点是在纯软件的优化上,我们引进了像DPDK这种用户态的协议站替代我们的性能,取代了传统硬件对我们的限制,在交换机上我们尝试着用一个独立的软件运行在一个裸金属的switch上,让我们的软硬件自主可控。随着我们对软硬件上的把控,到2016、2017年我们快速enable我们的硬件,底层网关数据从10G、40G快速演进到25G、100G,网关快速进入到400G时代。随着硬件的快速落地,进入到2018、2019年大家可以看到一个很明显的趋势,软硬件的融合进一步加剧了,随着我们在软硬件上面能够全栈的把控技术,我们快速引入RDMA这样的技术在我们的数据中心集群里大规模使用,我们可以引入可编程芯片这样的最新的硬件能够软硬件结合的解决一些新的灵活性的业务需求。

我们从纯软件到快速的硬件演进再到软硬件的高度融合,进入到了一个崭新的网络基础设施的技术时代。刚才那张表是一个时间表,我给大家分享一个比较特别的视角。传统的物理网络都是由一个个硬件的纯Switch构建的,但是我们的软件网关又是一个传统服务器形态的网络设备,在我们基础设施这层可以把它打平了看,大家可以看到当我们的软硬件随着软件站和硬件站的自主可控,从底层25G、100G的物理网络到RDMA这样的低延迟的技术应用,我们很快可以在交换机和服务器侧把这个技术落地,更高的应用层面可以从交换机的物理网络到网关的应用网络,可以apply一个统一的调度系统,可以做到端到端的网络质量的遥测,我们还可以做到定制化的高可用。虽然这两张网络运行的软件站是不一样的,它们的应用是不一样的,但是我们可以通过一套技术站来统一它们。

接下来回到今天的主题,OCP的SONiC项目,阿里巴巴从2017年就加入了SONiC社区,之后我们就和社区一起合作针对于阿里对网络的需求以及通用的和定制化的需求,我们都做了非常深入的开发。今天大家都非常好奇,我们阿里使用的SONiC版本和社区的版本有什么区别。除了针对阿里网络架构一些特定的需求之外,我们大多数的开发应用都回馈到了社区,所以大家可以看到阿里的很多需求代表很多国内用户,包括腾讯百度他们的需求和我们都非常类似,在这些需求上北美的用户跟我们的需求是有差异的。我们列出的TACACS认证的支持、VAN-TRUCK的支持、我们做到的(英)都是阿里贡献到社区的部分。我们还在SONiC做到了性能提升。

总而言之,我们在SONiC社区上做的贡献,阿里运行的版本和社区版本是同步的。

基于SONiC这样一个开放平台,大家在数据中心网络的创新上可以做到很多根据自己的业务场景带来的业务上的创新,有了这个streaming接口,和传统的相比,我们可以把北向接口简化,我们不仅可以做状态的获取,还可以做配置的下发,是一个统一的GRPC通道,这在我们交换机的事先上就被大大简化了。

因为我们是基于一个非常开放的SONiC系统,SONiC可以帮助我们根据我们自己的网络架构建立一套系统,使得网络运维的时候自动线上变更之前可以在线下做软件升级和配置变更的演练,这样可以大大的提升我们网络的稳定性,提高网络的可用性。

最后,我们的业务对于可用性非常敏感的地方,我们基于SONiC做了一个当故障发生之后或者我们要做软件升级的时候通过服务器和交换机端到端的定制,我们可以做到无损隔离,甚至可以做到零丢包,基于SONiC开放系统我们把很多之前的不可能变成了可能,所以在这里借助OCP这个平台,非常感谢有这样一个组织能够让我们大规模的互联网用户分享我们对于网络运维的需求、软硬件的需求和一些思考,也非常欢迎大家加入到SONiC社区来,我们希望能够把SONiC变成数据中心网络甚至未来边缘计算的一个实施上的标准,这就是我今天带来的分享,谢谢大家。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读