分享CDN内容分发网络实战技巧

发布时间：2018-10-31 19:27:23 所属栏目：业界来源：今日头条

导读：给大家分享下关于 CDN 的东西，总共分为 2个大部分：原理、详解。首先说一下 CDN 的基本原理部分，主要分 4 块来描述：CDN 的由来、调度是怎么做的、缓存是什么、关于安全。什么是CDN? 这是一个做过 CDN 之后的拓扑图，里面有几个概念需要明确一下: Orig

因为在讲你获得一个具体的DNS域名地址的时，他给你的就是一个IP地址。那在没有CDN之前，他给你的IP地址就是在原来没做CDN时的原始服务器地址。但如果你做过CDN的话，你会发现最终拿到的这个IP地址是CDN的节点，而并不是真正的原始服务器。

我们通常说的拿到一个IP地址，这实际上是DNS的A记录。DNS里面有很多不同的记录，比如像A记录负责给你一个IP地址;比如像CNAME记录给你的是一个域名的别名。当然还有很多其他记录，比如TXT的记录、MX记录等等。这个跟CDN无关，这里就不细说了，有兴趣去查一下DNS相关的文档。

上图就是一个很明显的CDN介入后的效果图。linux里有一个命令叫dig，它可直接把要访问域名的具体的解析情况列出来。那么，通过这个图可看出，当你要访问www.163.com时，他最终虽给出的是一个IP地址，但实际上，它经过了两次CNAME记录。第一次CNAEM记录就是我们之前说得CDN的GRB，他拿到了这个数据，就可以间接知道你的这个LOCODNS是从哪里来的，然后间接给你进行一个定位。以这个图为例，他实际上第一跳是跳到网速地址，第二跳是分配了网速的一个平台，这个平台又分开其他的IP给最终的客户。

Cache系统——缓存系统

除DNS调度以外，在CDN里还有一个非常大的重头戏就是Cache系统,也就是缓存系统。它用于把那些可以缓存住的东西，缓存到CDN的边缘节点，这样当第二个人去访问同一节点，同一具体电影或MP3时就不用再经过CDN链路回到真正的源站去拿数据，而是由边缘节点直接给数据。

在Cache系统里囊括了很多的技术，比如，用空间换时间的这种高效的数据结构和算法，多级缓存以热度来区分，前端是SSD后面是机械硬盘等等。很多的细节就不说了，如感兴趣的可之后交流。

对于Cache系统来说，有两种不同的工作状态。第一种工作状态就是所谓的命中(hit)，第二种就是没有命中(miss)。如果命中了，直接通过检索找到磁盘或内存上的数据，把这个数据直接吐给客户，而不是从后面去拿数据。这样的话就起到一个很完美的加速效果。

第二种是在miss时，其实，miss的时候跟hit唯一的区别就是，当我发现我的本机上没有这个资源，我会去我的upstream(上游)去拿数据。拿完这个数据，除了第一时间给客户，同时还会在硬盘上缓存一份。如果这个硬盘空间满了，会通过一系列置换方法，把最老的数据、最冷的数据替换出去。

提到了upstream，不是原始服务器，原因是因为当客户访问到CDN节点的时，他发现上面没有数据，并不是直接从原始服务器上去拿，而是经过他的另一个CDN节点，然后通过middlemell的方式去进行一些数据传输。然后upstream这一层，从原始服务器拿数据，通过一系列的加速手段，快速的把数据投递给我们的边缘节点，再把这个数据给最终客户。在过程当中upstream和downstream这两层都会把数据缓存一份。通过这种树形结构，比如说多个边缘节点，然后汇总到一个或者几个副层结点，这样的话可以逐渐的实现流量的收敛。

提到Cache的具体技术，我相信这里的很多朋友都是同行业的，有人会说其实这没有什么难的，你只要有网络、有运维人员就可以了。其实我并不这样认为，因为你如果想把它做好的话其实很难，比如，我列出的很多技术你有没有在考虑?

举几个例子来说，你有没有做网卡的的多队列和CPU的亲和性绑定?你有没有做磁盘的调度算法改进?另外，你存储的时候还是用还是?等等都是有讲究的。包括内核的调优包括架构和CPU的绑定，CPU的多级缓存的使用，然后你的处理你使用，还是用标准的的这种机制。再比如说编译的程序时使用的去编译还是用英特尔的，然后你再做很多的调用。比如说一个很简单的字符串拷贝，那你是用，你还是用汇编去写，你还是用什么方式等等很多细节。

关于高性能这一块，还有很多的研究，如大家感兴趣的话，可以之后跟我进行进一步的沟通。我想表达的一个观点就是说，看上去做CDN很简单，入门确实也简单，但是要真正想做好很难。

安全问题

在没有做CDN之前你的网站很有可能会遭受到各种各样的攻击。那么攻击一般分成两种,第一种叫蛮力型攻击，量大的让你的带宽无法抗住最后导致拒绝服务，另外一种是技巧性攻击。

作为CDN来讲，就已经将你的原始服务器的IP进行了隐藏。这样当一个攻击者去访问你的域名的时，实际上访问的并不是你真正的服务器。当他访问的是CDN的节点，就没有办法把CDN的节点打倒，换句话说，即使有能力把CDN的比如10g的节点或者是40g的大节点全部打倒，但由于CDN天然的分布式的部署方式，他也很难在同一时间之内迅速的把全国所有CDN的边缘节点全都打瘫。

另外，还有一种攻击是针对你的DNS地址的。如果你的GRB瘫了的话，会导致整个调度系统失灵。如果调动系统失灵，即使你的CDN的Cache server还是能够正常接受请求，但由于流量调度不了。因此，你需要在DNS层做很多防护机制，比如说用高性能的DNS或用分布式的部署方式等等。

技巧型攻击不需要很大的流量，就可以把你的原针打倒或是让你的网页出现错误的情况。比如说，像注入、挂马甚至说更严重的会直接拖走你的数据库等等。那么作为CDN来说，有很多厂商实际上已经开始具备这样的技巧性的防护能力了，比如说WAF(Web Application Fierwall),就是应用层防火墙，他可以直接去解析你的请求内容，分析内容是否有恶意性，如有恶意性的话去进行过滤，报警等一系列措施来保证你的原始服务器的安全。

第二部分主要是针对网络层的优化、架构的优化、Cache的选型还有性能分析等等几个方面，对整个CDN的基础原理作很深入地剖析。

原始的CDN其实是Content Delivery Network这三个词的缩写，也就是内容分发网络。但我认为应该是can do something on Network。CDN的理念是加速，所以，我们就尽一切可能去做各种优化，从一层到七层的优化来实现最终的优化效果。

为什么说一层是优化，实际上也是硬件，你的服务器选型就是一种优化。你是用ssd，还是用saker硬盘，你是该用pce卡，还是应该用ssd。你的CPU应该用至强还是应该用阿童木的等等，都是需要去斟酌。

至于二层，链路层的优化指的就是资源方面。比如机房如何去选择。

三层路由层是指你在middlemell这块真正选路的具体的细节，后面会有一个图来具体讲一下。

四层是指传输层的优化，我们一般的业务全都是TCP，所以说这里面就可以明确的说这里是指TCP的优化。还有一个就是七层也是可以优化的。比如说你强行对内容进行压缩，甚至你改变压缩级别去压缩。

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/5

首页

尾页

壹号本新款 ONE XPLAY	特斯拉前 CTO 电动汽车
华硕公布新款天选3 搭	主流显卡最新场批价曝