利用CPU缓存达成高性能程序

发布时间：2021-05-26 23:54:40 所属栏目：移动互联来源：互联网

导读：所以，做一次加法的指令是由多个时钟周期组成的(如取指令和数字、放入寄存器、执行ALU、将结果写回主存)，做ALU执行指令仅需要1个时钟周期，而取指令或者取数据

所以，做一次加法的指令是由多个时钟周期组成的(如取指令和数字、放入寄存器、执行ALU、将结果写回主存)，做ALU执行指令仅需要1个时钟周期，而取指令或者取数据、回写结果数据就需要与主存打交道了。CPU访问内存(主存)的速度非常慢，访问一次常常需要上百纳秒以上，这与计算指令有千倍的差距!怎样解决访问主存慢导致的CPU计算能力的浪费呢?加入CPU缓存!

CPU上增加缓存后，由于CPU缓存离CPU核心更近，所以访问速度比主存快得多!如果我们访问内存时，先把数据读取到CPU缓存再计算，而下次读取到该数据时直接使用缓存(若未被淘汰掉)，这在时间和空间上都会降低CPU计算能力的浪费!在时间上，有些数据访问频率高(热点)，多次访问之间都未被淘汰出缓存;在空间上，缓存可以同时加载相邻的数据、代码，这样函数、循环的执行都在使用缓存中的数据。

CPU缓存是分为多级的，原因是热点数据太大了!最快的缓存一定离CPU核心最近，因为体积小所以容量也最小，不能满足以MB计算的热点数据。最终发展出了三级缓存，分别称为L1、L2、L3级缓存。这三级缓存的访问速度各不相同，但都远大于访问主存的速度(访问时间更小)，如下图所示：
可见，L1和L2的缓存访问速度非常快，只有不到3ns，L3稍慢一些，但都远小于访问主存的速度。当然，CPU缓存的大小也远小于主存的大小，如本文最开始的那张图，现在的CPU缓存往往只有几十MB。如果大家点击具体的CPU细看缓存，可以看到intel只标明了smart cache，如下图所示(intel e5-2620 v4)：这个smart cache其实就是L3缓存，现在的CPU都是多核心的，而smart cache就是智能的被多CPU核心共用的意思。那么L1、L2缓存大小为什么不标出来呢?其实没有必要，因为通常L1就是32KB，而L2是256KB，在linux上我们可以直接看到：

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

达人魔改秒控鼠标可边	万里征程张万里媒体联
蔡司小蓝标瞩目！vivo	售2999元起！华为首款