深度干货|PolarDB分布式版基于向量化SIMD指令的探索
4.表达式计算Long数组相加VectorAPI的最大优势就是加速计算,因此接下来我们会探索其可能能够带来性能提升的场景。首先我们对前文中给出的Long数组相加的场景进行了Benchmark,可以看到在数组相加场景下标量执行和SIMD执行相差不大,通过对汇编指令的追踪,我们发现不论是SIMD执行还是标量执行最终都会生成vpaddq这条指令:1.SIMD执行0x00007f3eb13602ae:vpaddq0x10(%r11,%rbx,8),%ymm3,%ymm3;2.标量执行0x00007fa6fd33259a:vpa...