上面我做了使用多核并行加速的试验,加速性能能直接和芯片的核心数成正比,有几个核通常就能带来几倍的性能的提升。除了使用多核来加速图像算法,还有其他手段进一步提升图像算法的性能吗?今天我做了一个实验,能不依赖芯片的核心数量的情况下带来少则5~10倍的性能提升,多则几十倍的提升。目前我做了3个不是实现方式的RGB转灰度图性能测试:rgb转灰度图公式: y = (r*77)+(g*151)+(b*28);1.纯C语言实现2.C语言+加速图像算法3.ASM+加速图像算法在bananapi zero的效果
上面我做了使用多核并行加速的试验,加速性能能直接和芯片的核心数成正比,有几个核通常就能带来几倍的性能的提升。除了使用多核来加速图像算法,还有其他手段进一步提升图像算法的性能吗?今天我做了一个实验,能不依赖芯片的核心数量的情况下带来少则5~10倍的性能提升,多则几十倍的提升。目前我做了3个不是实现方式的RGB转灰度图性能测试:rgb转灰度图公式: y = (r*77)+(g*151)+(b*28);1.纯C语言实现2.C语言+加速图像算法3.ASM+加速图像算法在bananapi zero的效果