电子工程师技术服务社区
公告
登录
|
注册
首页
技术问答
厂商活动
正点原子
板卡试用
资源库
下载
文章
社区
论坛
开发板专区
【Banana pi BPI-M2 Zero试用体验】+多核图像算法加速
【Banana pi BPI-M2 Zero试用体验】+多核图像算法加速
IC爬虫
LV4工程师
| 2017-12-17 12:08:35
浏览量 2214
回复:1
发表新帖
本帖最后由 IC爬虫 于 2017-12-17 12:46 编辑
上周末比较忙,空了一周没写测评。
在嵌入式设备上跑图像算法是未来的趋势,很多以前只能再PC上运行的图像算法将慢慢的运行在嵌入式设备中,但是ARM的单核处理能力和PC的单核处理能力还是相差比较多的。在嵌入式设备中arm有低功耗低成本集成度高等优势,而且几十元的ARM普遍集成了多个核,或者DSP,GPU等协处理器。目前为了通用,我使用基于CPU的核的加速算法,这种方法有比较好的通用性,可以自动识别不同CPU的核心数量,来动态调整开启的核心数,实现最大的CPU的利用率。
我写了一个图像识算法经常使用的轮廓提取算法的加速版本,来测试使用多核的加速性能:
原图:
没有加速的算法实现的效果
使用多核加速的效果:
输出结果,性能对比,我在程序中连续处理图片1000次,单次图片处理的对比不够有说服力,拉不来距离。从下面的图片可以看出性提升2倍,速度比是1:3;
100256
没有使用加速的时候CPU的使用情况:
使用了加速后CPU的使用情况:
本帖最后由 IC爬虫 于 2017-12-17 12:46 编辑
上周末比较忙,空了一周没写测评。
在嵌入式设备上跑图像算法是未来的趋势,很多以前只能再PC上运行的图像算法将慢慢的运行在嵌入式设备中,但是ARM的单核处理能力和PC的单核处理能力还是相差比较多的。在嵌入式设备中arm有低功耗低成本集成度高等优势,而且几十元的ARM普遍集成了多个核,或者DSP,GPU等协处理器。目前为了通用,我使用基于CPU的核的加速算法,这种方法有比较好的通用性,可以自动识别不同CPU的核心数量,来动态调整开启的核心数,实现最大的CPU的利用率。
我写了一个图像识算法经常使用的轮廓提取算法的加速版本,来测试使用多核的加速性能:
原图:
没有加速的算法实现的效果
使用多核加速的效果:
输出结果,性能对比,我在程序中连续处理图片1000次,单次图片处理的对比不够有说服力,拉不来距离。从下面的图片可以看出性提升2倍,速度比是1:3;
100256
没有使用加速的时候CPU的使用情况:
使用了加速后CPU的使用情况:
0
收藏
举报
分享
×
微信分享
扫描二维码分享
qq分享
QQ空间分享
微博分享
我来回复
登录后可评论,请
登录
或
注册
所有回答
数量:
1
xukejing
2018-01-06
不分享代码差评XD
0
回复
举报
发布
×
举报
举报人:
被举报人:IC爬虫
*
类型:
请选择类型
问题质量差
垃圾广告信息
偏离社区主题
违规内容
不友善内容
与社区已有问题重复
以上选项都不是
*
详细原因:
取消
提交
x
收藏成功!点击
我的收藏
查看收藏的全部帖子