Page 23 - VSDC_JanFeb2018_eMag
P. 23
技术趋势
Technology Trends
深度视觉
利用神经网络实现复杂的图像处理任务
神经网络深度学习将会给图像处理的未来发展带来重大影响,这一方法在图像分类和分析结果乃至最
终图像质量方面有着极大的优势。由于对大多数视觉应用而言,小型神经网络就可以满足需要,诸如
FPGA这样的处理器就可以有效地实现卷积神经网络 (CNN)。这也让神经网络可以从通常的分类任务
延伸至更广阔的应用范围,同时也使得实现高效的嵌入式视觉系统成为可能。
文/ Martin Cassel,Silicon Software GmbH
当测试对象发生形变、形状不规 并分析图像,例如反射表面、移动的 众多数学假设,使得处理流程得到大
则或其他特性有所变化时,又或者光 物体、人脸检测、机器人技术等等。 幅简化(如 Pooling、线性整流函数
照环境不合适或出现镜头失真,传统 目前 CNN 并不能完全覆盖传统图像 ReLu 和防止过拟合等),这有效降低
图像处理方法便会遇到瓶颈。在这些 处理的所有领域,例如对象的精确定 了计算量,从而使得实现更深层次的
情况下,如果采集图像的框架条件不 位,对于这些应用我们必须研发新型 网络成为可能。通过在保持识别正确
进行相应的调整,即便使用特定的算 的高级 CNN。 率的基础上,降低图像深度以及优化
法也很难对被测物特征进行描述。相 算法,CNN 的处理速度得到了明显
比之下,CNN 则能通过训练的方式 优化的 CNN 为视觉提供加速 提升,并且已经适合用于图像处理。
来实现特征识别,而无需使用数学模 动力 CNN 具有平移不变性和部分缩放不
型,这有助于实现在困难条件下捕捉 近年来 CNN 的实践研究验证了 变性的特性,因此可以在不同的图像
分辨率中使用相同的网络结构。通常,
更小型的神经网络便能满足许多图像
处理任务的需求。
基于 FPGA 的高度并行处理特性,
CNN 神经网络尤其适合在 FPGA(现
场可编程门阵列)中实现,用来进行
高分辨率图像数据的实时分析和分类。
在机器视觉中,FPGA 一直是图像处
理任务的强力加速器以及实时处理的
保障。在此之前,FPGA 编程开发的
高难度和相对较低的可用资源量,阻
碍了 FPGA 的有效应用。如今,得益
于算法简化,使得在 FPGA 中构建具
有高吞吐率的高效网络成为可能。
全新的 CNN 算子和新的图像
采集卡
基于 FPGA 的 CNN 应用,可
图1:缺陷类别,从左到右分别为压痕、污渍斑点、裂痕、麻面、杂质、刮痕。 以使用基于全图形界面的开发环境
20 Jan/Feb 2018 视觉系统设计 Vision Systems Design China