Basler与总部位于柏林的Data Spree公司合作开发了一个适用于水果识别和分类的深度学习应用程序。该视觉系统是基于Basler blazeToF (Time-of-Flight)相机和Data Spree的深度学习平台。

1.概述

深度学习的方法不仅精度高,而且它的即用型系统可以缩短开发时间,因此比传统的图像处理方法更具优势。在识别物体时,训练有素的神经网络机器不仅能应对各类变体,还可以在系统的完整生命周期内不断改进功能,从而在边界条件不断变化的情况下产生始终如一的结果。 

农产品的分类和加工就是一个很好的例子。这些农产品的形状和颜色可能存在很大差异,这对已广泛使用的图像处理方法提出了巨大的挑战。 

2.解决方案

Basler与软件提供商Data Spree开展密切合作,共同开发了一个适用于检测和分类水果的视觉解决方案。将3D ToF (Time-of-Flight)技术的优势与易于使用的深度学习算法相结合,可以为水果分拣应用提供可靠的高精度实时解决方案。


水果的3D点云图

2.1 硬件

这个深度学习视觉系统由标准PC和Basler blaze ToF相机组成。 

借助Sony DepthSense™ IMX556PLR芯片技术,Basler blaze相机能提供精度可达毫米级的高分辨率3D图像。这台3D相机不仅通过ToF (Time-of-Flight)方法来生成灰度图作为强度图像,还能使用近红外区域(NIR)范围的光脉冲ToF方法来测量到每个像素的距离。然后,生成的图像可用作3D点云图,并提供有关所描绘场景的其他信息。与2D RGB图像相比,3D点云图的颜色信息被形状信息所取代,不仅具有能同时检测红苹果和绿苹果的优点,还支持物体的精确定位和测量等其他应用。 


Basler blaze相机

2.2 软件

Basler blaze相机拍摄的图像会由Data Spree的“深度学习DS”软件进行评估,该软件解决方案是以深度神经网络(深度学习)为基础。Data Spree解决方案非常简单易用,无需任何专业经验也可以轻松开发深度学习模型。 

设置时需要完成以下步骤:

1.数据采集

每个神经网络都需要大量样本图像,以供后续进行分类。例如,由Basler blaze相机首先采集大约500张各种水果(香蕉、苹果和梨子)的图像。然后,相机软件会通过灰度图和深度图来生成2通道图像数据,其中包含每个像素到物体的距离信息(精确到毫米)。此图像数据会被加载到深度学习DS平台中。 

2.标注

然后,要使用元数据来改进图像数据。因此,需要在每个水果周围手动绘制框,并分配相应的类别(苹果、梨子等)。这样可以定义在后续步骤中要“教导”神经网络学习什么内容。手动标注大约100张图像后,就能加快这个费时费力的初始过程,因为已成雏形的初步深度学习模型可以为后续的图像生成建议,只需要进行更正即可。

3.训练

全部500张图像都标注完毕之后,只需单击几下鼠标即可创建另一个模型,并将会自动对深度神经网络(DNN)进行训练。在训练期间,系统会使用测试数据集来定期评估识别的精度。

4.在目标硬件上配置(部署)和应用(推理)已受训练的网络

训练完毕后,已完成的模型将被加载到目标硬件上,就可以使用Inference DS Data Spree执行软件来直接执行。Basler blaze ToF相机(包括预处理功能)已经完全实现集成,可以直接启动深度学习应用程序。 



标注:这样可以定义在后续步骤中要“教导”神经网络学习什么内容。

2.3 解决方案的优势

该解决方案具有以下几项优势:

•通过3D相机 (Time-of-Flight) 将空间信息集成到神经网络的学习中,可以更精确、更可靠地对物体进行识别和分类

•可降低应用的复杂性,因为在许多应用中不再需要补充的芯片技术 

•借助简单方便的Data Spree软件解决方案,即使不具备编程和深度学习知识,也可以创建深度学习应用程序

•即使在弱光、自然光和无对比度的情况下,也能获得精确的测量结果

•可使用经过行业验证且耐用的相机硬件,并提供IP67防护等级

•集成的光源和校准的光学配件,使安装硬件更加轻松

3.结论

在上述的水果分类示例应用中,Basler证明了通过与Data Spree合作,将功能强大的3D相机与深度学习模型相结合,可以帮助用户轻松解决复杂的任务,节省宝贵的时间和成本。Basler blaze ToF (Time-of-Flight)相机可提供额外的深度信息,有助于在各种应用中分析物体的体积、形状或位置。 

Basler可以将功能强大的硬件与简单易用的软件相结合,是您开发智能3D视觉解决方案的理想合作伙伴。