图像分类和目标检测技术是计算机视觉领域的重要研究方法。这些技术帮助机器理解和识别实时对象和环境,帮助数字图像作为输入。多年来,计算机视觉技术已经被应用于多个领域,包括医疗保健、制造业、零售业等等。

由于像图像分类和目标检测这样的方法都是围绕着数字图像中的目标识别而展开的,所以常常会留下混淆:这两种技术到底是什么,这两种技术又是如何区别的?

在本文中,我们将了解这两种技术是什么,并讨论使它们不同的各种场景。

图像分类

简单地说,图像分类是一种用于对图像中特定对象的类别进行分类或预测的技术,该技术的主要目的是准确识别图像中的特征。

图像分类的工作原理

一般来说,图像分类技术可以分为参数和非参数、有监督和无监督以及硬分类器和软分类器。对于有监督分类,该技术基于所建立的决策边界来传递结果,决策边界主要依赖于训练模型时所提供的输入和输出。但是,在无监督分类的情况下,该技术根据对输入数据集本身的分析提供结果;特征不会直接输入到模型中。

图像分类技术涉及的主要步骤是确定合适的分类系统、特征提取、选择好的训练样本、图像预处理和选择合适的分类方法、分类后处理,最后对总体精度进行评估。在这种技术中,输入通常是特定对象(如上图中的兔子)的图像,输出是定义和匹配输入对象的预测类。卷积神经网络(CNNs)是目前最常用的用于图像分类的神经网络模型。

图像分类技术的类型

有监督图像分类技术包括并行六面体技术、最小距离分类器、最大似然分类器等。在一篇研究论文中,研究人员提到了以下几种类型的图像分类技术

●基于不同传感器信息的图像分类

●基于训练样本性质的图像分类

●基于数据所用各种参数的图像分类

●基于数据像素信息性质的图像分类

●基于每个空间数据元素生成的输出数量的图像分类

●基于空间信息性质的图像分类。

缺点

●在有监督和无监督的图像分类技术中,缺点是训练阶段需要大量的时间,不适合处理大数据。

目标检测


目标检测的问题定义是确定目标在给定图像中的位置,如目标定位,以及每个目标属于哪个类别,即目标分类。简单地说,目标检测是一种图像分类技术,除了分类之外,该技术还可以从自然图像中的大量预定义类别中识别出目标实例的位置。

这种技术能够搜索特定种类的物体,如汽车、人、动物、鸟类等,并已成功地应用于下一代图像和视频处理系统中。只有随着深度学习方法的出现,这项技术的最新进展才成为可能。

目标检测技术可以应用于现实工程中,如人脸检测、行人检测、车辆检测、交通标志检测、视频监控等。

目标检测的工作原理

传统的目标检测模型主要分为信息区域选择、特征提取和分类三个阶段。有几种流行的基于深度学习的目标检测模型,已被组织和学术界用于实现从图像中检测目标的效率和准确结果。受欢迎的机型包括MobileNet、You Only Live One(YOLO)、Mark RCNN、RetinaNet等。

缺点

近几年来,在受控环境下的目标检测问题取得了很大的成功。然而,这个问题在不受控制的地方仍然没有得到解决,特别是当对象被放置在杂乱和闭塞的环境中的任意姿势时。