综合描述: LUCID 的 Atlas10 相机通过远程直接内存访问 (RDMA) 提供 10GigE 带宽,以优化图像数据流。配备 RDMA 的 Atlas10 可绕过 CPU 和操作系统,将 1.2 GB/s 的数据流可靠地直接传输到主存储器。这提高了吞吐量,降低了延迟,并消除了 CPU 的使用,而这正是可靠的 10GigE 相机应用所必需的。
UDP 是 GigE Vision 标准选择的协议,所有基于 GigE Vision 的以太网相机都使用它。UDP整体具有出色的流媒体性能、低延迟、多播以及由 CPU、操作系统和过滤器驱动程序管理的简捷设计。然而,对于某些万兆以太网应用,特别是那些需要全帧传输至关重要的应用,GigE Vision UDP 技术可能会达到其极限。万兆以太网数据流的大幅增加会导致可靠性问题,尤其是在主机规格不理想的多相机万兆以太网应用中。由于每台相机需要采集的数据量是原来的 10 倍,在由某个最初的问题导致数据包重传后,主机和相机的通信就会开始出现挣扎,当 CPU 处理数据流时处于过忙状态时,数据包就会被迫丢弃。这将导致图像损坏或部分损坏。随着图像传输数据量的增加,丢弃更多数据包的几率也会增加,这就形成了一个恶性循环,CPU 的占用率会随着不断要求相机重新发送数据包而持续增加。虽然 GigE Vision 标准在 UDP 的基础上增加了可靠性功能,但目前使用的 UDP 和数据包重发会造成多米诺骨牌效应,CPU 资源耗尽会导致图像损坏。
消除 CPU 瓶颈
对高吞吐量和低延迟的要求并非工业机器视觉所独有,多年来一直是高性能计算 (HPC) 的共同问题。云计算或机器学习应用中使用的分布式计算集群必须处理大规模的海量数据交换,进而产生指数级数量的输入和输出(I/O)操作。I/O 即发送和接收数据进行处理的过程,历来由 CPU 控制。在传统的网络堆栈中,接收到的数据包存储在操作系统的内存(内核空间)中,然后复制到应用程序内存(用户空间)中。这将消耗 CPU 的处理周期并带来延迟。当使用多个网络接口时,这个问题就会变得更加复杂,因为处理数据流所需的中断和上下文切换数量会增加,在这种情况下,CPU 可能会成为限制整个系统性能的瓶颈。部分问题可以通过部署新一代 CPU 来解决,它可以提供更快的处理周期和更大的内存容量。然而,最佳解决方案不仅仅是更快的 CPU 和更大的带宽。 远程直接内存访问(Remote Direct Memory Access, RDMA)允许在网络上的设备之间移动数据,而不需要CPU参与每个数据包。实现RDMA的网络适配器支持将数据直接写入应用程序内存,完全绕过操作系统,避免不必要的数据复制(零复制功能),并降低CPU开销。
主要性能指标: 通过利用最初为高性能计算应用而开发的开放标准网络技术 RoCE v2,并将其应用于 GigE Vision 标准,LUCID 能够有效克服 UDP 技术在实现万兆以太网高带宽方面带来的挑战。因此,图像采集所产生的 CPU 负载明显降低,同时还提供了尽可能低的图像传输延迟和最高的数据吞吐量。LUCID 自己的测试表明,同时运行 4x Atlas10 10GigE 相机的 CPU 使用率仅为 0.08%,而传统 GigE Vision UDP 数据流的 CPU 使用率为 5.38%。得益于 RDMA,选择基于以太网的相机进行高带宽应用的用户将受益于更快、更可靠的数据传输,从而进一步巩固以太网作为机器视觉应用首选工业接口的地位。 产品优势: 在以太网网络上采用 RDMA 可带来以下优势: - 在所有速度的以太网网络上都能实现最快的吞吐量和最低的延迟,与现有的交换基础设施和布线兼容。 - 通过零拷贝、向远程缓冲区发送和接收数据,实现数据包处理的完全硬件卸载,无需 CPU 参与。 - 全面的工业连接解决方案生态系统,提供安全连接器、EMI 屏蔽、接地隔离和网口供电(PoE)。 - 得到 Broadcom、Marvell、Nvidia 和 Intel 等众多硬件和软件解决方案供应商的支持,促进了互操作性。 应用领域: 远程直接内存访问(RDMA)是高带宽、多相机应用的可行替代方案,它提供了一种更强大、更高效的数据传输方法。RDMA 绕过 CPU 和操作系统,将图像数据直接存储到主机内存中,是现代高带宽以太网相机应用中管理大量数据的理想选择。 |