多年来,工业自动化一直是机器人技术进步和用于数据处理、分析和决策的先进软件解决方案的受益者。软件的发展已经促使更具革命性的人工智能(AI)解决方案出现在了一系列细分市场和应用领域。然而,这段旅程走得并不容易。

就人工智能(AI)而言,许多早期的能力飞跃直到最近才得以部署,这主要是因为某些计算能力的滞后,使其不适合远程、边缘和移动部署。如今,硬件技术取得的最新进步,正在迅速填补系统性能方面的空白,这为复杂的计算机视觉和AI软件解决方案最终以可扩展的方式部署并取得有意义的成果,铺平了道路。

CPU、GPU和TPU打开新的大门

谈到计算能力的进步,CPU和GPU的进步往往是最重要的,这是有充分理由的。CPU是计算平台的核心,负责执行程序指令、运行操作系统以及管理系统的输入和输出(I/O)。典型CPU中的内核数量,正在随着速度和内存带宽的增加而稳步增加,这有助于性能的持续提高。

此外,在同一设备上具有两种不同类型内核的CPU越来越容易获得。这些性能内核(P核)和效率内核(E核)的优势在于,工作负载是基于资源需求分布的。例如,后台和较轻的处理任务被分配给E核,E核更小、更高效,非常适合执行基础任务。另一方面,P核与传统核一样,以性能为导向,它们可根据需要用于处理计算机视觉、游戏和机器学习任务等高强度任务。

图1:NVIDIA GPU的发展情况。(2018年至今)

虽然CPU是主处理器,但GPU——最初是为了从CPU中卸载图形处理和显示任务而开发的——已经发展成为图形和计算密集型处理的主流技术。现代GPU器件包含数千个能够并行运行多个进程的内核,非常适合一次执行许多较小的任务。由于它们能够加速处理任务,因此在支持AI能力的扩散方面发挥了重要作用。与CPU一样,GPU技术也在同时朝着两个方向发展——在数据中心、视频编辑系统和AI模型训练应用中,提供更大、功能更强的器件;在边缘以及移动和机器人系统中,提供更小、更高效的器件,以便于部署强大的处理能力。

除了以上两种主要的处理器之外,张量处理单元(TPU)正在寻求利用机器学习的应用中迅速获得青睐。顾名思义,这些处理器是专门为执行张量运算而设计和定制的,以支持神经网络计算。TPU比GPU更节能,而且由于其专门构建的设计,它们可以比GPU更快地执行训练和推理任务。此外,将TPU集成到TensorFlow机器学习框架中,还能帮助希望利用其功能的开发人员降低使用障碍。TPU代表了一种很有前途的处理器技术,它进一步增强了AI应用中使用的工业计算系统的性能。它们有望迅速成长和成熟,以支持这些软件开发的需求。

PCIe推动数据传输发展

单靠处理器技术无法提高计算性能。数据需要能够以足够使处理器性能最大化的速率,从输入设备传输到系统中,以及在系统内的设备之间传输。如果不能做到这一点,技术的飞跃就失去了意义,技术飞跃也无法带来实际的物质化利益。幸运的是,计算系统的其他核心技术也在不断发展,以支持更大的生态系统。数据总线、内存和存储技术正在引领潮流,以实现更快、更高效和更高的整体系统性能。这些方面与先进的处理技术相结合,为AI、机器人、机器视觉、移动计算和边缘计算的加速发展创造了必要环境。

外围组件快速互连(PCIe)总线,是PC中几乎所有数据的基础设施。从近20年前的开创性引入到今天,PCIe总线仍然是许多计算平台的基石,并促进了系统内数据的快速传输。最新版本的PCIe 6.0于2021年发布,能提供256GB/s的双向总带宽。这确保了数据能够以足够的速率移动,以保持现代内存和处理器的利用率,从而最大限度地提高整体生产力。PCIe 6.0是云计算、AI和机器学习应用的主要推动力,因为这些应用需要可靠和强大的互连性和性能,同时也会对系统提出强烈的数据传输和处理要求。通过实现更快的访问和传输以及最大限度地减少空闲时间,PCI 6.0还减少了推理和训练时间。

图2:PCIe速度比较,从PCIe 1.x到PCIe 6.x(GB/s)。

图3:存储速度比较:HDD与SATA和NVMe(MB/s)。

存储和内存的发展

除了一些例外,输入计算机的大部分数据都会通过系统内存或RAM进行移动。系统内存有可能成为数据吞吐量和可靠性的主要瓶颈。与PCIe总线和其他外围接口一样,内存技术也在不断进步,以避免数据传输瓶颈的情况发生。例如,DDR4(双倍数据速率4)内存能实现高达3200MHz的数据传输,这相当于大约25GB/s的峰值传输速度,这个速度几乎对于任何现代计算任务来说都已经足够快了。

就可靠性而言,许多用于边缘和机器人应用的计算平台,往往在尺寸和外观方面较小。为了对抗污垢、灰尘或污染物过

多的环境,这些系统越来越多地使用密封和传导冷却的无风扇架构。内存历来容易受到一些应用的影响,但幸运的是,随着最近极端温度DDR4内存的推出,这些挑战也得到了解决。DDR4内存-40~125°C的安全操作范围,允许其在恶劣的操作环境中进行高性能计算;而在这些环境中,正在越来越多地使用机器人和移动系统,以增加人工的安全性。

PC性能的最后一个瓶颈在于存储。无论是从存储介质中检索数据以进行处理,还是将处理后的数据写入介质用于存储、归档或未来使用,硬盘驱动器(HDD)和固态驱动器(SSD)技术通常落后于处理器、内存和数据总线技术的进步。非易失性快速存储器(NVMe)技术与SSD架构相结合,代表着存储性能的重大飞跃,访问时间和传输时间提高了近一个数量级。这与PCIe 6.0和DDR4内存技术相结合,形成了一个创新平台,当与现代处理设备相补充时,该平台为开发人员、研究人员和用户提供了足以满足当今的先进计算机视觉、机器学习和AI软件需求的工业计算性能。

小尺寸,高速度

随着硬件性能赶上软件能力,哪些应用会从中受益最大?

每天人们都在开发机器人系统用于更复杂的用途,我们经常看到具有自适应导航系统的机器人,由于将AI技术集成到其平台中,这些机器人可以评估其所处的环境并自主做出决策。由于其移动性质,这些系统几乎都是电池供电,这类应用不但要求优化计算,而且更重视节能。

小型嵌入式工业计算机应运而生,其通过USB 3.0、Thunderbolt和PCIe等现代输入接口,结合实时处理和决策,正在促进高速数据采集。至关重要和时间敏感的应用,现在已经有了机器人的额外支持。

在模拟和数字孪生应用的情况下,可以使用从活跃的生产线获得的真实数据,复制制造和工厂自动化环境,以进一步训练AI模型,并准确评估软件更改和添加新设备的影响,所有这些都不影响现场操作的完整性。今天的计算技术已经使快速数据移动成为可能,这最终提高了生产力、安全性和产品质量。每个人都将从中受益。

扩展自动化应用市场

在机器视觉世界中,吞吐量和准确性在制造、检测和装配任务中至关重要。利用更复杂的算法和软件功能的能力,将继续为自动化打开大门,并不断扩大其应用领域。这也可能会使软件继续突破硬件的极限,并在未来进一步推动硬件的发展,以满足明天及以后的处理需求。