用于工业AI的Jetson AGX Xavier模块

工业物联网架构师花了数年时间才得出结论，边缘需要数据中心级的性能，以实现高效分析、提高安全性和降低网络成本。在人工智能和机器学习领域，传感器设备内部或附近对高端处理能力的需求从一开始就很明显。
考虑到即使是简单的自主机器（我知道这是矛盾的说法）也需要大量的计算能力来运行神经网络来执行障碍物检测、识别和避免等功能。例如，京东和菜鸟等公司生产的自动送货车需要大约每秒 30 兆次运算（tops）的处理性能，而雅马哈正在开发的自动驾驶检查无人机需要大约 20 兆次运算（tops）的处理性能。
当然，这对嵌入式和工业工程师提出了一个经典的设计挑战：平衡每瓦性能。性能太低，应用程序失败。功耗太大，自主机器必须连接到持续的电源。
随着nvidia 的 jetson agx xavier 模块的发布，这种情况正在改变。
服务器级性能，嵌入式功耗
jetson agx xavier 核心的 xavier soc 包含大量异构处理性能，适用于人工智能驱动的机器人应用程序，包括：
512 核 volta gpu，带有 64 个 tensorcore
八核、64 位基于 arm 的 carmel cpu
双 nvdla（nvidia 深度学习加速器）引擎
双 7 路 vliw 视觉加速器引擎
这代表 jetson agx 模块的性能高达 32 tops，尺寸为 87 mm x 100 mm。如上图所示，该芯片还包括一个 256 位 lpddr4x 接口，能够以 137 gbps 的速度将数据传输到模块上的 16 gb dram，用于与 ai 工作负载相关的频繁读写。
基本上，jetson agx xavier 以嵌入式模块形式提供服务器级性能。然而，同样重要的是，该模块的功耗仅为 10w，或与台式风扇差不多。用户可将操作模式配置为 10w、15w 或 30w，nvidia 报告称每瓦性能（ppw）的最佳点在 15w 左右。即使在那个水平（大约相当于蓝光播放器的功耗），jetson agx xavier 在推理性能和能源效率方面也大大超过了其前身 jetson tx2 和 intel core i7 + gtx 1070 显卡。
jetson agx xavier：引擎盖下
jetson agx xavier 的多项功能可实现这种类型的每瓦性能，从基础芯片架构开始。虽然 soc 上的每个内核都有自己的内存，但内存是离散 soc 模块之间的零内存复制。虽然 agx xavier 模块确实通过外部 16 gb lpddr4x dram 提供共享内存，但片上数据只是通过管道传递到必要的处理核心。
架构的异构性也提高了效率，因为工作负载可以在最适合任务的架构上执行。这方面的一个例子是片上加速引擎，它可以卸载 volta gpu，以便它可以专注于更复杂或用户定义的任务。例如，在以 8 位分辨率推断固定功能卷积神经网络（cnn）时，nvdla 引擎可提供高达 5 tops 的性能，以 16 位分辨率推断 2.5 tflops 时，功耗在 0.5w 和 1.5w 之间。
同时，carmel cpu 内核可以保留用于通用计算任务。
jetpack 简化了深度学习编程的复杂性
jetson agx 系列运行 linux，这在工业嵌入式系统中变得越来越普遍。许多希望利用 jetson agx xavier 性能的工业和嵌入式开发人员可能不太熟悉的是对 gpu 和/或深度学习加速器进行编程。幸运的是，nvidia jetpack 4.1.1 软件开发套件（sdk）在cuda toolkit中提供了一揽子 api、嵌入式库以及与常用语言的集成，因此您无需了解如何编程 gpu对 gpu 进行编程。
最新jetpack版本中的一些软件工具包括：
linux for tegra r31.0.1 （k4.9）
cuda 工具包 10.0
cudnn 7.3
张量rt 5.0 ga
opencv 3.3.1
opengl 4.6 / gles 3.2
伏尔甘 1.1
多媒体 api r31.1
阿格斯 0.97 相机 api
tensorrt 5.0 包中提供的 api 也简化了对 dla 进行编程以执行神经网络工作负载。例如，_setdevicetype（）和 setdefaultdevicetype（）命令可用于在 gpu 或任一 dla 上执行特定的神经网络层或层，而像 _allowgpufallback（）这样的命令可让工作负载在 dla 不支持的情况下恢复到 gpu 。
此外，deepstream 3.0 sdk 支持 jetson agx xavier，该 sdk 利用 tensorrt、cuda、多媒体和成像 api 来加速视频分析应用程序的开发。
当然，低级 cuda 编程是另一种选择。

VHDL语言应用实例指导
梁斌针对5G千兆网产业的发展提出三点建议
新版UL 1973认证标准：关于钠离子电芯详解
MAX9867 超低功耗立体声音频编解码器
福禄克发布全新Fluke 562和Fluke 563手持式红外测温仪
用于工业AI的Jetson AGX Xavier模块
Keil C51是如何支持双数据指针，有哪些特别的要求
理想汽车2020财报解读：首次实现季度盈利
监控摄像机产品的分辨率和清晰度的选择
人工智能在精神病学的应用，能比人类更好
AGV机器人未来发展空间广阔
区块链给税收征纳带来了哪些影响
iPhone 15将会有多少款?
浅谈通信设备内部的三种接地
霍尔电流传感器在电网无功功率自动补偿中的应用
研究人员研发新型电子植入物涂层，AI和人类融合或将实现
金源照明披露了招股书，公司拟在深交所创业板上市
华为mate10上市在即!搭载最强麒麟970处理器,华为mate9已经开始降价,买不买?
Microchip并购Atmel后整并计划开始主力产品线原封不动
高压继电器的型号规格和使用满足要求有哪些