使用新的Nsight Compute改进导航和性能可视化

nvidia nsight compute 是一款用于 cuda 应用程序的交互式内核分析器。它通过用户界面和命令行工具提供详细的性能指标和 api 调试。 nsight compute 2022.2 包含扩展支持的环境和工作流程的功能,用于 cuda 内核评测和优化。
nvidia optix 加速结构查看器
使用新的 nvidia optix acceleration structure viewer ,用户可以在启动光线跟踪管道之前检查他们构建的结构。加速结构描述渲染场景的几何体,用于光线跟踪交点计算。用户创建这些加速结构, optix 将其转换为内部数据结构。有时,用户创建的描述很容易出错,很难理解渲染结果为什么不符合预期,或者是什么限制了性能。
有了这个新功能,用户可以在三维可视化工具中浏览它们,并查看创建过程中使用的参数,如构建标志、三角形网格顶点和 aabb 坐标。此查看器可用于识别重叠或低效的层次结构,从而产生亚像素光线跟踪性能。
图 1  带 3d 场景导航的 nsight compute acceleration structure viewer
每个内核的问题检测
最新版本在摘要页面中添加了一个新的“检测到的问题”列,用户可以根据检测到的性能问题的数量对所有分析的内核进行排序。这为用户提供了在多个结果(内核配置文件)中集中精力的指导。如果用户不确定要将优化工作集中在哪个内核上,那么一个长时间运行且检测到大量问题的内核是一个很好的起点。
图 2  摘要页面中的“检测到的问题”列标识性能问题最多的内核
其他改进
源页面上的度量分组和选择选项有改进,使其更易于使用。此外,此版本还增加了对在基于 arm sbsa 和 l4t 的平台上运行 nsight compute 用户界面的支持,用户无需远程连接或单独的主机即可进行配置。
关于作者
jackson marusarz 是 nvidia 计算开发工具的产品经理。他关注如何使用工具使所有开发人员能够轻松高效地评测、调试和优化 cuda 代码。杰克逊拥有 boulder 科罗拉多大学计算机工程硕士学位。


高性价比蓝牙耳机推荐,500元蓝牙耳机性价比之王
压控电流源电路原理图讲解
索尼发布新无线耳机:功能上黑科技满满
一款优秀的智能机器人应该具备哪些功能
科技部发布“国家质量基础的共性技术研究与应用”2020报指南的通知
使用新的Nsight Compute改进导航和性能可视化
FPGA相关技术助力高端存储器接口设计
智能锁真的没有机械锁安全吗?防盗性能不足?
声光控制电路图大全(声光控节能灯/延时节电灯/声光控楼梯延迟开关电路)
联电发生跳电事故,民众误以为火灾
PCB设计:盘中孔工艺,到底有多大价值?
我国光伏产业发展的优势与劣势的对比
便携设备是什么 便携设备的优点和缺点
基于MCS-96单片机和数据融合技术实现机器人系统的应用方案
LED灯杆显示屏搭载智慧灯杆需求加速增长
SED电视机工作原理
氯霉素快速检测系统设备的原理及用途是什么
新能源补贴政策的逐渐退坡 比亚迪成最大补贴赢家
分享一个STM32菜单框架
浅谈3D打印技术与机器人自动化技术如何打印出球鞋