程序笔记   发布时间:2022-07-03  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了TensorRT优化方案图例大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

TensorRT优化方案图例

 

@H_450_4@

 

 图 12. TensorRT 循环由循环边界层设置。数据流只能通过下方式离开循环@H_262_10@环输出层. 唯一允许的后边缘是第二个输入@H_262_10@递归层。

 

TensorRT优化方案图例

 

 图 13. 一个 if 条件构造抽象模型 

 

TensorRT优化方案图例

 

 图 14. 使用控制条件执行 @H_262_10@IIf@H_262_10@条件输入层 放置

 

TensorRT优化方案图例

 

 图 15. 层执行和在 CPU 端启动的内核。

 

TensorRT优化方案图例

 

 图 16. 内核实际运行在 GPU 上,换句话说,显示了 CPU 端的层执行和内核启动与在 GPU 端的执行之间的相关性。

 

TensorRT优化方案图例

 

 图 17. 布局格式 @H_262_10@CHW: 图像分为 @H_262_10@高×宽矩阵,每个通道一个,矩阵按顺序存储;一个通道的所有值都是连续存储的。

 

TensorRT优化方案图例

 

 图 18. 布局格式  @H_262_10@HWC: 图像存储为单个 @H_262_10@高×宽矩阵,值实际上是 C 元组,每个通道都有一个值;一个点(像素)的所有值都是连续存储的。

 

TensorRT优化方案图例

 

 图 19. 一对通道值打包在一起 @H_262_10@高×宽 矩阵。结果是一种格式,其中@H_262_10@[C/2]@H_262_10@高x宽 矩阵的值是两个连续通道的值对。 

 

TensorRT优化方案图例

 

 图 20. 在这个 @H_262_10@NHWC8 格式,一个@H_262_10@高×宽 矩阵包括所有通道的值。

 

TensorRT优化方案图例

 

 图 21. 正常情况下的性能指标 @H_262_10@trtexec在 Nsight Systems (ShuffleNet, BS=16, best, TitanRTX@1200MHz) 下运行。

 

链接:

https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

 

大佬总结

以上是大佬教程为你收集整理的TensorRT优化方案图例全部内容,希望文章能够帮你解决TensorRT优化方案图例所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。