tensorrt动态batch推理注意事项

一、背景:使用pytorch进行训练得到pt模型, 然后使用torch.onnx把pt模型转化为onnx模型。然后再使用tensorrt自带的trtexec.exe文件把onnx模型转化为engine文件。

(1)在使用C++进行推理的时候发现一个batch的数据,值推理了里面的第一张,其他图片输出的结果都为0;

原因分析:这是因为在使用torch.onnx把pt文件转为onnx的时候,没有给他增加动态batch,导致默认的batch为1,所以在推理一个batch里面的多个数据时,只对第一个数据进行了加速推理操作,其他的数据就没进入推理,所以其他数据输出为0;

(2)解决方法:

1.首先pt模型转onnx模型的时候,在export加上 dynamic_axes 参数,这样在把onnx转为tensorrt的engine文件的时候,才能转化成功。

import torch.onnx

model = torch.load("cls_model.pth")
model.eval()

dummy_input = torch.randn(1, 3, 64, 64).to("cuda")
torch.onnx.export(model,
                  dummy_input,
                  "cls_model_dyn.onnx",
                  export_params=True,
                  input_names=["input"],
                  output_names=["output"],
                  verbose=True, # verbose=True 会打印出详细的转换过程
                  dynamic_axes={'input':{0:"batch"}, "output":{0:"batch"}} # 设置动态的batch_size
                  )

2.然后在使用trtexec.exe把onnx转成engine文件的话,给它设置动态范围大小minShapes、optShapes、maxShapes、(根据自己推理大小来更改,我的是64)

 .\trtexec.exe --onnx=cls_model_dyn.onnx --saveEngine=cls.engine --explicitBatch --minShapes=input:1x3x64x64 --optShapes=input:8x3x64x64 --maxShapes=input:8x3x64x64

这样子在使用C++推理的时候就可以推理一个batch的数据了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/746111.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

简易人工智能入门(2)

上篇文章讨论过了人工智能的几个核心概念,线性模型,损失函数和梯度下降。下面我们继续探讨。 一、几种梯度下降的方式 1、批量梯度下降法(Batch Gradient Descent,简称BGD)是梯度下降法最初的形式,在更新…

RabbitMQ 入门

目录 一:什么是MQ 二:安装RabbitMQ 三:在Java中如何实现MQ的使用 RabbitMQ的五种消息模型 1.基本消息队列(BasicQueue) 2.工作消息队列(WorkQueue) 3. 发布订阅(Publish、S…

机器发货到菲律宾的完整流程 广东智慧物流

机器发货到菲律宾的完整流程 广东智慧物流 🌟【机器发货到菲律宾完全攻略】🌟 机器发货到菲律宾的完整流程 广东智慧物流 为你整理了一份超详细的机器发货到菲律宾的攻略!海运14天轻松到达,让你无后顾之忧!&#x1f…

昇思25天学习打卡营第3天|MindSpore快速入门-模型训练

基于MNIST_Data.zip手写数据集案例,进行MindSpore模型训练。 MNIST数据集 MNIST数据集由美国国家标准与技术研究所(NIST)整理发布,最初的目的是实现对手写数字的自动识别。该数据集包含了来自250个不同人的手写数字图片&#xff…

python的一些常用的内建函数

内建函数 python中的内建函数是可以被自动加载的,可以随时调用这些函数,不 需要定义。方便的编程。 eval()函数 将字符串当成有效的表达式来求值,并返回计算结果 用于对动态表达式求值,语法格式如下: eval(source&…

使用Tauri+vite+koa2+mysql开发了一款待办效率应用

🎉使用Taurivitekoa2mysql开发了一款待办效率应用 📝项目概述 这是一个基于taurivite的应用,它采用了一些最新的前端技术,包括 Tauri、Vue3、Vite5、koa2 和 mysql。它提供了丰富的效率管理工具。 应用地址:https:/…

排序算法系列一:选择排序、插入排序 与 希尔排序

零、说在前面 本文是一个系列,入口请移步这里 一、理论部分 1.1:选择排序 1.1.1:算法解读: 使用二分法和插入排序两种算法的思想来实现。流程分为“拆分”、“合并”两大部分,前者就是普通的二分思想,将…

首发!麒麟软件打造的跨平台通用Linux端间互联组件Klink正式开源

随着智能终端设备的普及,多个智能终端设备之间的互联互通应用场景日益丰富。多设备互联互通应用场景需要开发者单独实现通讯协议,为解决跨平台问题,麒麟软件打造了跨平台的通用Linux端间互联组件——Klink,并在开源社区openKylin&…

怎么用韩语说帮忙更合体,柯桥零基础韩语培训

1. **详细解释:** - **标准写法与音译:** - **돕다**(读作 dop-da):动词“帮助”。 - **도와주다**(读作 do-wa-ju-da):动词“帮忙”,字面意思是“给予帮助”。 - **도움…

惠海 H6901B升压恒流3.7V 7.4V 12V 24V 30V 36V 48V 60V 80V 100V LED灯杯方案

H6901B是一款升压型LED恒流驱动芯片,具有良好稳定性的特点。H6901B的主要特点包括宽输入电压范围(2.7V-100V)、高工作频率(1MHz)以及多种保护功能(如芯片供电欠压保护、过温保护、软启动等)。此…

佑驾创新A股夭折再冲港股:三年亏损超5亿,商业化盈利难题何解

《港湾商业观察》廖紫雯 日前,深圳佑驾创新科技股份有限公司(以下简称:佑驾创新)递表港交所,保荐机构为中信证券、中金公司。佑驾创新曾于2023年8月启动A股上市辅导,但2024年5月公司终止了与辅导机构的上市…

AI 激发算力需求暴增,施耐德电气解码智算中心发展

随着全球碳达峰目标的持续推进,各行各业都在加速绿色转型的步伐,尤其是高耗能产业更是备受关注。人工智能行业以其迅猛的发展速度令人瞩目,它所带来的不仅是算力需求的飙升,更是日益凸显的能耗问题。 目前,人工智能预…

ubuntu中共享文件夹看不到了,解决方法

1、检查共享文件夹配置 2、创建 3、查看共享文件夹 4、另一问题,每次重启虚拟机后,共享文件夹又没了?

【活动】GPT-5:1.5年后的技术飞跃与社会影响展望

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 GPT-5:1.5年后的技术飞跃与社会影响展望引言技术突破:从…

公益培训|半导体与集成电路项目制培训项目

关于我们 硬蛋产业学院,基于硬蛋创新(http://00400.HK)在芯片产业的资源和技术优势,引进全球领先的芯片应用技术,为国内培养芯片应用技术人才,助力芯片应用产业发展。 硬蛋产业学院在国家各主管部门、广东省、深圳市及社会各界的大…

RabbitMQ延时队列(实现定时任务)

消息的TTL(Time To Live)就是消息的存活时间。 RabbitMQ可以对队列和消息分别设置TTL。 对队列设置存活时间,就是队列没有消费者连着的保留时间。 对每一个单独的消息单独的设置存活时间。超过了这个时间,我们认为这个消息就死了,称之为死…

Mac 如何安装 wget

1.安装 Homebrew2.安装 wget3.检测 wget 是否安装成功 1.安装 Homebrew 在安装 wget 之前需要安装一个适用于 mac 的包管理器 Homebrew,打开 mac 终端执行如下命令进行安装: /usr/bin/ruby -e "$(curl -fsSL https://cdn.jsdelivr.net/gh/ineo6/h…

深度解析拆分盘到底是怎样的运行逻辑!

一、引言 在数字经济的蓬勃发展中,拆分盘投资方式逐渐崭露头角,引起了广大投资者的关注。不同于传统的投资模式,拆分盘以其独特的拆分策略,为投资者提供了一种看似能够持续增值的新途径。本文将深入探讨拆分盘的基本原理、运作实…

Hadoop3:Yarn框架的三种调度算法

一、概述 目前,Hadoop作业调度器主要有三种:FIFO、容量(Capacity Scheduler)和公平(Fair Scheduler)。Apache Hadoop3.1.3默认的资源调度器是Capacity Scheduler。 CDH框架默认调度器是Fair Scheduler。 …

vue3+crypto-js插件实现对密码加密后传给后端

最近在做项目的过程中又遇到了一个新的问题,在实现后端管理系统的个人信息页面中,涉及到修改密码的功能,刚开始我直接通过传参的方式将修改的密码传入给后端,可是后端说需要将原密码、新密码以及确认密码都进行加密处理&#xff0…