这篇文章主要介绍了Pytorch dataloader在加载最后一个batch时卡死的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
问题:
自己写了个dataloader,为了部署方便,用OpenCV的接口进行数据读取,而没有用PIL,代码大致如下:
def __getitem__(self, idx): sample = self.samples[idx] img = cv2.imread(sample[0]) img = cv2.resize(img, tuple(self.input_size)) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # if not self.val and random.randint(1, 10) <3: # img=self.img_aug(img) image.fromarray(img) self.transforms(img) ...<pre></div><p>结果在训练过程中,在第1个epoch的最后一个batch时,程序卡死。</p><h2>解决方案:</h2><p>可能是因为OpenCV与<b style="color:transparent">来源gao@!dai!ma.com搞$$代^@码!网</b>Pytorch互锁的问题,关闭OpenCV的多线程,问题解决。</p><div class="gaodaimacode"><pre class="prettyprint linenums"> cv2.setNumThreads(0) cv2.ocl.setUseOpenCL(False)
补充:pytorch 中一个batch的训练过程
# 一般情况下 optimizer.zero_grad() # 梯度清零 preds = model(inputs) # inference,前向传播求出预测值 loss = criterion(preds, targets) # 计算loss loss.backward() # 反向传播求解梯度 optimizer.step() # 更新权重,更新网络权重参数
此外,反向传播前,如果不进行梯度清零,则可以实现梯度累加,从而一定程度上解决显存受限的问题。
以上就是Pytorch dataloader在加载最后一个batch时卡死的解决的详细内容,更多请关注gaodaima搞代码网其它相关文章!