Github上目标检测项目： mmdetection项目初接触，安装学习过程记录。

文章目录[隐藏]

六、测试GPU加速效果

项目地址：https://github.com/open-mmlab/mmdetection

本人硬件：显卡 GTX3090+CUDA11.1，目前应该是最新的版本吧。

本篇文章分两部分，第一部分按root用户安装的，然后普通用户使用pycharm,进入root文件夹权限不够，然后就有了第二部分

第二部分是新建普通用户，在第一部分的基础上重新安装了一遍。。。

注意：请先确定电脑显卡是nvidia的，如果不是，就不能跑这个项目！

一、（一开始用的其他显卡的，采坑了）

1、安装Python

一般情况下ubuntu默认已经安装了python，如果没有安装，需要自己安装一下，具体百度下。

直接输入指令 python ，可以查看当前版本，可以看到已经有了3.5.2

已经进入到了python交互界面，

输入

 print(<span>"</span><span>Hello World!</span><span>"</span>)

www#gaodaima.com来源gaodaimacom搞#^代%!码网搞代码

按 Ctrl +D 退出。

如果需要3.0以上的版本，也可以输入python3 ，查看是否安装了3.0的版本。

我需要的版本是3.6+，需要升级版本。

添加PPA第三方软件仓库，

执行

sudo add-apt-repository ppa:deadsnakes/ppa

可以看到ubuntu版本和匹配对应的python版本

然后更新资源库　　

sudo apt-<span>get</span> update

安装

sudo apt-<span>get</span> install python3.<span>7</span>

为了方便，设置优先级，可以执行python，启动的就是3.0的版本，不用执行python3了。

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 <span>150</span><span>

sudo update</span>-alternatives --install /usr/bin/python python /usr/bin/python2 <span>100</span>

因为我的电脑默认本来是3.5.2的，我想要3.7的，所以再执行下面的，设置3.7优先。

sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.<span>5</span>  <span>1</span><span>

sudo update</span>-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.<span>7</span>  <span>2</span>

设置完后，

再执行python,默认使用3.7版本的python，完成安装。

2、安装CUDA

前提需要安装nvidia驱动、cuda和cudann，三者版本要一一匹配。主要是cuda版本要和驱动版本一致。

地址：https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

2.1安装显卡驱动

测试电脑有没有nvida驱动，输入命令 nvidia-smi 如果识别不了，说明没有装。那么就要去下载驱动并安装。

首先要知道自己系统显卡的型号，才能去下载对应版本的驱动。

https://www.gaodaima.com/maizousidemao/article/details/88821949

查看当前系统的显卡：lspci | grep -i nvidia

没反应，说明没有nvidia显卡

执行

lspci | grep -i vga

出现如下图，

00:02.0 VGA compatible controller: Cirrus Logic GD 5446

说明系统不是nvidia显卡。

没法继续了。。。。

终结！！

——————————————————————

换nvidia显卡的系统安装！

1、安装python

2、安装pytorch

执行以下命令验证是否已经安装pytorch:

<span>python

import torch

torch.__version__</span>

3、安装CUDA，下载+安装

查看是否已经安装：

nvcc  -V

没有安装的话，需要根据显卡安装对应版本，

查看显卡型号:　

lshw -c video

或者按上面说的：　　

lspci | grep -i nvidia

　　或者

　lspci | grep -i vga

有的说可以用

 nvidia-smi

命令，但我的不行0.0（后面就可以了。。往后面看）

根据2204，和上面的网址 https://www.gaodaima.com/maizousidemao/article/details/88821949，查找对应的型号：

显卡型号知道了，接下来是驱动。

先验证是否已经安装了驱动：

　　首先得安装 mesa-utils，在终端输入命令：

sudo apt-<span>get</span> install mesa-utils

　　然后再运行命令：

glxinfo | grep rendering

　　如果结果是“yes”，证明显卡驱动已经成功安装

如果没有安装就要自己下载安装了：

1.可以去网站找对应的驱动并下载　　https://www.nvidia.cn/Download/index.aspx?lang=cn#

填入自己电脑的型号

点击搜索，查到需要下载的驱动版本。

对应的版本是455,

还可以通过

ubuntu-drivers devices

可以看到可以使用的驱动版本号，

也是455

所以就安装455的驱动。

首先禁用ubuntu默认安装好的一个驱动：nouveau

先验证是否已经禁用：　　

 lsmod | grep nouveau

无输出，表示禁用成功。。。（有点懵？？啥时候禁用的？）

没有禁用的一定要禁用，貌似坑很多！！

接下来安装驱动：

网上有三种方法：地址 https://zhuanlan.zhihu.com/p/59618999

1、

sudo ubuntu-drivers autoinstall<code> </code>

会直接安装上面查到的455的驱动

如果想安装其他版本，如 340 版本，sudo apt install nvidia-340 就自动安装了。

安装完成后重启系统即可

2、使用PPA第三方软件仓库安装最新版本

添加 PPA 软件仓库：

sudo add-apt-repository ppa:graphics-drivers/ppa

，需要输入用户密码，按照提示还需要按下 Enter 键。

更新软件索引：

sudo apt update

接下来的步骤同方法一，只是这样我们就可以选择安装最新版本的驱动程序了。

3、手动下载

按照上面说的方法下载，

接着需要先安装一些 NVIDIA 显卡依赖的软件，在终端依次执行如下命令：

sudo dpkg --add-<span>architecture i386
sudo apt update
sudo apt install build</span>-essential libc6:i386

我选择的第一种，，跑一段时间后，停止如下图

重启检查是否安装完成：

reboot

执行下图

表示自动安装成功。

现在显卡驱动安装成功后，安装对应版本的CUDA

安装CUDA:　　

　　准备工作：

　　1、先检查gcc是否安装： gcc -v

　　2、安装kernel header和 package development：　　

sudo apt-<span>get</span> install linux-headers-$(uname -r)

　3、因为我的显卡驱动是455，对应上面的表，需要安装11版本以上的CUDA

　　去官网选择自己的环境之后，记住选择 runfile(local) 版本。

https://developer.nvidia.com/zh-cn/cuda-downloads?

根据下方的安装说明，执行。

第一个是下载，网上说下的很慢，然后我去找到了一个交大云盘下载的，但是版本是10+，跟硬件不匹配，所以，我还是按照了安装说明下载，发现速度很快，五分钟就下载完了3G 大小的文件。。

执行 wget 命令时，出现了一个小问题，

解决办法：查看环境变量

 export -p

最后三行是

因为地址是https 的，所以只需要重置最后一个代理地址：

执行　　

unset https_proxy

再查看环境变量，三行变两行了。

然后就能下载了。

下载完毕，执行安装说明的第二个命令，中间需要选择几个选项，

依次选择　　 continue—–　accept　——–取消Driver【X】前面的X （因为已经安装了驱动了，不取消会报错），然后选择install。

执行成功界面如下：

验证CUDA是否安装成功：

cd /usr/local/cuda-<span>11.1</span>/samples/1_Utilities/<span>deviceQuery   

sudo  make 

.</span>/deviceQuery

最后结果是

表示安装成功！

五、添加环境变量：

<span>#添加路径到PATH变量
export PATH</span>=/usr/local/cuda-<span>11.1</span>/bin:/usr/local/cuda-<span>11.1</span>/nsight-compute-<span>2020.2</span>.<span>0</span>${PATH:+<span>:${PATH}}

#使用runfile安装时，64位系统上的LD_LIBRARY_PATH变量需要包含：
export LD_LIBRARY_PATH</span>=/usr/local/cuda-<span>11.1</span>/lib64${LD_LIBRARY_PATH:+<span>:${LD_LIBRARY_PATH}}

#保存环境变量
source </span>/etc/profile

<code class="prism language-powershell"><span class="token operator"><span class="token operator"><br>此时执行 env ，可以看到PATH里出现CUDA的路径。<br>还需要reboot,否则环境变量不能永久生效。<br><br><br><span>有的系统不是bash，</span></span></span></code><code class="prism language-powershell"><span>参考这个：</span> http://www.linuxboy.net/linuxjc/126570.html    </code><code class="prism language-powershell"><span class="token operator"><span class="token operator"><span>按下面的来</span></span></span></code>

echo <span>"</span><span>export PATH=/usr/local/cuda-11.1/bin/:$PATH</span><span>"</span>>>~/<span>.zshrc

echo </span><span>"</span><span>export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH</span><span>"</span>>>~/<span>.zshrc

source </span>~/.zshrc

<code class="prism language-powershell"> </code>

<code class="prism language-powershell"><span class="token operator"><span class="token operator"> </span></span></code>

<code class="prism language-powershell"><span class="token operator"><span class="token operator"><strong><span style="font-size: 18px">验证CUDA能正确并支持与CUDA硬件通信：</span></strong><br><span style="font-size: 16px">1、  确认驱动程序的版本。</span><br></span></span></code>

cat /proc/driver/nvidia/version

　2、进入 /usr/local/cuda-11.1/samples目录

<code class="prism language-powershell">进行汇编测试：</code>

make -k

<code class="prism language-powershell"><span class="token comment"><span class="token operator"><br></span></span></code><code class="prism language-powershell"><span class="token comment"><span class="token operator"><span style="font-size: 16px">3、编译完毕，进入samples目录，出现了bin目录，运行二进制文件</span><br></span></span></code>

cd /usr/local/cuda-<span>11.1</span>/samples/bin/x86_64/linux/<span>release  
.</span>/deviceQuery  <code class="prism language-powershell"></code>

<code class="prism language-powershell"><span class="token comment"><span class="token operator">最后一行出现pass，说明CUDA软件安装和配置正确。<br>（如图，第一行显示检测到设备，第二行显示设备型号，最后一行显示测试通过。）</span></span></code>

六、测试GPU加速效果

利用YOLOv3实现第一个视频物体检测

1、编译时，Makefile中GPU=0，OPENCV=1，则不采用GPU加速;

2、编译时，Makefile中GPU=1，OPENCV=1，则有加速。

参考：https://www.it610.com/article/1294417307388420096.htm

七、检测软件是否安装齐全

根据项目的规定，检测软件是否安装：

Python 3.6+ 3.7.9 （python3）
PyTorch 1.3+ 1.5.0 （在python下执行 import torch 和 torch.__version__ ） print(torch.version.cuda) 打印当前torch对应的cuda版本
CUDA 9.2+ (If you build PyTorch from source, CUDA 9.0 is also compatible) 11.1 （环境变量配好，nvcc -V）
GCC 5+　　 7.5.0 (gcc -v)
MMCV

import mmcv 报错，网上查了查，

是cuda和torch 版本冲突

于是 pip list 看一下

现在，cuda是11.1 torch是1.5.0　　mmcv-full是1.2.3 pip是20.3.3

卸载原mmcv-full

pip uninstall mmcv-full

再安装新的

pip install mmcv-full -f https:<span>//</span><span>download.openmmlab.com/mmcv/dist/cu111/torch1.7.0/index.html</span>

mmcv -full 从1.2.3 变成了 1.2.2版本了

torch还是1.5.0没有变成1.7.0？？

先卸载原来的：

pip uninstall torch

根据自己的CUDA版本自动安装对应的torch版本：

pip install torch torchvision

下载完毕，

现在，cuda是11.1 torch是1.7.1　　mmcv-full是1.2.2 pip是20.3.3 gcc是7.5.0

然后在python交互界面运行，

执行以下代码验证是否安装成功，可以参考 https://github.com/open-mmlab/mmdetection/blob/master/docs/get_started.md 最下面的 Verification 部分：

<span>from</span><span> mmdet.apis import init_detector, inference_detector
config_file </span>= <span>"</span><span>configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py</span><span>"</span><span>
device </span>= <span>"</span><span>cuda:0</span><span>"</span><span>
# init a detector
model </span>= init_detector(config_file, device=<span>device)
# inference the demo image
inference_detector(model, </span><span>"</span><span>demo/demo.jpg</span><span>"</span>)

如果报错ModuleNotFoundError, 可以在mmdetection目录下，运行下面代码升级库：

python setup.py install

执行完毕，会在mmdetection目录下生产build目录。

如果还不行，就再执行下

 python setup.py develop

然后就可以运行成功了！

我这个不是图形化界面，需要图形化显示需要pycharm 或者 tensorboard 。

———————————————————————————————————————————————————————————————-

第二部分，第一部分用root安装的，普通用户没法用root文件夹里的东西。。。。。。。由于某些原因，切换了用户，重新安装。。。。。。。。。。。又累个半死！

1、重新换用户

新增用户

2、检查软件

上面第一部分，cuda是11.1 torch是1.7.1　　mmcv-full是1.2.2 pip是20.3.3 gcc是7.5.0

现在，cuda是11.1 torch是1.7.1　 torchvision是0.8.2　 mmcv-full未安装 pip是20.3.3 gcc是8.3.0

切换到pytorch环境：　　（此处请自行百度conda 环境管理）

conda activate pytorch

用pytorch环境，

　　　　cuda=11.1 　torch=1.7.1　　 mmcv-full =1.2.2 pip=20.3.3 gcc=7.3.0

执行程序还是报错，

猜想权限的问题？或者重新安装mmde项目?

执行

pip install -v -e .

报错，忘记换环境了！！解决办法，在正确的环境下，执行

python setup.py develop

然后执行就成功了，也能看到成功安装了mmdet

重装mmcv-full : 　　

pip uninstall mmcv-<span>full    　　　

pip install mmcv</span>-full==<span>1.2</span>.<span>4</span> -f https:<span>//</span><span>download.openmmlab.com/mmcv/dist/cu111/torch1.7.0/index.html </span>

版本换成1.2.4，解决问题了

3、安装完毕后，还用 https://github.com/open-mmlab/mmdetection/blob/master/docs/get_started.md 最下面的检测代码：

<span>from</span><span> mmdet.apis import init_detector, inference_detector
config_file </span>= <span>"</span><span>configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py</span><span>"</span><span>
device </span>= <span>"</span><span>cuda:0</span><span>"</span><span>
# init a detector
model </span>= init_detector(config_file, device=<span>device)
# inference the demo image
inference_detector(model, </span><span>"</span><span>demo/demo.jpg</span><span>"</span>)

验证是否成功。

报错：　　RuntimeError: CUDA error: no kernel image is available for execution on the device

原因：　　cuda和torch版本不匹配。

办法：

<span>pip uninstall torch
pip install torch</span>==<span>1.7</span>.<span>1</span>+cu110 torchvision==<span>0.8</span>.<span>2</span>+cu110 torchaudio===<span>0.7</span>.<span>2</span> -f https:<span>//</span><span>download.pyto</span>rch.org/whl/torch_stable.html

<strong><code> </code></strong>

再执行代码：如图

就不报错了。

结束。

有问题可以留言噢~~~

——————————————————————————————————————————————————————————————————————————————

记录一些语句

1、查看python安装目录:

<span>python
import sys
sys.path</span>

2、查看conda的信息　　

conda info --env

3、检测CUDA是否安装正确并能被Pytorch检测到 && 看Pytorch能不能调用cuda加速

　　https://www.cnblogs.com/liuke-note/p/10149530.html

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：Github上目标检测项目： mmdetection项目初接触，安装学习过程记录。

六、测试GPU加速效果

Hi，您需要填写昵称和邮箱！