优秀的编程知识分享平台

网站首页 > 技术文章 正文

这样搭建Ubuntu系统GPU环境,看完还不会你来找我!(收藏干货)

nanyue 2024-08-08 19:09:52 技术文章 9 ℃

Ubuntu 20.04 LTS 搭建GPU环境


胜利是不会向我们走来的,我们必须自己走向胜利。


Victory won't come to us unless we go to it.



入门人工智能领域,深度学习也好,强化学习也罢,如果没有算力做支撑,还是早点洗洗睡吧,毕竟梦里啥都有


因此,对于入门这个领域的本科生、研究生准备进入工业界的相关群体来说,学会搭建GPU环境是必备的基本功技能之一。下面,我将尽可能详细地说明,甚至重现每一步的结果截图,以便有益于诸君。


进入终端,执行命令

nvidia-smi



可以看到,系统此时支持的CUDA版本为11.2


一、安装CUDA

进入CUDA安装的官网

https://developer.nvidia.com/cuda-toolkit-archive


找到匹配的CUDA11.2

选择Linux

选择x86_64 ----Ubuntu----20.04(根据实际系统版本选择)---deb(local)


系统信息查询补充:


系统版本查看

lsb_release -a



Distributor ID: Ubuntu //类别是 Ubuntu
Description:Ubuntu
20.04.2 LTS //20年4月发布的长时间支持版本
// LTS 是 Long Term Support:长时间支持版本,支持周期长达三年至五年
Release
20.04 //发行日期或者发行版本号
Codename:focal
//ubuntu的代号名称


系统内核版本和位数查看

其中x86_64就代表是64位的


我们回到主线任务,点击deb(local)后,CUDA官网便会给出对应的下载安装命令。


在系统中进入下载文件夹

打开终端

开始逐条执行命令

1wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
2sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
3wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb
4sudo dpkg -i cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb
5sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub
6sudo apt-get update
7sudo apt-get -y install cuda




执行到第3条命令时,需要下载cuda本地deb安装包 ,时间会稍长些


可能会出现“段错误(核心已转储)


我们执行命令,查看目前资源限制的设定。

ulimit -a


可以看到堆栈的大小为8192k 大约8M多,我们将其存储空间调大

执行命令,将其调整为100M

ulimit -s 102400


调整后,将下载不完整的安装包删除

删除后,再次运行下载安装包下载命令

发现仍然会出现此错误

忽视此错误,继续安装,发现报错

于是继续删除下载不完整的文件

执行命令

ulimit -c unlimited


再次进行下载


发现,weget已经可以下载到100成功解决“段错误(核心已转储)”问题

继续执行安装命令


发现公钥没有被安装,根据提示安装公钥,执行命令

sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub


继续执行安装命令


执行下一步更新apt-get源


执行安装cuda


安装完成


查看cuda信息

nvcc -V



根据提示信息,安装nvidia-cuda-toolkit工具套装

sudo apt install nvidia-cuda-toolkit



输入y继续执行

安装时间较长

装好后继续执行命令查看cuda

说明cuda安装成功!


二、安装cudnn


进入cuDNN官网

https://developer.nvidia.com/cudnn


点击下载cuDNN (需要登录,未注册的需要先注册

输入邮箱

输入密码或注册成功后,进入下载页面,记得勾选“I Agree... 同意协议选项”


选择对应CUDA 11.X的 cuDNN


找到Ubuntu对应的3个deb安装包,全部下载


下载成功后


先执行命令,利用正则查看文件 模糊查询lib开头的(为了复制文件名

ls |grep lib



开始安装

1sudo dpkg -i libcudnn8_8.2.0.53-1+cuda11.3_amd64.deb
2sudo dpkg -i libcudnn8-dev_8.2.0.53-1+cuda11.3_amd64.deb
3sudo dpkg -i libcudnn8-samples_8.2.0.53-1+cuda11.3_amd64.deb


安装runtime版


安装dev开发版


安装样例代码


测试cuDNN是否安装成功

cuDNN的样例代码位置在/usr/src/cudnn_samples_v8(注意这里的v8指版本8,不同的cuda可能对应不同的版本,有的是v7) ,我们可以通过编译mnistCUDNN sample进行验证


执行命令,复制样例到自己新建的lab文件夹


(1)先确定lab文件夹路径

1cd ~
2ls
3cd lab
4pwd



(2)开始复制并测试

1cp -r /usr/src/cudnn_samples_v8/ /home/yhl/lab



1cd /home/yhl/lab/cudnn_samples_v8/mnistCUDNN



进行编译

1make clean && make


出现错误“FreeImage.h


安装libfreeimage3库即可解决“FreeImage.h”没有被发现的错误。

1sudo apt-get install libfreeimage3 libfreeimage-dev



安装完成


再次进行编译

1make clean && make



测试运行

1./mnistCUDNN



出现Test passed ! 表示cuDNN已经安装成功并且能够正常使用。



如果你在操作过程中遇到了什么问题,或有什么想法和建议(希望大家多提想法和建议,一起交流,一起进步~),在留言区留下你的足迹吧,看到后便会及时回复大家哦~

最近发表
标签列表