在Linux系统下使用NVIDIA的GPU卡(显卡)进行深度学习和计算任务时,驱动和CUDA的安装显得尤为重要。本文将详细介绍如何在Linux系统中安装NVIDIA驱动和CUDA,并提供一些基本的压测指导。
一、安装NVIDIA驱动
首先,你需要确认你的系统中已经有NVIDIA卡。可以使用以下命令来检测:
lspci | grep -i nvidia
如果系统识别到了NVIDIA设备,接下来可以进行驱动的安装。
- 更新包管理器:
首先,确保你的包管理器是最新的:
bash
sudo apt update
sudo apt upgrade
- 添加NVIDIA PPA:
可以通过添加NVIDIA提供的PPA来轻松安装驱动:
bash
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
- 安装驱动:
找到适合你GPU的驱动版本,可以通过以下命令查看可用的驱动:
bash
ubuntu-drivers devices
安装推荐的驱动:
bash
sudo apt install nvidia-driver-<version>
替换 <version>
为推荐的驱动版本。
- 重启系统:
安装完驱动后,重启计算机使驱动生效:
bash
sudo reboot
- 验证驱动安装:
重启后,通过以下命令验证NVIDIA驱动是否安装成功:
bash
nvidia-smi
如果安装成功,你应该能够看到GPU的使用情况和其他信息。
二、安装CUDA
完成NVIDIA驱动安装后,接下来需要安装CUDA。可以从NVIDIA的官方网站下载CUDA Toolkit。
- 下载CUDA Toolkit:
前往NVIDIA CUDA Toolkit页面,根据你的操作系统选择合适的CUDA版本和安装方式(deb/rpm)。
- 安装CUDA:
以deb为例,下载后使用以下命令安装:
bash
sudo dpkg -i cuda-repo-<distro>_<version>_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/<repo>/x86_64/7FA2AF80.pub
sudo apt update
sudo apt install cuda
将指令中的 <distro>
和 <version>
替换成你所下载文件的实际名称。
- 设置环境变量:
添加CUDA到环境变量中。在 ~/.bashrc
文件中添加:
bash
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存文件并执行:
bash
source ~/.bashrc
- 验证CUDA安装:
使用以下命令检查CUDA是否安装成功:
bash
nvcc -V
如果一切顺利,你应该能看到CUDA的版本信息。
三、压测指导
安装完成后,可以进行简单的性能测试来验证GPU是否工作正常。NVIDIA CUDA提供了一些示例代码,可以帮助我们进行基础的性能测试。
- CUDA Samples:
在你的CUDA Toolkit安装目录下,通常会有CUDA Samples。在终端中进入该目录并编译:
bash
cd /usr/local/cuda/samples
sudo make
编译完成后,进入 bin/x86_64/linux/release
目录。
- 运行样本:
可以选择运行简单的样本进行性能测试,使用如下命令运行deviceQuery
,验证设备信息:
bash
./deviceQuery
运行后你将看到GPU的各种信息。
- 性能测试示例:
例如,运行 bandwidthTest
测试带宽性能:
bash
./bandwidthTest
可以通过这种方式获取GPU的性能数据,以便后续进行性能分析。
总结
本文介绍了在Linux系统下安装NVIDIA GPU驱动和CUDA的步骤,并提供了基本的压测示例。通过正确的安装和配置,你可以充分利用NVIDIA GPU进行计算密集型任务,推动深度学习和科学计算的发展。