V100 显卡驱动重新安装: nvml error : driver not loaded : unkonwn

分类:ubuntu |

购了一台英伟达显卡 V100 16G X2 共32G显存的小机器 用于yolo模型训练


之前使用Cpu处理真是太慢了, 不管多少核的, 而使用 GPU比CPU快20倍, 虽然V100是淘汰的产品, 还是提升了不少效率


今天重启了一下机器出现 丢驱动的情况, 重启了2次还是无法找到驱动, 只能重新安装: 


V100 显卡驱动重新安装: nvml error : driver not loaded : unkonwn


image.png


解决方法:


sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt update

sudo apt install nvidia-driver-xxx


这里xxx应该是什么呢: 

查看本地已安装显卡驱动:通过命令  dpkg -l | grep nvidia  查到 575 或 580 , 重新安装一下: 


sudo apt install nvidia-driver-575 


image.png


安装成功后: 重启也是正常的: 


image.png



网上说需要卸载之前nvidia相关的驱动, 但没有这个操作, 直接进行安装, 不知有什么影响, 但驱动是正常的: 


sudo apt-get purge nvidia*

sudo apt-get autoremove




添加nvidia源

sudo add-apt-repository ppa:graphics-drivers/ppa

直接用推荐驱动版本安装: 

sudo ubuntu-drivers autoinstall


查看本地已安装显卡驱动:

dpkg -l | grep nvidia

查看本地使用的具体显卡驱动版本信息:

cat /proc/driver/nvidia/version


image.png

阅读( 35 ) |