Advertisement

Ubuntu16.04 安装NVIDIA驱动,CUDA8.0, cuDNN6.0, Anaconda3-4.2.0, tensorflow-gpu 1.4.0

阅读量:

@Ubuntu16.04 安装NVIDIA驱动,CUDA8.0, cuDNN6.0, Anaconda3, tensorflow-gpu 1.4.0

Ubuntu16.04 安装NVIDIA驱动,CUDA8.0, cuDNN6.0, Anaconda3, tensorflow-gpu 1.4.0

最近开始深入学习深度学习技术。从最开始安装Ubuntu系统到最终成功配置TensorFlow花了将近一周的时间,并且过程中遇到了不少困难。踩了无数个‘坑’后决定整理经验分享出来希望能帮大家规避这些常见问题。这篇博客大概是综合了众多教程的经验并通过不断遇到的问题进行总结和优化而成的。

安装NVIDIA驱动:

第一步:搜索匹配型号的NVIDIA程序

在这里插入图片描述

对于不知道电脑所使用的显卡型号的用户,请按照以下步骤操作:依次点击:右上角的小齿轮 → 系统设置 → 系统选项 → 软件与更新 → 附加驱动。方括号内的内容即为显卡型号。

在这里插入图片描述

#附上第一步的网址:https://www.nvidia.cn/Download/index.aspx?lang=cn

第二步:下载显卡驱动程序
在第一步中进行搜索后会列出一个或多个驱动程序列表。单击其中一个驱动程序并点击"下载"按钮进行操作。完成操作后会生成一个名为‘.run’的文件。

在这里插入图片描述

第三步:彻底清除所有显卡驱动程序并禁用nouveau
#必须彻底清除
#之前通过apt-get进行安装
sudo apt-get remove --purge nvidia*

#之前使用.run文件安装, 找到文件名并复制下来(手打也可以, 不打错的话)

使用sudo权限赋予+x执行权限给所有*.run文件。
运行并删除名为NVIDIA-Linux-x86_64-418.74.run的指定文件。

#禁用nouveau
sudo gedit /etc/modprobe.d/blacklist.conf
在打开的文档后新增一行,并输入命令blacklist Evauchef之后保存并关闭。接着执行sudo update-initramfs -u操作并重启电脑以完成设置。

第四步:检查禁用nouveau是否已实现
#执行相关命令后无返回信息表明功能已实现
lsmod | grep nouveau
#若未实现功能请务必确保禁用操作已完成后再继续后续操作

第5步:安装配置显卡驱动(建议在移动设备或其他终端设备上进行操作)

#Ctrl+Alt+F1打开命令行
#Ctrl+Alt+F7关闭命令行
使用快捷键"Ctrl+Alt+F1"启动命令行界面;请依次输入用户名与密码并完成登录操作

path变量指定显卡驱动程序文件的存放路径
name变量指定显卡驱动程序文件的名称
cd path
使用sudo权限修改权限设置
chmod a+x name
运行指定可执行文件
重新启动系统

重启后输入命令:nvidia-smi

在这里插入图片描述

即使显示结果存在轻微差异,在系统正常运行的前提下(虽然不知道为什么会存在这样的差异),但后续操作均顺利进行,并无需过分担忧。

安装CUDA8.0

第一步是下载CUDA8.0的runfile文件
#关键点:必须下载runfile
#注意!若采用deb安装方式,请确保后续自动升级至10.1版本可能会让你失望

在这里插入图片描述

附上下载页面链接:https://developer.nvidia.com/cuda-80-ga2-download-archive

第二步:安装CUDA8.0
#path是cuda8.0.run文件的保存地址
#name是cuda8.0.run文件的文件名
cd /path
sudo chmod 777 name
sudo ./name
这里要等一大会儿
然后出现文档, 按回车键到最后, 然后输入accept, 然后提示是否安装NVIDIA驱动(看到NVIDIA Deiver)的时候输入n, 后面的其他都输入y

第三阶段:配置环境变量 [ # bashrc 文件 的 配置 ] sudo命令用于编辑$HOME/.bashrc文件. 在打开文档后,在最后一页换行处输入:

复制代码
    export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

#如下图所示

在这里插入图片描述

保存, 关闭
source ~/.bashrc

#profile文件配置
sudo gedit /etc/profile
在打开的文档最后换行, 输入:

复制代码
    PATH=/usr/local/cuda/bin:$PATH
    export PATH

保存, 关闭
source /etc/profile

#添加lib库路径
sudo gedit /etc/ld.so.conf.d/cuda.conf
在打开的文档输入:

复制代码
    /usr/local/cuda/lib64

保存, 关闭
sudo ldconfig

#测试一下是否安装成功
nvcc -V

在这里插入图片描述

最后一行显示release 8.0则安装成功

安装cuDNN6.0

cuDNN的安装过程相当简便,并且相较于同类库来说相比同类库相比同类库相比同类库相比同类库相比同类库相比同类库相比同类库相比同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起同类库比起类似技术来说较为简单,在具体操作时会引导用户前往下载页面,在该处可以看到多种不同版本的技术包让用户选择。

在这里插入图片描述

点击第3个 即cuDNN v6.0 Library for Linux 注册账号后 即可下载 附上下载页面链接 https://developer.nvidia.com/rdp/cudnn-archive

完成下载后, 文件应为.tgz扩展名。
#path 是 cuDNN 文件的存储路径
#name 是 cuDNN 文件的名字
cd path
$tar zxvf name

完成下载后, 文件应为.tgz扩展名。
#path 是 cuDNN 文件的存储路径
#name 是 cuDNN 文件的名字
cd path
$tar zxvf name

#path_cuda表示cuda文件地址
执行以下shell命令:复制指定头文件到目标目录:
sudo cp path CUDA_include/cudnn.h (此处有空格) /usr/local CUDA_include
执行以下shell命令:-a参数下的复制操作:
sudo cp -a path CUDA_lib64/libcudnn* (此处有空格) /usr/local CUDA_lib64

成功实现了安装过程。
可以通过检查cuDNN版本来确认其正确性。
查看cudnn版本

安装Anaconda3-4.2.0

为了安装tensorflow-gpu而需先安裝 Anaconda3#滑稽
在准备安装tensorflow-gpu之前,请先安裝 Anaconda3#滑稽
官方下载地址:https://repo.anaconda.com/archive/Anaconda3-4.2.0-Linux-x86_64.sh
官方下载页面如下:https://repo.anaconda.com/archive/

在下载完成后打开终端窗口进行操作

回车键查看内容,请确认您接受许可条款?[yes|no] 输入y 然后询问软件安装路径 可自定义设置 我是默认设置 然后询问是否需要配置环境变量 输入y 除非你想再多操作一会儿 就完成!软件已成功安装。

可以通过关闭终端, 再打开终端, 输入python来验证是否安装成功

在这里插入图片描述

一旦显示 Anaconda 版本号为4.2.0,则表示安装已顺利完成;然而,在完成 Anaconda 的安装过程后需要注意的一点是其内置了一个 Python 环境;当我们在终端输入 python 后发现其提示信息为 Anaconda 时便意识到存在这一问题;此外,在完成 Anaconda 的安装后还会预装了一个名为 pip 的工具;这就是为什么在后续使用 pip 安装 TensorFlow 时会遇到找不到包的问题

安装tensorflow-gpu 1.4.0

理解了上面的注意事项之后, 安装tensorflow就变得简单起来。
打开终端

pip -V
pip3 -V
pip2 -V

在这里插入图片描述

在当前环境中 pip 和 pip3 实际上是同一工具,在某些情况下可能会出现混淆或冲突的情况。但此前尝试使用 pip3 安装时却因缺少必要的库文件而无法成功完成安装过程。这可能与最近更新或环境变量配置有关。因此需要检查位于 anaconda3 目录下的 pip 工具包是否存在异常情况。发现所有尝试的版本均来自系统默认安装路径,请注意可能涉及 Anaconda 的配置问题。然后进入 anaconda 的 root 目录 查看相关工具的位置:cd anaconda3/bin 查看与 Anaconda 相关的 pip 版本位置 ls 列出所有与 Anaconda 相关的 pip 包的位置 确认是否有特殊配置影响到安装流程:运行命令 'python -c "import platform; print(platform.python_version())"' 查看当前 Python 版本信息以及 Anaconda 的 root 目录是否存在特殊设置影响到工具路径的选择:运行命令 'ls /usr/lib/python2.7/dist-packages/Anacondainfo.py' 检查是否有未加载或损坏的 Python 包文件存在干扰因素:运行命令 'python -c "import sys; import platform; print(sys.version_info), print(platform.architecture())"' 查看系统的具体信息是否存在其他软件或服务会影响当前环境中的工具路径配置:建议重启系统后重新进行测试步骤

在这里插入图片描述

如果遇到显示Anaconda向下滚动的情况,则请参考Ubuntu中多版本anaconda与Python的pip管理来配置pip

执行以下命令进行安装:
sudo pip3 install tensorflow-gpu==1.4.0
安装完成后请稍候片刻即可

最终确认安装完成

在这里插入图片描述

通常情况下这里应该是完整顺利运行的状态

全部评论 (0)

还没有任何评论哟~