Win10安装TensorFlow-gpu版本,超详细步骤
必要条件:您必须拥有独立显卡配置,并且计算性能在3.0以上(建议最好达到3.5以上)。为了成功安装TensorFlow-GPU版本,请确保完成以下所有准备工作:首先下载并安装CUDA toolkit及其驱动程序;其次下载cuDNN库并按照指导进行编译;最后检查硬件兼容性以确保一切就绪。只有满足这些条件后,请开始进行软件安装步骤。
确认步骤:
- 下载并安装CUDA toolkit及其驱动程序
- 下载cuDNN库并按照指导进行编译
- 检查硬件兼容性
- 开始软件安装步骤
评估当前使用的显卡及其计算性能水平。
确定与当前显卡兼容的CUDA软件库版本。
获取与选定的CUDA框架相匹配的cuDNN库的具体实现版本。
基于已知的CUDA框架版本及其相应的cuDNN组件信息,确定适合当前硬件配置的TensorFlow-GPU兼容 versions.
我们一步一步来:
1.查看显卡属性及计算能力
在计算机桌面应用中打开"此电脑"选项,在其属性对话框中找到"设备管理器"设置项。
进入系统设置后依次选择"设备管理器"选项卡,在相关参数列表中查看硬件配置信息。
首先定位至"设备管理器"界面,在其适配器展示模块中执行显示操作。
以Intel开头的产品通常配置有集成显卡。
通常以AMD或NVIDIA开头的产品配备独立显卡。

查看计算能力:官方链接

具备3.0及以上运算能力的情况下,默认建议您优先考虑采用TensorFlow-GPU版本。如果不满足要求,则需要考虑更换硬件配置或升级电脑配置以提升整体性能。
2.查看显卡驱动对应的CUDA版本并且下载安装
该CUDA版本不能随意决定。需要根据你的显卡驱动支持哪一个CUDA版本的运算。可以通过以下步骤查找显卡驱动版本:进入控制面板->搜索‘NVIDIA’->点击NVIDIA控制面板

帮助->系统信息


请再次访问这个驱动对应的CUDA版本:官方链接

根据这个信息你可以识别出下载哪个CUDA版本的最佳选择

下一步是获取该资源

选择你的版本,进入下载页面,选择你的操作系统等等,然后Download。

安装程序走完下一步步骤即可完成任务。需要特别注意的是,在操作过程中可能会遇到类似360或其他软件提示,请确认是否允许修改。建议在命令行界面运行以下命令以验证安装结果:nvcc -V

如果出问题,看看环境变量是否有CUDA的路径,没有的话手动加上:


3.安装cuDNN
官方链接:https://developer.nvidia.com/rdp/cudnn-download。请访问该地址后,在导航菜单中找到并点击"注册"按钮即可创建新账户。根据您的需求选择相应的版本信息,并按照屏幕提示完成安装步骤即可完成安装过程

打开压缩包,分别把bin, include和lib覆盖到你的CUDA的安装路径下:

然后,在环境变量path中,添加一项:

4.安装TensorFlow-gpu版本
首先,请您定位您的CUDA和cuDNN设备与对应的TensorFlow-gpu版本。请确认您使用的CUDA和cuDNN设备与TensorFlow-gpu版本是否匹配。官方链接

安装比较简单;当需要安装TensorFlow-gpu的最新版本时,请完成以下操作:
pip install tensorflow-gpu
如果需要安装旧版本,指定版本号就好了:
pip install tensorflow-gpu==1.14.0
在当前环境下安装过程耗时较长,在线获取完整文档请访问:https://mp.weixin.qq.com/s/6q7AoNj5ZgqgZvQhZvOzIw
pip install tensorflow-gpu==1.14.0 -i https://pypi.tuna.tsinghua.edu.cn/simple/
如果你仍然觉得运行速度不够快,在上述命令完成后, 系统应该会提示提供tensorflow-1.15.0-cp35-cp35m-win_amd64.whl安装包的 download 地址, 请直接通过迅雷启动 download 流程。完成 download 后, 请进入该 package 所属 directory 结构下进行下一步操作
pip install tensorflow-1.15.0-cp35-cp35m-win_amd64.whl
同样地,在这个安装过程中也会非常漫长,在其中还包括了10多个相关包的下载。在中间过程中有时可能会因超时而导致操作中断没关系, 重新执行命令会继续进行安装。当最终显示Successfully installed XXXX时就算完成了整个过程。随后, 我们将验证GPU加速是否已成功启用
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
出现红框里面的内容,就说明启动了GPU加速。

可能会出现的错误:
比如
Could not load dynamic library 'cudart64_100.dll'; dlerror: cudart64_100.dll not found
Could not load dynamic library 'cublas64_100.dll'; dlerror: cublas64_100.dll not found
Could not load dynamic library 'cufft64_100.dll'; dlerror: cufft64_100.dll not found
Could not load dynamic library 'curand64_100.dll'; dlerror: curand64_100.dll not found
Could not load dynamic library 'cusolver64_100.dll'; dlerror: cusolver64_100.dll not found
Could not load dynamic library 'cusparse64_100.dll'; dlerror: cusparse64_100.dll not found
假设你安装的是CUDA 10.2版本软件包,则对应的DLL文件名称为102号。
在\NVIDIA GPU Computing Toolkit中的CUDA目录中搜索cudart64程序库时,默认会找到一个名为"cudart64_102.dll"的关键文件。
为了配合软件更新需求,请将该文件重命名为"cudart64_103.dll"。
类似地, cublas64_7.dll修改为"cublas758839899785539899758839899758839899758839899758839"的方法也适用于其他类似的程序库。
例如,在这种情况下,“CUDA driver version is insufficient for CUDA runtime version”,这是一个典型的_CUDA驱动版本无法满足CUDA运行版本的情况。请参考本文的第一、第二章内容,并重新审视相关部分以确保正确性。
以上。
