WIN10下安装tensorflow-gpu+cuda10.0+cudnn
在WIN10下安装tensorflow-gpu+cuda10.0+cudnn
- 前提
-
- cuda10.0
- cudnn 7.4
- tensorflow-gpu1.13.1
- 总结
前提
年初初次在学习 tensorflow 相关内容时曾安装过一次 tensorflow-GPU,在那个阶段采用了 CUDA 9.0 和 TensorFlow-GPU 1.9 的组合进行测试。然而,在随后多次尝试中发现更高版本的安装会遇到各种错误,在反复测试多个版本后终于顺利完成配置。目前更换了新电脑后重新进行了 TensorFlow 的安装工作。
本文详细描述了 TensorFlow-GPU 1.13、CUDA 10.0 以及 cudnn 集成的具体操作流程和注意事项。值得注意的是 Python 环境的管理方式不影响本教程的应用,并且需要注意的是 Anaconda 自身版本中的 NumPy 可能会引发警告信息。本文使用的 Python 版本为 Python 3.6。
cuda10.0
NVIDIA 开发的 CUDA(Compute Unified Device Architecture)是一个专门用于高性能计算的运算平台。
新版 CUDA 10.1 已经于年初由官网发布,并且同时 TensorFlow GPU 版本 1.14 也已发布。
无论你选择哪个 CUDA 版本...与之不兼容,则建议降级至较低版本号。
cuda下载链接

选择local的下载小于2GB的内容,默认情况下其下载速度表现良好。在完成安装程序后会自动检测并补充未安装的应用软件(这一过程会持续进行)。某些组件在安装后可选性删除以释放不必要的资源占用。默认设置将系统目录配置为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0,并提供相应的环境变量支持

当前需要我们手动添加路径:
位于C:\Program Files\NVIDIA GPU ComputingToolkit\CUDA\v10.0\bin、C:\Program Files\NVIDIA GPU ComputingToolkit\CUDA\v10.0\lib\x64以及C:\Program Files\NVIDIA GPU ComputingToolkit\CUDA\v10.0\include中。通过命令行nvcc -V检查安装版本后即可完成安装。

cudnn 7.4
NVIDIA cuDNN是一个专为深度神经网络设计的GPU加速库。 [访问cudnn下载页面时需注册账号] 下载前请确保版本兼容性,并将下载文件中的内容复制至CUDA库根目录(如上所述)。
tensorflow-gpu1.13.1
通过pip工具即可实现任务目标。值得注意的是,在默认情况下,默认会选择CPU版本运行程序。当同时安装CPU和GPU版本时,默认会选择CPU版本运行程序。以下是查看日志中设备信息的具体代码:
import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
实验证明,在仅采用GPU加速的环境下(尤其是基于TensorFlow-GPU 1.12及以下的版本),即使出现配置失误也会导致无法正常运行的现象;在遇到DLL加载失败的错误时(尤其是基于TensorFlow-GPU 1.13及以上的默认CPU模式下),其根本原因在于软件 versions之间的不兼容性;从TensorFlow-GPU 1.13开始,默认切换至CPU模式进行处理,并通常会导致系统调用cuInit时出现问题并返回CUDA_ERROR_UNKNOWN的状态码;除了CUDNN本身的兼容性问题外(例如高阶版CUDNN如7.x系列),另一个潜在的原因是显卡驱动程序未能及时更新到最新版本;对于高阶版CUDNN(例如7.x系列),必须确保硬件支持最新的显卡驱动方能顺利运行。
总结
- 三者版本匹配至关重要,在现有条件下无法与当前版 tensorflow-gpu 完成兼容性测试。建议采用先前的稳定版进行配置以避免潜在问题。
- 在安装过程中需注意以下几点:第一,在安装完成后需先卸载原有的 cpu 版本;第二,请确保显卡驱动程序已更新至最新版本;第三,在测试过程中如发现设备存在老旧特性(例如:如果是老旧型号),则建议尝试较低版本号的软件组合以获得更好的兼容性表现。
