这是本文档旧的修订版！

Tensorflow-GPU安装过程

创建日期星期三 01 五月 2019

注意：Linux系统默认安装、加载的是开源显卡驱动-nouveau

查看计算机的显卡是否支持CUDA套件。

去NVIDIA官网上下载CUDA9.2 run(local)文件。

安装CUDA9.2（此过程中同时安装NVIDIA显卡驱动程序）。

1. 开机时对启动选项进行修改：按 “e” linux一行添加 nouveau.modeset=0 init 3（不使用nouveau开源显卡驱动，进入完全多用户模式）

2. 进入终端模式，lsmod 会提示已经加载nouveau驱动，再rmmod nouveau进行卸载

3. 使用sudo ./cuda_9.2_linux.run –no-opengl-libs命令安装cuda(安装完成后，可以使用nvidia-smi进行nvidia显卡驱动的测试)

注意：如果nvidia-smi 提示：NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA drivMake sure that the latest NVIDIA driver is installed and running.这是因为NVIDIA驱动没有被加载使用。

4.将新安装的cuda-9.2可执行文件、库路径加入系统变量和库路径中；（nvcc -V`命令检验CUDA套件是否安装正确）。

5.下载适用于CUDA9.2版本的cuDNN，并解压，将相关文件复制到对应的CUDA安装目录下。

6.重启系统，操作系统会重新加载nouveau驱动程序，类似第一步添加nouveau.modeset=0，操作系统则会记载、使用NVIDIA显卡驱动，此时nvidia-smi 正常显示出显卡的信息；

- 安装Tensorflow-gpu

从源码编译

- 安装Bzeal编译工具：先下载bazel可执行脚本（本文中使用的文件名是bazel-0.15.0-installer-linux-x86_64.sh)。然后在可执行脚本文件目录下用 `./bazel-0.15.0-installer-linux-x8664.sh –user`命令进行安装。

- 下载tensorflow源文件，进入源文件目录。

- 执行`./configure`命令，按需求进行配置。

- 执行```bazel build –jobs=4 –config=opt tensorflow/tools/pip_package:build_pip_package```命令编译pip包，其中的`–job`选项会限制bazel编译时的任务数，一般不需要指明该选项，bazel会调用计算机的所有资源进行编译。但是计算量很大，容易导致死机，所以可以添加上任务数的限制来防止这种情况。注意：编译过程中可能会提示编译错误，编译停止。忽略错误，重新继续编译。（错误一般是编译器内部错误、电脑卡死，这一般是内存不够导致的，linux添加swapfile可以有效解决；某个文件未被创建、有价值，多线程编译使得相互依赖的编译结果不同步生成导致这个错误） - 执行`bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg`命令在/tmp/tensorflow_pkg目录下生成whl python安装包，最后执行`pip3 install XXX.whl`命令完成安装即可。 Reference:http://www.python36.com/how-to-install-tensorflow-gpu-with-cuda-9-2-for-python-on-ubuntu/ 使用conda安装(!!!不适用!!!) conda install tensorflow-gpu 创建python 3.6 环境 conda create -n tf python=3.6 conda activate tf 再进行安装就没有问题了 conda install tensorflow-gpu tensorflow还不支持python3.7(2018-01) conda create -n python=3.6 conda install –use-local your-pkg-name

Knowledge Base

用户工具

站点工具

Tensorflow-GPU安装过程

页面工具