用户工具

站点工具


tensorflow-gpu安装过程

这是本文档旧的修订版!


Tensorflow-GPU安装过程

创建日期 星期三 01 五月 2019

注意:Linux系统默认安装、加载的是开源显卡驱动-nouveau

查看计算机的显卡是否支持CUDA套件。 
去NVIDIA官网上下载CUDA9.2 run(local)文件。 
安装CUDA9.2(此过程中同时安装NVIDIA显卡驱动程序)。 

1. 开机时对启动选项进行修改:按 “e” linux一行添加 nouveau.modeset=0 init 3(不使用nouveau开源显卡驱动,进入完全多用户模式)

2. 进入终端模式,lsmod 会提示已经加载nouveau驱动,再rmmod nouveau进行卸载

3. 使用sudo ./cuda_9.2_linux.run –no-opengl-libs命令安装cuda(安装完成后,可以使用nvidia-smi进行nvidia显卡驱动的测试)

注意:如果nvidia-smi 提示:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA drivMake sure that the latest NVIDIA driver is installed and running.这是因为NVIDIA驱动没有被加载使用。

4.将新安装的cuda-9.2可执行文件、库路径加入系统变量和库路径中;(nvcc -V`命令检验CUDA套件是否安装正确)。

5.下载适用于CUDA9.2版本的cuDNN,并解压,将相关文件复制到对应的CUDA安装目录下。

6.重启系统,操作系统会重新加载nouveau驱动程序,类似第一步添加nouveau.modeset=0,操作系统则会记载、使用NVIDIA显卡驱动,此时nvidia-smi 正常显示出显卡的信息;

- 安装Tensorflow-gpu


从源码编译

- 安装Bzeal编译工具:先下载bazel可执行脚本(本文中使用的文件名是bazel-0.15.0-installer-linux-x86_64.sh)。然后在可执行脚本文件目录下用 `./bazel-0.15.0-installer-linux-x8664.sh –user`命令进行安装。

- 下载tensorflow源文件,进入源文件目录。

- 执行`./configure`命令,按需求进行配置。

- 执行```bazel build –jobs=4 –config=opt tensorflow/tools/pip_package:build_pip_package```命令编译pip包,其中的`–job`选项会限制bazel编译时的任务数,一般不需要指明该选项,bazel会调用计算机的所有资源进行编译。但是计算量很大,容易导致死机,所以可以添加上任务数的限制来防止这种情况。 注意:编译过程中可能会提示编译错误,编译停止。忽略错误,重新继续编译。(错误一般是编译器内部错误、电脑卡死,这一般是内存不够导致的,linux添加swapfile可以有效解决;某个文件未被创建、有价值,多线程编译使得相互依赖的编译结果不同步生成导致这个错误) - 执行`bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg`命令在/tmp/tensorflow_pkg目录下生成whl python安装包,最后执行`pip3 install XXX.whl`命令完成安装即可。 Reference:http://www.python36.com/how-to-install-tensorflow-gpu-with-cuda-9-2-for-python-on-ubuntu/ 使用conda安装(!!!不适用!!!) conda install tensorflow-gpu 创建python 3.6 环境 conda create -n tf python=3.6 conda activate tf 再进行安装就没有问题了 conda install tensorflow-gpu tensorflow还不支持python3.7(2018-01) conda create -n python=3.6 conda install –use-local your-pkg-name

tensorflow-gpu安装过程.1561461397.txt.gz · 最后更改: 2020/02/01 21:40 (外部编辑)