用户工具

站点工具


tensorflow-gpu安装过程

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
后一修订版
前一修订版
tensorflow-gpu安装过程 [2019/06/25 19:06]
admin
tensorflow-gpu安装过程 [2020/02/01 21:41] (当前版本)
行 3: 行 3:
 创建日期 星期三 01 五月 2019 创建日期 星期三 01 五月 2019
  
-**注意:Linux系统默认安装、加载的是开源显卡驱动-nouveau** 
-- 查看计算机的显卡是否支持CUDA套件。 
---------------------- 
  
-- 去NVIDIA官网上下载CUDA9.2 run(local)文件。 +===== 1.安装CUDA和显卡驱动 ===== 
------------------------------------+---- 
 +注意:Linux系统默认安装、加载的是开源显卡驱动-nouveau 
 +==== a.查看计算机的显卡是否支持CUDA套件 ==== 
 + 
  
-安装CUDA9.2(此过程中同时安装NVIDIA显卡驱动程序) + 
-----------------------------------+==== b.去NVIDIA官网上下载CUDA9.2 run(local)文件 ==== 
 +  
 + 
 + 
 +==== c.安装CUDA9.2(同时安装NVIDIA显卡驱动程序) ​==== 
 +<​code>​
 1. 开机时对启动选项进行修改:按 "​e"​ linux一行添加 nouveau.modeset=0 init 3(不使用nouveau开源显卡驱动,进入完全多用户模式) 1. 开机时对启动选项进行修改:按 "​e"​ linux一行添加 nouveau.modeset=0 init 3(不使用nouveau开源显卡驱动,进入完全多用户模式)
 +
  
 2. 进入终端模式,lsmod 会提示已经加载nouveau驱动,再rmmod nouveau进行卸载 2. 进入终端模式,lsmod 会提示已经加载nouveau驱动,再rmmod nouveau进行卸载
  
-3. 使用sudo ./​cuda_9.2_linux.run --no-opengl-libs 命令安装cuda(安装完成后,可以使用nvidia-smi进行nvidia显卡驱动的测试)+ 
 +3. 使用''​sudo ./​cuda_9.2_linux.run --no-opengl-libs''​命令安装cuda(安装完成后,可以使用nvidia-smi进行nvidia显卡驱动的测试)
  
 注意:如果nvidia-smi 提示:NVIDIA-SMI has failed because it couldn'​t communicate with the NVIDIA drivMake sure that the latest NVIDIA driver is installed and running.这是因为NVIDIA驱动没有被加载使用。 注意:如果nvidia-smi 提示:NVIDIA-SMI has failed because it couldn'​t communicate with the NVIDIA drivMake sure that the latest NVIDIA driver is installed and running.这是因为NVIDIA驱动没有被加载使用。
  
-5.将新安装的cuda-9.2可执行文件、库路径加入系统变量和库路径中;(nvcc -V`命令检验CUDA套件是否安装正确)。 
  
-6.下载适用于CUDA9.2版本的cuDNN,并解压,将相关文件复制到对应的CUDA安装目录下。+4.将新安装的cuda-9.2可执行文件、库路径加入系统变量和库路径中;(`nvcc -V`命令检验CUDA套件是否安装正确)。 
 + 
 + 
 +5.下载适用于CUDA9.2版本的cuDNN,并解压,将相关文件复制到对应的CUDA安装目录下。 
  
-7.重启系统,操作系统会重新加载nouveau驱动程序,类似第一步添加nouveau.modeset=0,操作系统则会记载、使用NVIDIA显卡驱动,此时nvidia-smi 正常显示出显卡的信息;+6.重启系统,操作系统会重新加载nouveau驱动程序,类似第一步添加nouveau.modeset=0,操作系统则会记载、使用NVIDIA显卡驱动,此时nvidia-smi 正常显示出显卡的信息;
  
 +注意:安装CUDA显卡驱动时,会在/​etc/​modprobe.d/​目录下自动生成nvidia-installer-disable-nouveau.conf文件来禁用nouveau驱动程序。但有时会出现禁用后仍然加载nouveau驱动程序,此时使用```sudo update-initramfs -u```命令重新生成 kernel initramfs即可。
 +</​code>​
  
 +===== 2.安装Tensorflow-gpu =====
  
-- 安装Tensorflow-gpu 
 ------------------ ------------------
 +<​code>​
 +从源码编译
  
-### • 从源码编译\\ +安装Bzeal编译工具:先下载bazel可执行脚本(本文中使用的文件名是bazel-0.15.0-installer-linux-x86_64.sh)。然后在可执行脚本文件目录下用 `./​bazel-0.15.0-installer-linux-x8664.sh ​ --user`命令进行安装。
-安装Bzeal编译工具:先下载bazel可执行脚本(本文中使用的文件名是bazel-0.15.0-installer-linux-x86_64.sh)。然后在可执行脚本文件目录下用 `./​bazel-0.15.0-installer-linux-x8664.sh ​ --user`命令进行安装。+
  
-下载tensorflow源文件,进入源文件目录。+下载tensorflow源文件,进入源文件目录。
  
-执行`./​configure`命令,按需求进行配置。+执行`./​configure`命令,按需求进行配置。
  
-执行` bazel build --jobs=4 --config=opt //​tensorflow/​tools/​pip_package:​build_pip_package`命令编译pip包,其中的`--job`选项会限制bazel编译时的任务数,一般不需要指明该选项,bazel会调用计算机的所有资源进行编译。但是计算量很大,容易导致死机,所以可以添加上任务数的限制来防止这种情况。+执行```bazel build --jobs=4 --config=opt //​tensorflow/​tools/​pip_package:​build_pip_package```命令编译pip包,其中的`--job`选项会限制bazel编译时的任务数,一般不需要指明该选项,bazel会调用计算机的所有资源进行编译。但是计算量很大,容易导致死机,所以可以添加上任务数的限制来防止这种情况。
  
 注意:编译过程中可能会提示编译错误,编译停止。忽略错误,重新继续编译。(错误一般是编译器内部错误、电脑卡死,这一般是内存不够导致的,linux添加swapfile可以有效解决;某个文件未被创建、有价值,多线程编译使得相互依赖的编译结果不同步生成导致这个错误) 注意:编译过程中可能会提示编译错误,编译停止。忽略错误,重新继续编译。(错误一般是编译器内部错误、电脑卡死,这一般是内存不够导致的,linux添加swapfile可以有效解决;某个文件未被创建、有价值,多线程编译使得相互依赖的编译结果不同步生成导致这个错误)
  
-执行`bazel-bin/​tensorflow/​tools/​pip_package/​build_pip_package /​tmp/​tensorflow_pkg`命令在/​tmp/​tensorflow_pkg目录下生成whl python安装包,最后执行`pip3 install XXX.whl`命令完成安装即可。+执行`bazel-bin/​tensorflow/​tools/​pip_package/​build_pip_package /​tmp/​tensorflow_pkg`命令在/​tmp/​tensorflow_pkg目录下生成whl python安装包,最后执行`pip3 install XXX.whl`命令完成安装即可。
  
-##Reference:​http://​www.python36.com/​how-to-install-tensorflow-gpu-with-cuda-9-2-for-python-on-ubuntu/​+Reference:​http://​www.python36.com/​how-to-install-tensorflow-gpu-with-cuda-9-2-for-python-on-ubuntu/​
  
-### • 使用conda安装(!!!不适用!!!)+使用conda安装(!!!不适用!!!)
  
 conda install tensorflow-gpu conda install tensorflow-gpu
行 65: 行 78:
  
 conda install --use-local your-pkg-name conda install --use-local your-pkg-name
 +</​code>​
tensorflow-gpu安装过程.1561460819.txt.gz · 最后更改: 2020/02/01 21:40 (外部编辑)