一.tensorflow-gpu版本安装
- 写在前面:这里只介绍gpu版本的安装,且由于只支持N卡(英伟达显卡,AMD家的暂不支持),因此这里记录windows 10 环境下的安装
1.运行环境及准备工作
1)安装环境及支持:
- windows10(微软官网下载安装直接免费激活的,这里未作纯净版的安装因此不做讨论)
这里安装的是python3.7.6+tensorflow-gpu==1.14.0+VS201916.4(支持16.1)+CUDA10.1.168_425.25+cuDNN7.6.0.64
其中,CUDA不需要注册就能下载,cuDNN需要注册才能下载,这两部分的内容目前需要梯子才能下载
- 这是CUDA的官方VS及系统版本对照
- CUDA地址
- cuDNN地址
- 哪些N卡支持
- VS2019历史版本下载
- VS2017历史版本下载
- tensorflow-gpu==1.14下载
2)安装VS2019
安装包很小,只有1M多,安装时需要勾选Windows 10 SDK(这里我选择了新一点的版本),python不在这里安装,这里安装的是buildtools版本,专业及企业版需要收费
安装的时候在组件里单独勾选windows 10 SDK,2.8G左右
在导航栏最后一栏去掉勾选保留缓存
3)安装CUDA
- 这里选择自定义安装,由于是重装系统,未安装NVIDIA的experience面板,如果你之前安装了,可以不勾选,在CUDA这个大项中只去掉Visual Studio Intergration
这里带宽够的话安装挺快的,我这里是默认路径系统盘,未修改,安装完毕后可能会需要重启电脑。
这里注意下,CUDA选项的win10sdk不要勾选,因为在之前vs studio 已经安装过了。
4)复制cuDNN到CUDA
这里CUDA的默认路径是:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1
将cuDNN下bin中的文件复制到CUDA中的bin目录中去
将cuDNN下include中的文件复制到CUDA中的include目录中去
将cuDNN/lib/x64下文件复制到CUDA/v10.1/lib/x64中去
5)设置环境变量
- 打开环境变量面板,可以看到系统变量下多了两个关于CUDA的变量
在系统变量Path中添加:
%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%
再添加下面四条,这里是CUDA的默认路径:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin
这里要把隐藏文件勾选显示,不然ProgramData文件夹看不见
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\common\lib\x64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\bin\win64
在系统变量中添加(区别于在Path中添加)
变量 值 CUDA_SDK_PATH C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1 CUDA_LIB_PATH %CUDA_PATH%\lib\x64 CUDA_BIN_PATH %CUDA_PATH%\bin CUDA_SDK_BIN_PATH %CUDA_SDK_PATH%\bin\win64 CUDA_SDK_LIB_PATH %CUDA_SDK_PATH%\common\lib\x64 下面是最终加完的图,上面是Path变量中加的,下面是系统变量中家的
检验CUDA和cuDNN安装是否成功
cmd cd 到下面目录
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\demo_suite
输入
bandwidthTest.exe
和deviceQuery.exe
分别在结尾看到Result = PASS
说明安装成功
6)安装python3.7,并以此创建虚拟环境
pip install virtualenvwrapper-win
安装windows版的虚拟环境mkvirtualenv --python=python.exe执行器的路径 虚拟环境名称
新建虚拟环境可以指定运行的python版本如果只有一个python则不需要指定,直接定义虚拟环境名称即可
7)安装tensorflow-gpu==1.14.0
- 这里需要去上面给的地址下载编译过的tensorflow-gpu版本,官方下的是未经过编译的,自己编译则困难较大不推荐
这里安装完之后numpy版本是1.18.1,会出现以下警告
这是因为numpy版本过高,将numpy卸载并降低版本至1.16.1,亲测有效
- 这里还有一点需注意,安装到此位置需手动重启下,不然import tensorflow 会报错,无论更改版本什么的都没用
如果是安装tf2.2时出现
ImportError: DLL load failed: 找不到指定的模块
这样的 报错,大概率是缺少msvcp140_1.dll
这个类库
选择相应的64/x86即可
如果报
ImportError:无法从'tensorflow.python.keras.engine'导入名称'keras_tensor'
这样的错误,是因为TensorFlow,Python和tensorflow-addons之间存在不兼容问题,需要卸载tensorflow-addons并根据下表安装版本- 到这里,安装结束
二.tensorflow 在centos7上的安装
1)cpu版本安装注意事项
- 要加上 --no-cache-dir 例如
pip install --no-cache-dir tensorflow==2.2.0
不然可能会在下载完安装时报MemoryError
的错。 - 后面有的话再补充
三.windows 下装GPU版本的pytorch
1)下载地址
https://download.pytorch.org/whl/torch_stable.html
2)下载准备工作
与之前的tf环境准备一致
3)注意事项
- 先去官网查看要下载的pytorch版本,看准版本号,然后去下载地址下载对应的GPU版本
- 先安装torch再安装torchvision
测试成功与否代码
import torch torch.cuda.is_available()
显示为True 说明安装成功