torch.cuda.OutOfMemoryError- CUDA out of memory.-香港服务器租用

torch.cuda.OutOfMemoryError- CUDA out of memory.

发布时间：2024-02-28 10:58:47 分类：帮助文档

torch.cuda.OutOfMemoryError: CUDA out of memory.

训练清华ChatGLM-6B时报错, 原因是显存不够

torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 96.00 MiB (GPU 0; 23.70 GiB total capacity; 4.37 GiB already allocated; 64.81 MiB free; 4.37 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

尝试将
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
改为
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()
仍然报错

RuntimeError: CUBLAS error: CUBLAS_STATUS_NOT_INITIALIZED

排错流程如下
查看服务器显存占用情况
watch -n 0.1 nvidia-smi

发现gpu:0显存被PID:19409程序大量占用, 报错应该是默认在gpu:0训练导致显存不足, 接着查看gpu:0上程序所属用户(如果不是师兄的我就kill了)
top

一看是root的, 惹不起还躲不起嘛, 换张卡跑, 顺嘴一提, 权限内的程序可以kill -9 {pid}掉释放显存
kill -9 19409
发现gpu:1空闲, 指定gpu:1上训练模型, 有多种方法,
(1) 可以在py代码开头（一定要在开头）加
import os
os.environ['CUDA_VISIBLE_DEVICES']='1'
这样即可指定在gpu:1上训练, 实际上是只设置gpu:1可见, 而屏蔽其他gpu卡
(2) 可以在代码运行前shell或bash脚本中加
CUDA_VISIBLE_DEVICES=1 python xxx.py
这样即可指定在gpu:1上训练, 实际上是只设置gpu:1可见, 而屏蔽其他gpu卡
(3)在程序中使用set_device()
import torch
torch.cuda.set_device(id)

设置完成后查看显存占用情况可以看到, gpu:1显存占用马上上升了, 不影响其他gpu卡的显存
可以看到清华的ChatGLM-6B约占12G显存(其他卡显存增加是写文章的时候其他小伙伴在跑)

上一篇台湾服务器选择

下一篇 vps空间是什么意思

2024年基于阿里云搭建幻兽帕鲁服务器教程 Linux----tr命令详细使用方法双网卡设置一个外网一个内网（两张网卡同时上内外网设置） OpenSSL自签发证书并实现浏览器的安全访问腾讯云debian服务器的连接与初始化 ip被墙了怎么办 docker-compose构建Gerrit代码审计功能,搭建代码服务器【计算机网络】DHCP原理与配置【Linux】动静态库

香港云服务器租用推荐

服务器租用资讯: ·主机测评：如何选择最合适的主机服务; ·中文域名的ping操作详解，推荐2025年使用最新工具进行解析; ·只有域名怎么备案，如何在没有服务器的情况下完成备案呢？只需向服务商提交信息就能开启备案流程。; ·怎么转发网址：哪里有教你如何操作网址转发的方法？; ·怎么选择php版本：最全面的PHP版本选择指南与实用建议; ·怎么申请com域名？只需了解关键步骤，让你轻松注册理想域名。; ·怎么购买IP地址？购买IP地址的步骤与注意事项详解及推荐的服务提供商介绍; ·怎么防御流量攻击：哪里有有效的应对策略？; ·怎么查域名dns：如何获取和解析DNS记录

服务器租用推荐: ·美国服务器租用; ·台湾服务器租用; ·香港云服务器租用; ·香港裸金属服务器; ·香港高防服务器租用; ·香港服务器租用特价