在CentOS上使用PyTorch进行机器学习的步骤如下:
1. 系统准备
确保系统已更新并安装基本开发工具:
sudo yum update -y
sudo yum groupinstall "Development Tools" -y
sudo yum install epel-release -y # 启用EPEL仓库
sudo yum install openssl-devel bzip2-devel libffi-devel -y
2. 安装Python环境(推荐Miniconda)
CentOS自带的Python版本较旧,建议通过Miniconda管理环境:
# 下载Miniconda安装脚本(以Python 3.9为例)
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 运行安装
bash Miniconda3-latest-Linux-x86_64.sh
# 按提示操作,完成后激活环境
source ~/.bashrc
3. 创建并激活虚拟环境
conda create -n pytorch_env python=3.9
conda activate pytorch_env
4. 安装PyTorch
根据硬件选择安装命令(从PyTorch官网获取命令):
-
CPU版本:
conda install pytorch torchvision torchaudio cpuonly -c pytorch
或使用pip:
pip install torch torchvision torchaudio
-
GPU版本(需NVIDIA驱动和CUDA):
- 确认已安装NVIDIA驱动和CUDA Toolkit:
nvidia-smi # 查看驱动和CUDA版本
- 根据CUDA版本选择PyTorch安装命令(例如CUDA 11.7):
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
- 确认已安装NVIDIA驱动和CUDA Toolkit:
5. 验证安装
运行Python并检查:
import torch
print(torch.__version__) # 查看PyTorch版本
print(torch.cuda.is_available()) # 输出True表示GPU可用
6. 示例代码测试
创建一个简单的张量并运行:
import torch
# 创建CPU张量
x = torch.tensor([1.0, 2.0])
y = torch.tensor([3.0, 4.0])
print(x + y)
# 若使用GPU
if torch.cuda.is_available():
device = torch.device("cuda")
x_gpu = x.to(device)
y_gpu = y.to(device)
print(x_gpu + y_gpu)
7. 安装其他依赖库
pip install numpy matplotlib pandas scikit-learn
常见问题解决
- CUDA不可用:
- 检查NVIDIA驱动:
nvidia-smi
- 确保PyTorch版本与CUDA版本匹配。
- 检查NVIDIA驱动:
- 安装速度慢:
- 更换pip源:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
- Conda换源:修改
~/.condarc
文件为清华或中科大源。
- 更换pip源:
通过以上步骤,你已成功在CentOS上配置了PyTorch环境,可以开始进行机器学习模型开发了!