如何在CentOS上利用PyTorch进行机器学习

寒兮

2025-05-06 20

在CentOS上使用PyTorch进行机器学习的步骤如下：

1. 系统准备

确保系统已更新并安装基本开发工具：

sudo yum update -y
sudo yum groupinstall "Development Tools" -y
sudo yum install epel-release -y  # 启用EPEL仓库
sudo yum install openssl-devel bzip2-devel libffi-devel -y

2. 安装Python环境（推荐Miniconda）

CentOS自带的Python版本较旧，建议通过Miniconda管理环境：

# 下载Miniconda安装脚本（以Python 3.9为例）
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 运行安装
bash Miniconda3-latest-Linux-x86_64.sh
# 按提示操作，完成后激活环境
source ~/.bashrc

3. 创建并激活虚拟环境

conda create -n pytorch_env python=3.9
conda activate pytorch_env

4. 安装PyTorch

根据硬件选择安装命令（从PyTorch官网获取命令）：

CPU版本：

conda install pytorch torchvision torchaudio cpuonly -c pytorch

或使用pip：

pip install torch torchvision torchaudio

GPU版本（需NVIDIA驱动和CUDA）：
1. 确认已安装NVIDIA驱动和CUDA Toolkit：
```
nvidia-smi  # 查看驱动和CUDA版本
```
2. 根据CUDA版本选择PyTorch安装命令（例如CUDA 11.7）：
```
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
```

5. 验证安装

运行Python并检查：

import torch
print(torch.__version__)          # 查看PyTorch版本
print(torch.cuda.is_available())  # 输出True表示GPU可用

6. 示例代码测试

创建一个简单的张量并运行：

import torch

# 创建CPU张量
x = torch.tensor([1.0, 2.0])
y = torch.tensor([3.0, 4.0])
print(x + y)

# 若使用GPU
if torch.cuda.is_available():
    device = torch.device("cuda")
    x_gpu = x.to(device)
    y_gpu = y.to(device)
    print(x_gpu + y_gpu)

7. 安装其他依赖库

pip install numpy matplotlib pandas scikit-learn

常见问题解决

CUDA不可用：
- 检查NVIDIA驱动：nvidia-smi
- 确保PyTorch版本与CUDA版本匹配。
安装速度慢：
- 更换pip源：pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
- Conda换源：修改~/.condarc文件为清华或中科大源。