news 2026/4/23 9:37:31

极简LLM入门指南2

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
极简LLM入门指南2

环境搭建指南

要开发LLM应用,首先需要选择合适的开发环境。选择取决于你的资源、预算和项目需求。下面介绍三种常见方案。

方案选择

Google Colab是最低成本的选择,免费提供GPU资源,适合学习和测试。缺点是会话有时间限制,容易断连。

云GPU服务(如AutoDL、AWS)提供按需计费的GPU资源,适合需要持续运行但不想购买硬件的项目。成本在50-500美元/月之间。

本地GPU部署需要一次性硬件投入,但提供最大的灵活性和长期的成本优势。适合要长期开发或有特殊硬件需求的情况。

方案成本配置复杂度适用场景
Google Colab$0-49/月很简单学习和测试
云GPU服务$50-500/月中等短期项目
本地GPU初期$2000左右,后续电费复杂长期开发

Google Colab

Colab是最快入门的方式。只需要一个Google账户。

快速开始

  1. 打开 colab.research.google.com
  2. 新建笔记本
  3. 运行以下代码:
# 检查GPU!nvidia-smi# 安装依赖!pip install transformers torch accelerate# 测试fromtransformersimportpipeline pipe=pipeline("text-generation",model="gpt2")print(pipe("Hello")[0]['generated_text'])

保持Colab连接

Colab可能在你不活跃时断开连接。下面的代码可以定期点击保持活跃按钮:

# 防止断连importIPython IPython.display.Javascript(''' function KeepClicking(){ console.log("Keeping alive..."); document.querySelector("colab-connect-button").click() } setInterval(KeepClicking, 60000) ''')

云GPU服务

如果你需要更稳定的GPU资源,可以使用云GPU服务。国内有AutoDL,国外有AWS和其他供应商。

AutoDL(国内)

# 1. 注册 autodl.com# 2. 创建实例(RTX 4090, ¥2.8/小时)# 3. SSH连接sshroot@[实例IP]-p[端口]# 4. 一键配置conda create -n llmpython=3.10-y conda activate llm pipinstalltorch transformers accelerate

AWS/阿里云

# AWS (p3.2xlarge, $3/小时)aws ec2 run-instances\--image-id ami-0abcdef1234567890\--instance-type p3.2xlarge\--key-name MyKeyPair# 阿里云 (ecs.gn7i, ¥15/小时)aliyun ecs CreateInstance\--InstanceType ecs.gn7i-c8g1.2xlarge

本地GPU部署

本地部署给你最大的灵活性,但需要投入硬件和配置时间。下面介绍Windows、Linux和MacOS的配置方式。

Windows (WSL2)

# 1. 安装WSL2wsl--install Ubuntu-22.04 wsl--set-default-version 2# 2. 安装NVIDIA驱动(Windows侧)# 下载: nvidia.com/drivers# 3. WSL2内部配置wsl
# WSL2内部# 安装CUDAwgethttps://developer.download.nvidia.com/compute/cuda/12.3/local_installers/cuda_12.3_linux.runsudoshcuda_12.3_linux.run --toolkit --silent# 安装Python环境conda create -n llmpython=3.10conda activate llm pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121# 验证python -c"import torch; print(torch.cuda.is_available())"

Ubuntu/Linux

#!/bin/bash# setup.sh - 一键安装脚本# 1. 更新系统sudoaptupdate&&sudoaptupgrade -y# 2. 安装NVIDIA驱动sudoaptinstallnvidia-driver-535 -y# 3. 安装CUDAwgethttps://developer.download.nvidia.com/compute/cuda/12.3/local_installers/cuda-repo-ubuntu2204-12-3-local_12.3.0-535.104.05-1_amd64.debsudodpkg -i cuda-repo-*.debsudoaptupdatesudoaptinstallcuda-toolkit-12-3 -y# 4. 配置环境变量echo'export PATH=/usr/local/cuda/bin:$PATH'>>~/.bashrcecho'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH'>>~/.bashrcsource~/.bashrc# 5. 安装Python包pipinstalltorch transformers accelerate bitsandbytes# 6. 验证nvidia-smi python -c"import torch; print(f'CUDA: {torch.cuda.is_available()}')"

MacOS (Apple Silicon)

# 1. 安装Homebrew/bin/bash -c"$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"# 2. 安装Pythonbrewinstallpython@3.10# 3. 安装PyTorch (Metal支持)pip3install--pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu# 4. 安装mlx (Apple优化)pip3installmlx# 5. 验证python3 -c"import torch; print(torch.backends.mps.is_available())"

本地模型运行工具:Ollama

Ollama可以在任何系统上简便地运行开源模型,无需复杂的配置。

安装

# Linux/WSLcurl-fsSL https://ollama.ai/install.sh|sh# MacOSbrewinstallollama# Windows# 下载: ollama.ai/download/windows

基本使用

# 启动服务ollama serve# 下载模型ollama pull llama3# 8B模型,需16GB内存ollama pull qwen2.5:7b# 7B模型,需14GB内存ollama pull phi3:mini# 3B模型,需6GB内存# 测试ollama run llama3"Hello"

Python API调用

importrequests response=requests.post('http://localhost:11434/api/generate',json={"model":"llama3","prompt":"What is machine learning?","stream":False})print(response.json()['response'])

Docker容器化部署

如果你倾向于使用Docker,可以通过Docker Compose快速启动包含Jupyter和Ollama的完整环境:

# docker-compose.ymlversion:'3.8'services:jupyter:image:pytorch/pytorch:2.1.0-cuda12.1-cudnn8-runtimeports:-"8888:8888"volumes:-./workspace:/workspacedeploy:resources:reservations:devices:-driver:nvidiacount:1capabilities:[gpu]command:>bash -c "pip install jupyterlab transformers accelerate && jupyter lab --ip=0.0.0.0 --allow-root --NotebookApp.token=''"ollama:image:ollama/ollamaports:-"11434:11434"volumes:-./ollama:/root/.ollamadeploy:resources:reservations:devices:-driver:nvidiacount:1capabilities:[gpu]
# 启动docker-compose up -d# 访问# Jupyter: http://localhost:8888# Ollama: http://localhost:11434

验证环境

安装完成后,应该验证环境是否正确配置。这个脚本会检查关键的依赖和硬件设置:

# test_env.pyimportsysimporttorchimporttransformersdeftest_environment():print("="*50)print("LLM环境检测")print("="*50)# Python版本print(f"Python:{sys.version}")# PyTorchprint(f"PyTorch:{torch.__version__}")print(f"CUDA可用:{torch.cuda.is_available()}")iftorch.cuda.is_available():print(f"GPU设备:{torch.cuda.get_device_name(0)}")print(f"GPU数量:{torch.cuda.device_count()}")print(f"CUDA版本:{torch.version.cuda}")# Transformersprint(f"Transformers:{transformers.__version__}")# 简单推理测试try:fromtransformersimportpipeline pipe=pipeline("text-generation",model="gpt2",device=0iftorch.cuda.is_available()else-1)result=pipe("Test",max_length=20)print(f"推理测试: ✓ 成功")exceptExceptionase:print(f"推理测试: ✗ 失败 -{e}")print("="*50)if__name__=="__main__":test_environment()

常见问题解决

问题解决方案
CUDA不可用检查GPU驱动是否安装。需要重新安装PyTorch的CUDA版本
内存不足使用更小的模型或启用量化(4-bit或8-bit)
模块导入失败运行pip install [缺失的包名]
GPU利用率低检查nvidia-smi是否检测到GPU,可能在使用CPU
WSL2检测不到GPU确保Windows驱动已更新,WSL2内核也需要更新
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 13:17:11

极简LLM入门指南3

构建智能对话机器人 本文会讲解如何从零开始构建一个LLM对话应用。首先需要完成第02篇的环境搭建,并掌握基本的Python语法。如果使用OpenAI API,需要有API密钥;如果使用本地模型,可以通过Ollama运行。 我们要构建的应用包括基础对…

作者头像 李华
网站建设 2026/4/14 17:42:49

ESP32嵌入式开发遇上AI:Seed-Coder-8B-Base赋能C语言智能补全

ESP32嵌入式开发遇上AI:Seed-Coder-8B-Base赋能C语言智能补全 在物联网设备爆发式增长的今天,一个开发者可能上午还在调试温湿度传感器的I2C通信,下午就得处理Wi-Fi连接超时问题。ESP32这类高集成度芯片虽强大,但其复杂的SDK和底层…

作者头像 李华
网站建设 2026/4/19 15:34:56

2025.12.15总结

工作日精进:今天跟另一个组的同事聊了下最近的工作情况,发现他所在组的工作强度跟自己不是同一个量级的。我平时晚上9点或十点离开,特殊情况也有干到十一二点的情况,周末偶尔加个班。他倒好,听说最晚有干到晚上两点左右…

作者头像 李华
网站建设 2026/4/20 23:46:54

OpenCore Legacy Patcher实战指南:解锁老Mac的终极潜能

当苹果宣布不再为你的Mac提供系统更新时,那种被时代抛弃的感觉让人沮丧。但技术探索者们从未停止寻找解决方案,OpenCore Legacy Patcher就是我们手中的魔法钥匙。这不仅仅是一个工具,更是一场硬件复兴的技术冒险。 【免费下载链接】OpenCore-…

作者头像 李华
网站建设 2026/4/17 6:08:54

28、时态数据库概念与月历构建

时态数据库概念与月历构建 1. 时态表原理 时态表的原理基于为每个对象保留多个状态的能力,这些状态由有效时间框架界定。通常,不属于元组标识符的常见属性(即使是有时间限制的属性)一般无法满足这一要求,因为它们通常只会生成常规表。要获得更复杂的见解,需考虑是否能为…

作者头像 李华
网站建设 2026/4/21 23:53:35

零基础入门:免费3D建模神器Meshroom终极指南

零基础入门:免费3D建模神器Meshroom终极指南 【免费下载链接】Meshroom 3D Reconstruction Software 项目地址: https://gitcode.com/gh_mirrors/me/Meshroom 还在为复杂的3D建模软件头疼吗?想知道如何用普通照片快速创建专业级三维模型吗&#x…

作者头像 李华