news 2026/6/14 5:55:14

Meta-Llama-3.1-8B-bnb-4bit 下载加载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta-Llama-3.1-8B-bnb-4bit 下载加载

Meta-Llama-3.1-8B-bnb-4bit 加载:

from huggingface_hub import InferenceClient from torch import nn from transformers import ( AutoModel, AutoProcessor, AutoTokenizer, AutoModelForCausalLM, PreTrainedTokenizer, PreTrainedTokenizerFast, BitsAndBytesConfig, ) from pathlib import Path import torch from PIL import Image import os # =============================== # CLIP (SigLIP) # # =============================== # model_id = "google/siglip-so400m-patch14-384" # CLIP_PATH = download_hg_model(model_id, "clip") # clip_processor = AutoProcessor.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = AutoModel.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = clip_model.vision_model # clip_model.eval() # clip_model.requires_grad_(False) # clip_model.to("cuda") # =============================== # LLM (LLaMA 3.1 4bit) # =============================== MODEL_PATH = "/data/lbg/models/textoon/ComfyUI/models/LLM/Meta-Llama-3.1-8B-bnb-4bit" tokenizer = AutoTokenizer.from_pretrained( MODEL_PATH, trust_remote_code=True, use_fast=True ) assert isinstance( tokenizer, (PreTrainedTokenizer, PreTrainedTokenizerFast) ), f"Tokenizer is of type {type(tokenizer)}" # ⭐ 2️⃣ bitsandbytes 4bit 配置(关键) bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16, bnb_4bit_use_double_quant=True, ) # ⭐ 3️⃣ 正确加载 4bit 模型 text_model = AutoModelForCausalLM.from_pretrained( MODEL_PATH, quantization_config=bnb_config, device_map="auto", trust_remote_code=True, ) text_model.eval()
pip install bitsandbytes
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 14:17:11

自动化运维利器Ansible

前言 在如今的IT环境中,服务器数量越来越多,业务流程也越来越复杂。如果还靠手工登录每台服务器操作,不仅效率低,还容易出错。这时候,自动化运维工具就成了运维工程师的“救星”。 Ansible作为其中的佼佼者&#xff0c…

作者头像 李华
网站建设 2026/6/10 17:12:55

基于SpringBoot+Vue的台球厅管理系统(完整源码+万字论文+精品PPT)

这里写目录标题博主简介源码演示录像论文创作效果图【部分】开发框架以及工具介绍系统运行效果图资源可行性分析数据库表结构设计代码示例获取源码【支持定做】博主简介 👨‍💻 博主简介: 本人是CSDN特邀作者、博客专家、CSDN新星计划导师&a…

作者头像 李华
网站建设 2026/6/12 16:48:18

银河麒麟桌面操作系统USB存储设备禁用

【使用场景】 因为某些要求,需要禁用USB存储设备。 【操作步骤】 银河麒麟桌面操作系统上执行如下步骤: 步骤1.在/etc/modprobe.d/blacklist.conf文件里面最下面加入两行: blasklist uas blacklist usb_storage 步骤2.保存退出,运行update-initramfs -u 步骤3.重启系统。…

作者头像 李华
网站建设 2026/6/13 14:51:35

构建赋能增效的测试质量度量体系

为什么需要科学的测试质量度量? 在敏捷开发和DevOps普及的今天,软件测试已从单纯的缺陷发现转变为质量保障与风险管控的核心环节。然而,许多测试团队仍面临共性困境:测试价值难以量化、质量改进缺乏数据支撑、资源分配缺乏依据。…

作者头像 李华