news 2026/4/23 15:25:02

【vLLM 学习】Reproduciblity

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【vLLM 学习】Reproduciblity

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/reproduciblity.py

# SPDX-License-Identifier: Apache-2.0importos from vllmimportLLM, SamplingParams# 为了性能考虑,vllm 不能保证结果的默认情况下可重复性,# 您需要做以下事情才能实现# 可复现结果:# 1.关闭多处理以使计划确定性。# Note (Woosuk) :这是不需要的,对于 V0而言,这将被忽略。os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"]="0"# 2.修复五十年据种子以获得可重复性。默认种子为 None,不可复现。SEED=42# Note (Woosuk) :即使使用上述两个设置,vLLM 也仅提供# 当它在相同的硬件和相同的 vLLM 版本上运行时,它的可重复性。# 此外,在线服务 API ( "vLLM 服务") 不支持可重复性# 因为几乎不可能在在线服务设置。llm=LLM(model="facebook/opt-125m",seed=SEED)prompts=["Hello, my name is","The president of the United States is","The capital of France is","The future of AI is",]sampling_params=SamplingParams(temperature=0.8,top_p=0.95)outputs=llm.generate(prompts, sampling_params)foroutputinoutputs: prompt=output.prompt generated_text=output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 13:21:25

PyTorch异步推理任务处理:Miniconda-Python3.9环境队列设计

PyTorch异步推理任务处理:Miniconda-Python3.9环境队列设计 在构建高并发AI服务的实践中,一个看似基础却极易被忽视的问题常常浮出水面——为什么模型在本地训练得好好的,部署到服务器上就报错?为什么两个项目用着同一个Python环境…

作者头像 李华
网站建设 2026/4/23 9:47:14

Miniconda-Python3.9环境下实现PyTorch模型差分隐私训练

Miniconda-Python3.9环境下实现PyTorch模型差分隐私训练 在医疗、金融等高敏感数据领域,AI模型一旦“记住了”训练集中的个体信息,就可能通过成员推断攻击等方式造成严重隐私泄露。尽管我们可以对原始数据脱敏,但现代深度学习模型的强大拟合…

作者头像 李华
网站建设 2026/4/23 9:44:23

PostIn速成手册(3) - 使用企业微信用户扫描登录PostIn系统

PostIn 是一款开源免费的接口管理工具,支持免费私有化部署,一键安装零配置,简洁易用,支持同步第三方用户并登录,例如LDAP、企业微信、钉钉。本文将详细介绍如何安装PostIn,同步企业微信用户,并使…

作者头像 李华
网站建设 2026/4/23 9:45:28

PyTorch模型注册中心对接:Miniconda-Python3.9环境准备

PyTorch模型注册中心对接:Miniconda-Python3.9环境准备 在现代AI工程实践中,一个看似简单却常常被低估的问题正不断拖慢团队节奏——“为什么我的代码在别人机器上跑不起来?” 这个问题的背后,往往是Python版本冲突、依赖库不一…

作者头像 李华
网站建设 2026/4/23 9:46:54

PyTorch自然语言处理项目迁移至Miniconda-Python3.9环境步骤

PyTorch自然语言处理项目迁移至Miniconda-Python3.9环境实践指南 在现代AI研发中,一个常见的场景是:你在本地训练好的NLP模型,换到同事的机器上却跑不起来——可能是transformers版本不兼容,也可能是PyTorch无法识别GPU。这类问题…

作者头像 李华
网站建设 2026/4/23 9:45:50

Miniconda-Python3.9环境下运行PyTorch官方示例代码全记录

Miniconda-Python3.9 环境下运行 PyTorch 官方示例的完整实践 在深度学习项目开发中,最令人头疼的问题往往不是模型设计本身,而是“环境配置”——明明本地能跑通的代码,换一台机器就报错;团队协作时,每个人的依赖版本…

作者头像 李华