news 2026/4/23 11:37:14

探索LightGBM - shap集成模型在回归任务中的魅力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
探索LightGBM - shap集成模型在回归任务中的魅力

LightGBM-shap集成模型,回归任务,Python代码 方法本身没有啥可以解释 自带数据集可以直接运行 回归任务,所有图所见即所得,

在数据科学的领域中,回归任务是我们常常需要面对的挑战之一。今天,咱们就来捣鼓捣鼓LightGBM - shap集成模型,看看它在回归任务里能玩出什么花样,并且附上Python代码,让一切所见即所得。

准备工作

首先,我们得把需要的库都装上。这里主要用到lightgbm来搭建模型,shap用于解释模型,还有pandasmatplotlib来处理数据和画图。

import lightgbm as lgb import shap import pandas as pd import matplotlib.pyplot as plt

数据集

咱直接用lightgbm自带的数据集,方便又快捷。

# 加载自带数据集 data = lgb.Dataset(lgb.datasets.regression()[0]) X = data.data y = data.label

这里我们直接从lgb.datasets.regression()获取数据,然后把特征数据存到X,标签数据存到y

构建LightGBM模型

# 划分训练集和测试集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 定义LightGBM参数 params = { 'objective':'regression', 'learning_rate': 0.1, 'num_leaves': 31 } # 训练模型 gbm = lgb.train( params, lgb.Dataset(X_train, label=y_train), num_boost_round=100, valid_sets=[lgb.Dataset(X_test, label=y_test)], early_stopping_rounds=10 )

在这部分代码里,先用traintestsplit把数据集分成训练集和测试集。接着定义了一些LightGBM的参数,像objective指定为回归任务,learningrate是学习率,numleaves是叶子节点数。然后用这些参数和训练数据来训练模型,同时指定了验证集,设置了提前停止的轮数。

使用SHAP解释模型

# 计算SHAP值 explainer = shap.TreeExplainer(gbm) shap_values = explainer.shap_values(X_test) # 绘制SHAP摘要图 shap.summary_plot(shap_values, X_test, plot_type="bar") plt.show()

shap.TreeExplainer是专门为树模型计算SHAP值的,这里就用它来解释我们训练好的LightGBM模型。算好SHAP值后,用shap.summary_plot画个摘要图,能直观看到每个特征对模型输出的影响。这个图能让我们快速了解哪些特征在模型里更重要。

模型预测与评估

# 模型预测 y_pred = gbm.predict(X_test) # 评估模型 from sklearn.metrics import mean_squared_error mse = mean_squared_error(y_test, y_pred) print(f"Mean Squared Error: {mse}")

最后,用训练好的模型对测试集进行预测,再用均方误差(MSE)来评估模型的性能。通过这些步骤,咱们就完成了一个基于LightGBM - shap集成模型的回归任务,从数据准备到模型评估,所见即所得。希望大家能从这个小例子里对LightGBM - shap在回归任务中的应用有更清晰的认识。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 20:01:59

Open-AutoGLM隐藏功能曝光:99%人不知道的高效文档转换秘诀

第一章:Open-AutoGLM办公文件转换技术概述Open-AutoGLM 是一种基于大语言模型驱动的智能办公文档格式转换框架,专注于实现跨格式、高保真的文档内容迁移与结构还原。该技术融合自然语言理解、布局分析与格式生成能力,支持 Word、Excel、PPT、…

作者头像 李华
网站建设 2026/4/23 10:50:16

FaceFusion镜像支持ARM架构:可用于边缘设备

FaceFusion镜像支持ARM架构:可用于边缘设备 在直播互动、数字人生成和智能安防等场景中,实时人脸替换正变得越来越重要。然而,传统方案往往依赖云端GPU服务器进行处理,导致延迟高、隐私风险大、部署成本高昂。随着边缘计算的兴起&…

作者头像 李华
网站建设 2026/4/22 17:45:46

Paparazzi:无设备Android界面自动化截屏测试终极指南

Paparazzi:无设备Android界面自动化截屏测试终极指南 【免费下载链接】paparazzi Render your Android screens without a physical device or emulator 项目地址: https://gitcode.com/gh_mirrors/pa/paparazzi 在Android应用开发过程中,确保界面…

作者头像 李华
网站建设 2026/4/22 1:49:50

Cot框架终极指南:为懒人开发者打造的Rust Web开发利器

Cot框架终极指南:为懒人开发者打造的Rust Web开发利器 【免费下载链接】cot The Rust web framework for lazy developers. 项目地址: https://gitcode.com/gh_mirrors/cot3/cot 你是否厌倦了繁琐的Web框架配置?Cot框架正是为追求高效开发的Rust程…

作者头像 李华
网站建设 2026/4/15 22:31:23

audit内存泄漏

audit内存泄漏 问题如下: 你贴出的 top 命令输出显示了系统运行状态,我们来 逐项分析 并告诉你 是否需要处理、如何处理。 🔍 一、整体系统状态 top - 08:48:13 up 552 days, 20:40, 1 user, load average: 0.00, 0.00, 0.00uptime: 552 天(约 1.5 年)→ 系统非常稳定…

作者头像 李华
网站建设 2026/4/21 10:12:35

运动数据分析进入毫秒时代,Open-AutoGLM同步技术已领先3年?

第一章:运动数据毫秒级同步的时代变革 在物联网与边缘计算快速发展的背景下,运动数据的采集与同步已从“秒级”迈入“毫秒级”时代。这一变革不仅提升了运动监测系统的实时性与精确度,更推动了智能穿戴设备、竞技体育分析和远程康复训练等领域…

作者头像 李华