news 2026/4/23 11:56:57

会议热点扫描|SIGKDD 2025研究热点一看就懂

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
会议热点扫描|SIGKDD 2025研究热点一看就懂

本推文对2025年的数据挖掘领域会议ACM SIGKDD Conference on Knowledge Discovery and Data Mining(简称SIGKDD)进行了分析。对录用的552篇研究论文进行了标题高频词统计,对其研究热点进行了深入分析。希望本文能为数据挖掘领域的研究人员提供一些有价值的参考。

本推文由王一鸣撰写,审校为龚裕涛,黄忠祥。

一、会议介绍

第31届ACM SIGKDD国际知识发现与数据挖掘大会(KDD 2025)于2025年8月3日至7日在加拿大多伦多举行。本届大会延续传统,继续作为数据挖掘、数据科学和机器学习领域前沿研究成果和经验报告的顶级论坛。该会议被中国计算机学会(CCF)评为数据挖掘领域的A类会议,具备极高的影响力,为研究人员提供了一个分享新颖观点的独特平台。

会议网址:https://kdd2025.kdd.org/

二、录用情况

SIGKDD 2025总计收到了2955篇研究论文,有552篇被录用,整体录用率约为 18.68%。表1和图1呈现了近五年SIGKDD的录用情况及变化趋势。不难看出,与往年相比,SIGKDD的论文提交数量显著增加,创下历史新高。然而其录用率近年来却有所降低,足以证明委员会对论文质量的重视与数据挖掘领域的蓬勃发展。

1近五年SIGKDD的录用情况及变化趋势表格

举办年份

提交数量

录用数量

录用率

2025

2955

552

18.68%

2024

2046

411

20.09%

2023

1416

313

22.10%

2022

1659

254

15.31%

2021

1541

239

15.51%

1近五年SIGKDD的录用情况及变化趋势

三、热点分析

2 SIGKDD 2025录用论文标题的高频关键词统计表

高频词

翻译

词频

Learning

学习

119

Graph

119

Model

模型

87

Recommendation

推荐

52

Large Language Model/LLM

大语言模型

35

Prediction

预测

35

Time Series

时间序列

35

Framework

框架

31

Neural Network

神经网络

31

Graph Neural Networks/ GNN

图神经网络

29

Forecasting

推测

28

Optimization

优化

22

Diffusion

扩散

21

Classification

分类

20

Anomaly Detection

异常检测

20

Robustness

鲁棒性

18

Federated Learning

联邦学习

15

Representation Learning

表征学习

14

Spatio-temporal

时空

13

Contrastive Learning

对比学习

11

图2 SIGKDD 2025录用论文标题的高频关键词词云图

表2是根据SIGKDD 2025录用的522篇论文标题提取的高频关键词词频统计表,图2是根据词频生成的词云图。接下来,本文将根据上述信息,结合高频关键词对热门研究方向进行总结。

对于通用机器学习方向,关键词Learning以119次并列第一,该方向中涵盖了对模型(Model,87次)的构建以及框架(Framework,31次)的开发。具体而言,该方向聚焦神经网络(Neural Network,31次)设计、鲁棒性(Robustness,18次)优化,以及不同机器学习算法例如联邦学习(Federated Learning,15次)、表征学习(Representation Learning,14次)、对比学习(Contrastive Learning,11次),是所有细分领域的技术根基。

而Graph以119次成为关键词出现频率的并列第一,证明了图相关结构正成为数据挖掘的核心研究方向。该方向聚焦图神经网络(GNN,29次)、知识图谱(Knowledge Graph,7次)、超图(Hypergraph,6次)等技术的建模与应用,是独立于通用机器学习的特色方向,重点解决非欧氏空间数据的关联挖掘问题。

除了上述两个热门方向,推荐(Recommendation,52次)系统也成为了一个独立且高关注度的应用导向方向。该方向聚焦用户偏好挖掘、个性化推荐算法优化、推荐系统效率与效果提升,在电商、视频平台等实际场景中都有广泛的应用,体现其在学术与工业界的双重价值。

时间序列(Time Series,35次)相关研究在本次SIGKDD中占比不容忽视。该方向多以纯时间序列、时空(Spatio-Temporal,13次)融合数据为基础进行预测(Prediction,35次)任务,聚焦趋势预判、动态规律挖掘等核心需求,凸显其在交通、金融等领域的实用价值。

随着AI技术的发展,大语言模型(Large Language Model,35次)以及其他生成(Generative,14次)式模型毋庸置疑是当下最热门的方向之一。Transformer(8次)作为最经典的架构之一,其仍然拥有重要地位。最新的扩散(Diffusion,21次)模型聚焦于高质量内容生成,多模态(Multi-Modal,15次)或多视角(Multi-View,5次)模型则重点关注跨类型数据融合建模,这也使得他们成为区别于传统机器学习与图学习的最新热点。

四、获奖论文

本次SIGKDD 2025录用的522篇研究论文中,分别评选出了最佳论文奖的冠军、亚军以及荣誉提名各一名。以下是论文的具体信息以及下载链接。

1)最佳论文奖冠军

Wenqian Ye, Guangtao Zheng, and Aidong Zhang. 2025. Improving Group Robustness on Spurious Correlation via Evidential Alignment.

论文链接:https://doi.org/10.1145/3711896.3737002

2)最佳论文奖亚军

Ashutosh Gupta, Thomas A. Henzinger, Konstantin Kueffner, Kaushik Mallik, and David Pape. 2025. Monitoring Robustness and Individual Fairness.

论文链接:https://doi.org/10.1145/3711896.3737054

3)最佳论文奖荣誉提名

Masoud Reyhani Hamedani, Jeong-Seok Oh, Seong-Un Cho, and SangWook Kim. 2025. SIGEM: A Simple yet Effective Similarity based Graph Embedding Method.

论文链接:https://doi.org/10.1145/3711896.3737128

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:33:13

虚拟化技术总结与KVM

虚拟化技术总结与KVM 在云计算与数据中心架构中,虚拟化技术是实现资源高效利用、降低运维成本的核心基石。而KVM(Kernel-based Virtual Machine)作为Linux内核原生的虚拟化方案,凭借开源特性、高性能和深度生态整合,已…

作者头像 李华
网站建设 2026/4/23 10:34:02

IDM激活脚本:重新定义下载体验的智能解决方案

IDM激活脚本:重新定义下载体验的智能解决方案 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 在当今数字时代,高速下载已成为工作学习的基…

作者头像 李华
网站建设 2026/4/23 10:31:43

一招解决 Windows C/C++ 控制台中文乱码:SetConsoleOutputCP (CP_UTF8)

在 Windows 下开发 C/C 程序时,控制台输出中文大概率会遇到乱码问题(比如把 “内存占用” 显示成 “脳涔鎵撳紑”),网上五花八门的解决方案要么改系统设置、要么改编译器编码,都不够优雅。本文分享最简单、最通用、一劳…

作者头像 李华
网站建设 2026/4/23 10:32:45

亲测Z-Image-Turbo_UI界面,本地访问7860端口快速画图

亲测Z-Image-Turbo_UI界面,本地访问7860端口快速画图 你有没有遇到过这样的情况:好不容易找到一个看起来很厉害的AI生图模型,结果部署起来一堆依赖、配置复杂,还要写代码调接口,最后卡在环境问题上动弹不得&#xff1…

作者头像 李华
网站建设 2026/4/23 10:33:13

OpCore-Simplify:一键自动化配置OpenCore EFI的终极解决方案

OpCore-Simplify:一键自动化配置OpenCore EFI的终极解决方案 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为复杂的OpenCore配置而头…

作者头像 李华
网站建设 2026/4/23 10:33:16

BERT填空结果不理想?Top-5候选词优化策略实战解析

BERT填空结果不理想?Top-5候选词优化策略实战解析 1. 问题背景:为什么BERT的填空结果有时“差强人意”? 你有没有遇到过这种情况:用BERT做中文语义填空,输入一句“春风又[MASK]江南岸”,模型返回的第一个…

作者头像 李华