news 2026/4/23 12:31:08

X-AnyLabeling图像标注工具完全使用指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
X-AnyLabeling图像标注工具完全使用指南

X-AnyLabeling图像标注工具完全使用指南

【免费下载链接】X-AnyLabelingEffortless data labeling with AI support from Segment Anything and other awesome models.项目地址: https://gitcode.com/gh_mirrors/xa/X-AnyLabeling

前言

X-AnyLabeling是一款功能强大的开源图像标注工具,专为计算机视觉任务设计。作为一款开源工具,它支持多种标注类型和任务,从基础的矩形框标注到复杂的语义分割、姿态估计等高级功能。本文将全面介绍X-AnyLabeling的各项功能和使用方法,帮助用户快速掌握这一工具。

一、文件管理

1.1 数据导入

X-AnyLabeling支持多种数据导入方式:

  • 图像目录导入(Ctrl+U):导入选定目录下的所有图像文件,包括子目录中的图像
  • 单张图像导入(Ctrl+I):支持JPG、PNG、BMP、WebP、TIFF等常见格式
  • 视频文件导入(Ctrl+O):支持MP4、AVI、MOV、MKV等视频格式,工具会自动提取视频帧

1.2 数据删除

工具提供两种删除方式:

  1. 删除标注文件(Ctrl+Delete):仅删除当前图像的标注JSON文件
  2. 删除图像文件(Ctrl+Shift+Delete):将图像和对应标注文件移动到"delete"子目录

1.3 图像切换

  • 基础导航:使用D(下一张)和A(上一张)键切换
  • 快速跳转:
    • Ctrl+Shift+D:跳转到下一张已标注图像
    • Ctrl+Shift+A:跳转到上一张已标注图像
  • 精确搜索:在右下角搜索框输入完整文件名可直接跳转

1.4 标注保存

标注默认自动保存为JSON格式,包含以下关键信息:

{ "version": "工具版本", "shapes": [ { "label": "类别标签", "points": [[x1,y1],[x2,y2],...], "shape_type": "形状类型", "attributes": {} } ], "imagePath": "图像路径" }

可通过"文件>更改输出目录"修改保存位置。

1.5 图像数据嵌入

启用"保存图像数据"选项后,会将图像以Base64编码直接嵌入JSON文件中,实现标注数据的自包含。

二、标注编辑

2.1 创建标注形状

X-AnyLabeling支持多种标注形状:

  1. 矩形框(R):点击拖动创建
  2. 旋转矩形(O):三点定位创建
  3. 多边形(P):逐点点击创建,至少3个点
  4. :单点标注
  5. 线:两点确定一条线
  6. 折线:多点连续线段
  7. :中心点+半径确定

2.2 编辑标注形状

工具提供两种模式:

  1. 绘制模式:持续创建新形状
  2. 编辑模式(Ctrl+E):修改现有形状

编辑功能包括:

  • 移动、调整大小
  • 旋转(旋转矩形专用快捷键Z/X/C/V)
  • 删除(Delete)、撤销(Ctrl+Z)
  • 复制粘贴(Ctrl+C/Ctrl+V)
  • 多边形顶点编辑(Ctrl+J)
  • 形状合并(右键菜单)

2.3 编辑标签属性

选中形状后可编辑:

  • 类别标签(支持模糊搜索)
  • 分组ID(用于关联形状)
  • 难度标记
  • 文字描述
  • 自定义属性

2.4 添加图像描述

在编辑模式下点击画布空白处,可在右侧面板添加整图描述。

三、视图设置

3.1 画布控制

  • 缩放:Ctrl+滚轮/Ctrl++/-/0
  • 适应窗口:Ctrl+F
  • 保持缩放比例:视图>保持先前缩放比例

3.2 图像显示

  • 亮度/对比度调整
  • 状态栏显示文件名、进度和坐标
  • 可保持当前亮度/对比度设置

3.3 形状显示

  • 显示/隐藏标签(Ctrl+L)
  • 显示/隐藏文字(Ctrl+T)
  • 状态栏显示形状尺寸
  • 右侧面板提供标签和分组ID筛选

3.4 十字线定制

可自定义十字线的宽度、透明度和颜色。

四、标注格式支持

X-AnyLabeling支持多种标准标注格式的导入导出:

4.1 YOLO格式

支持检测、分割、旋转框和关键点:

  • 需要准备classes.txt或YAML配置文件
  • 关键点标注需使用相同group_id关联框和点

4.2 VOC格式

支持Pascal VOC XML格式的检测框标注。

4.3 COCO格式

支持COCO JSON格式,适用于多种任务。

4.4 DOTA格式

支持航空图像中旋转框的标注。

4.5 掩码格式

支持二值掩码图像的导入导出。

五、工具栏工具

5.1 数据统计

提供数据集概览和统计分析。

5.2 保存裁剪图像

可将标注区域单独保存为图像。

5.3 标签管理器

集中管理所有类别标签。

5.4 形状类型转换

如将多边形转换为矩形框等。

六、帮助与语言

6.1 关于X-AnyLabeling

查看工具版本和相关信息。

6.2 语言设置

支持多语言界面切换。

七、配置选项

7.1 快捷键配置

自定义各种操作的快捷键。

7.2 标签颜色

为不同类别配置不同显示颜色。

7.3 预定义标签

设置常用标签列表。

7.4 自动切换编辑模式

绘制后自动进入编辑模式的设置。

7.5 悬停高亮

鼠标悬停时高亮显示形状。

7.6 形状外观

调整形状边框、填充等显示属性。

7.6 模型下载源

配置AI辅助标注模型的下载源。

八、支持的任务类型

X-AnyLabeling支持广泛的计算机视觉任务:

  1. 图像分类

  1. 目标检测
  2. 图像分割
  3. 姿态估计
  4. 多目标跟踪
  5. 深度估计
  6. 光学字符识别(OCR)
  7. 交互式视频对象分割
  8. 抠图
  9. 视觉语言任务

  1. 零样本计数
  2. 基础标注

九、自定义模型

支持用户导入自定义的AI模型进行辅助标注。

十、聊天机器人

内置聊天机器人功能,可进行标注相关的问答交互。

结语

X-AnyLabeling作为一款全功能的图像标注工具,其丰富的功能和灵活的配置选项可以满足从简单到复杂的各种标注需求。通过本文的详细介绍,希望用户能够充分利用该工具提高标注效率,为计算机视觉项目提供高质量的标注数据。

【免费下载链接】X-AnyLabelingEffortless data labeling with AI support from Segment Anything and other awesome models.项目地址: https://gitcode.com/gh_mirrors/xa/X-AnyLabeling

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 13:30:25

GRBL串口通信协议:数据接收处理实战案例

GRBL串口通信协议:数据接收处理实战案例从“加工中断”说起:一个雕刻机开发者的深夜调试经历凌晨两点,一台激光雕刻机在执行第876行G代码时突然停机。上位机显示error:5—— “Line Number Error”。用户反复重试,问题依旧。这不是…

作者头像 李华
网站建设 2026/4/23 11:34:35

Qwen2.5-0.5B部署教程:ARM架构设备的适配方案

Qwen2.5-0.5B部署教程:ARM架构设备的适配方案 1. 引言 随着大模型向边缘计算场景延伸,轻量级语言模型在移动端和嵌入式设备上的部署需求日益增长。Qwen2.5-0.5B-Instruct 是阿里通义千问 Qwen2.5 系列中参数量最小的指令微调版本,仅包含约 …

作者头像 李华
网站建设 2026/4/18 3:44:53

Bypass Paywalls Clean:打破内容付费限制的实用指南

Bypass Paywalls Clean:打破内容付费限制的实用指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在数字化阅读日益普及的今天,付费墙成为许多优质内容平台的…

作者头像 李华
网站建设 2026/4/7 3:19:39

PathOfBuilding错误完全指南:从诊断到修复的完整流程

PathOfBuilding错误完全指南:从诊断到修复的完整流程 【免费下载链接】PathOfBuilding Offline build planner for Path of Exile. 项目地址: https://gitcode.com/GitHub_Trending/pa/PathOfBuilding 还在为PathOfBuilding频繁报错而困扰?作为流…

作者头像 李华
网站建设 2026/3/28 17:29:01

免费解锁付费内容的终极指南:5个简单步骤搞定

免费解锁付费内容的终极指南:5个简单步骤搞定 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 想要免费阅读那些被付费墙阻挡的优质内容吗?你绝对不是一个人&am…

作者头像 李华
网站建设 2026/4/23 9:24:13

FSMN-VAD效果惊艳!上传即出时间戳表格

FSMN-VAD效果惊艳!上传即出时间戳表格 1. 引言 1.1 语音端点检测的技术背景 在语音识别、智能对话系统和音频处理领域,语音端点检测(Voice Activity Detection, VAD) 是一项基础但至关重要的预处理技术。其核心任务是自动识别音…

作者头像 李华