news 2026/4/23 13:54:10

MATE:多代理无障碍模式转换框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MATE:多代理无障碍模式转换框架

概述

本研究提出了一个开源支持框架–多代理翻译环境(MATE),它利用多代理系统(MAS)来解决残疾用户在数字环境中面临的无障碍问题。MATE 是一个利用多代理系统 (MAS) 的开源支持框架。

MATE 可根据用户需求在不同模式(文本、语音、图像、视频等)之间进行翻译,从而使有视觉或听觉障碍的人能够轻松获取信息。
其功能包括 ModCon-Task-Identifier 模型,该模型可分析用户输入并自动识别最合适的转换任务,从而实现文本到语音 (TTS)、语音识别 (STT)、图像标题生成 (ITT) 和图像到语音解释 (ITA) 等多种任务。

此外,还建立了用于模态转换任务分类的专用数据集 “ModConTT”,并对照现有的 LLM 和机器学习模型进行了评估。
结果表明,所提出的模型准确率高、成本低,有望应用于医疗、教育和交通等广泛领域。

建议的方法

MATE 由一个解释用户请求的 "解释器代理 "和七个执行特定转换任务的不同 "专业代理 "组成。

解释器代理从输入文本中识别任务类型,并将处理任务分配给相关的专业代理。

每个代理都利用现有的高性能模型(如 Whisper、Stable Diffusion、Tacotron 2、BLIP 等)来执行转换任务,如 TTS、STT、TTI(文本到图像)、ITT(图像到文本)、ITA(图像到音频)、ATI(音频到图像)和 VTT(视频到文本)以及其他转换任务。文本)和其他转换。

在任务确定方面,ModCon-Task-Identifier 是使用作者创建的 ModConTT 数据集对 BERT 进行微调的版本,与一般的 LLM 和经典的机器学习模型相比,ModCon-Task-Identifier 的准确性更高。

该系统设计为本地运行,提供隐私保护和灵活定制,适合医疗和教育领域的实时支持。

实验

在实验中,首先使用 ModConTT 数据集将几个 LLM(GPT-3.5-Turbo、Llama-3.1-70B 和 GLM-4-Flash)作为解释器进行比较。

在对 230 个样本进行任务分类时,GPT-3.5-Turbo 表现出很高的性能,准确率为 0.865,但采用微调 BERT 的 ModCon-Task-Identifier 的准确率最高,准确率为 0.917,F1 分数为 0.916。

此外,通过与其他经典模型(如使用 TF-IDF 和 BERT 嵌入的逻辑回归和随机森林)进行比较,也证实了所提出模型的优越性。

误分类分析表明,UNK(未知任务)类别的失败率最高,其次是 STT 和 ATV。

这些结果证明了 MAS+ 专业化模型在复杂的模式转换任务中的有效性,并支持其作为医疗保健和教育领域的支持工具发挥巨大作用。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 9:37:23

EPLAN电气设计:解决EPLAN卡顿的实用技巧

EPLAN电气设计:解决EPLAN卡顿的实用技巧EPLAN软件卡顿的问题,通常是输入法不兼容、软件设置不对或者电脑配置不够等原因造成的。下面是一些具体的解决办法:一、可能是输入法没设置好,这是最常见的原因:Windows 10/11系…

作者头像 李华
网站建设 2026/4/17 0:08:13

2025工业客户管理系统:五大CRM和ERP厂商柔性数字化能力深度解析

工业与工贸企业的数字化转型正逐步进入 “柔性适配” 阶段,企业既要满足定制化生产的业务需求、控制数字化投入成本,又要实现销售 - 生产 - 供应链 - 财务的全链路协同,同时兼顾本地化运营与全球化拓展的多元场景。超兔、SAP、钉钉、用友、Sa…

作者头像 李华
网站建设 2026/4/18 4:17:36

图片格式转换与智能压缩站:全格式支持、无损处理与批量优化

在跨平台图像应用场景中,格式兼容性与文件体积优化是核心需求。本网站通过多格式编解码引擎、智能压缩算法与批量处理架构,提供一站式图片格式转换与压缩解决方案,同步解析关键技术原理,助力用户实现高效图像管理。 https://iris…

作者头像 李华
网站建设 2026/4/23 12:48:48

Rockchip AI部署实战:RKNN-Toolkit2高效应用全解析

还在为AI模型在嵌入式设备上的部署效率发愁吗?面对复杂的模型转换流程和性能优化挑战,如何快速上手并发挥Rockchip NPU的真正实力?今天,就让我带你走进RKNN-Toolkit2的实战世界,掌握从模型到部署的完整解决方案。 【免…

作者头像 李华
网站建设 2026/4/19 10:30:15

34、Perl文件操作与脚本参数处理全解析

Perl文件操作与脚本参数处理全解析 1. 文件句柄关闭 在Perl编程中,在重新打开文件句柄之前,系统会自动关闭它。不过,在使用完文件句柄后手动关闭它们是良好的编程习惯,这样可以避免在脚本中占用不必要的空间。关闭文件句柄可以使用 close 函数,示例如下: close FIL…

作者头像 李华