news 2026/4/23 11:38:05

对话式AI团队赢得社交机器人技术大赛

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
对话式AI团队赢得社交机器人技术大赛

捷克技术大学团队赢得Alexa Prize社交机器人挑战赛

Team Alquist来自捷克技术大学(CTU),赢得了2021年Alexa Prize社交机器人挑战赛。该团队因其在决赛中获得最高分而被授予50万美元的一等奖,其指导教师Jan Sedivy表示,团队已经在期待迎接下一个挑战。

比赛概述与成就

Alexa Prize社交机器人挑战赛始于2016年,是一项旨在推动对话式AI领域发展的大学团队竞赛。参赛团队需设计能与Alexa用户通过设备进行互动的社交机器人。最终目标是赢得综合评分(满分5分)达到4.0或以上,并且决赛评委认定至少三分之二的互动在20分钟内连贯且有吸引力。首个达成此目标的团队将为所在大学赢得100万美元的研究资助。

尽管今年没有团队达成最终目标,但每个决赛队伍都展示了显著的进步。Alquist社交机器人以平均3.28的评分和平均14分14秒的互动时长获得第一名。斯坦福大学的Chirpy Cardinal社交机器人连续第二年获得第二名和10万美元奖金,平均评分为3.25,平均互动时长为13分25秒。布法罗大学的PROTO社交机器人以平均3.16的评分和平均14分45秒的互动时长获得第三名。

团队感言与技术要点

“我们非常高兴得知我们赢得了今年的比赛,”CTU博士研究生、Alquist团队负责人Jakub Konrád说,“我为整个团队感到自豪,我们构建的机器人连续四年进入决赛。今年我们努力创建一个能够通过综合生成式方法和可适应用户需求的预设场景来进行灵活对话的系统。”

斯坦福大学团队负责人Ethan Chi表示:“Chirpy Cardinal团队非常享受第二次参与Alexa Prize的经历。通过这次体验,我们学到了很多关于真实世界对话的知识。我们几乎从头开始重建了系统,使其能够处理更多样化的用户评论和插话,并开发了新的神经技术,将事实知识流畅地融入对话。我们甚至将《卫报》的新闻集成到系统中,使我们能够就近期事件与用户建立共同点。与之前的版本相比,我们将决赛的平均对话时长增加了一倍以上,使我们更接近流畅对话式AI的共同目标。”

布法罗大学团队负责人Sougata Saha表示:“从创新的角度来看,我们的目标是创建一个不将互动限制在特定主题集合中的代理。我们使用了事实性和闲聊神经生成器的集合,并结合了强大的对话管理器,这帮助我们取得了第三名的成绩。”

赛事进展与未来展望

去年11月,九支团队被选中参加比赛,今年7月,五支队伍进入决赛。决赛于7月27日至29日举行,其他决赛队伍还包括埃默里大学和加州大学圣克鲁兹分校的团队。

某机构对话式AI副总裁Prem Natarajan表示:“构建允许用户参与从体育娱乐到政治技术等各种话题的开放域对话系统是一项极具挑战性的任务。创建能够进行这种多轮次、开放域互动的社交机器人仍远未得到完全解决。今年决赛的顶级团队将平均互动时长比上一届挑战赛提高了一倍以上,这一事实表明我们正在朝着目标取得令人瞩目的进展。”

参与挑战赛的九支团队均已发表研究论文,阐述了他们今年的参赛方法。论文现已可在Alexa Prize网站上获取。

自2017年以来,Alexa用户与Alexa Prize社交机器人的互动时间已超过90万小时。用户只需说“Alexa,让我们聊天”即可继续与获胜团队的社交机器人互动。往届的获胜团队包括华盛顿大学、加州大学戴维斯分校和埃默里大学的团队。

项目扩展

Alexa Prize项目已扩展至另一项竞赛。今年早些时候,某中心发起了Alexa Prize任务机器人挑战赛,共有10支参赛团队竞相开发协助用户完成需要多步骤和决策的任务的代理。这是首个融合多模态(语音和视觉)和交互式用户体验的对话式AI挑战赛。这项为期一年的比赛将于2022年5月结束,获奖者将于次月公布。更多信息可在比赛的常见问题页面上找到。用户将从2021年10月开始有机会与任务机器人互动。

在接下来的几个月里,某中心科学栏目将提供关于即将到来的Alexa Prize社交机器人挑战赛5的详细信息。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/28 5:08:47

VibeVoice-TTS播客制作实战:三人对话脚本生成全流程

VibeVoice-TTS播客制作实战:三人对话脚本生成全流程 1. 引言:从文本到沉浸式播客的跨越 随着AI语音技术的飞速发展,传统TTS(Text-to-Speech)系统已难以满足日益增长的内容创作需求,尤其是在长篇、多角色、…

作者头像 李华
网站建设 2026/4/16 14:21:42

MediaPipe Hands性能对比:不同模型版本评测

MediaPipe Hands性能对比:不同模型版本评测 1. 引言:AI手势识别的演进与选型挑战 随着人机交互技术的发展,手势识别已成为智能设备、虚拟现实、增强现实和无障碍交互中的关键技术之一。Google推出的MediaPipe框架凭借其轻量级、高精度和跨平…

作者头像 李华
网站建设 2026/4/18 5:19:23

企业级应用:VMware Fusion在跨平台开发中的实战案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个企业级跨平台开发环境配置工具。功能包括:1. 预设常见企业开发环境模板(如.NETSQL Server、LAMP等);2. 自动化网络配置实现…

作者头像 李华
网站建设 2026/4/17 22:09:45

智能更衣镜开发:3D体型重建云端预处理指南

智能更衣镜开发:3D体型重建云端预处理指南 引言 想象一下走进一家服装店,不用试穿就能看到衣服穿在身上的效果。这就是智能更衣镜的魅力所在!但对于服装店来说,要实现这个功能,首先需要准确获取顾客的体型数据。传统…

作者头像 李华
网站建设 2026/4/18 15:25:44

深入底层:如何在无运行时开销下实现完整类型元数据提取(附源码)

第一章:静态反射元数据获取在现代编程语言中,静态反射是一种在编译期或运行前获取类型信息的机制。它允许开发者通过代码查询结构体、类、字段、方法等元素的元数据,而无需实际实例化对象。这种能力广泛应用于序列化库、依赖注入框架以及 ORM…

作者头像 李华
网站建设 2026/4/19 20:11:57

AI人脸隐私卫士在物业管理系统的集成:访客照片脱敏实战

AI人脸隐私卫士在物业管理系统的集成:访客照片脱敏实战 1. 引言:物业管理中的隐私挑战与AI破局 随着智慧社区建设的推进,越来越多的物业系统开始引入访客登记拍照功能,用于身份核验和出入管理。然而,这一便利背后潜藏…

作者头像 李华