news 2026/5/9 0:40:11

眼神交流+触摸感应,打造更贴心的小智AI:原理和实现

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
眼神交流+触摸感应,打造更贴心的小智AI:原理和实现

前文,分享了【小智Pro】系列文章:

30天,AI 陪我写了3万行代码,上线一款应用,3点血泪教训

零门槛为小智接入MCP,小智Pro焕新上线:MCP广场+自定义服务

得益于 ESP32 的强大,小智 AI 的生态不断壮大,接入的开发板琳琅满目:

除了语音对话,还能干点啥?

这正是小智Pro一直在探索的。

除了闹钟、音乐、知识库、记忆、天气实用价值

还应该提供情绪价值

前两天,朋友寄来了一块开发板 -zhengchen-eye

相比其它开发板,有两大特点:

  • 两块圆形串联LCD屏,可显示 gif 动图
  • 两块触摸板,可感知触摸强度

这两天,设备端调试成功,已加到小智Pro支持列表中,先看效果:

demo展示

今日分享,和大家聊聊:这两个功能的基本原理具体实现

1. 眼神交流

视频中的眨眼动作,本质上是写到设备中的gif 动图

因此,只需要设备端,为zhengchen-eye,自定义一份display即可。

下面上实操。

1.1 代码结构设计

xiaozhi-esp32display模块,采用面向对象的继承体系设计,清晰、可扩展。

核心是通过抽象基类,定义通用接口,然后根据不同类型的显示设备进行具体实现,层次结构如下:

Display (抽象基类) └── LvglDisplay (基于LVGL库的通用显示实现) ├── LcdDisplay (LCD显示屏通用实现) │ ├── SpiLcdDisplay (SPI接口LCD显示屏) │ ├── RgbLcdDisplay (RGB接口LCD显示屏) │ └── MipiLcdDisplay (MIPI接口LCD显示屏) ├── OledDisplay (OLED显示屏实现) └── EmoteDisplay (基于EMOTE引擎的表情显示实现,esp-box-3用到)

zhengchen-eye接入的是 LCD 屏,只需继承LcdDisplay,进行定制化开发即可:

LcdDisplay (LCD显示屏通用实现) └── ZhengchenEyeLcdDisplay (针对zhengchen-eye开发板的定制实现)

因为是特定板子的定制代码,我们放到boards/目录下:

./zhengchen-eye ├── zhengchen_eye_lcd_display.cc └── zhengchen_eye_lcd_display.h

1.2 基类代码详解

Display(display.h)是整个显示系统的抽象基类,定义了所有显示设备都应该具备的基本功能接口,比如:

  • 状态显示 (SetStatus)
  • 通知显示 (ShowNotification)
  • 表情显示 (SetEmotion)
  • 聊天消息显示 (SetChatMessage)
  • 状态栏更新 (UpdateStatusBar)

LvglDisplayDisplay的子类,实现了基于 LVGL 图形库的具体显示功能:

  • 基于 LVGL 的 UI 元素管理
  • 通知、状态栏等通用 UI 组件

LcdDisplayLvglDisplay的基础上,针对 LCD 显示屏,增加了更多相关功能:

  • LCD 面板初始化和配置
  • LVGL 与 LCD 硬件的对接
  • GIF 动画支持

1.3 自定义显示

display模块初始化时,会调用SetupUI来实现基于 LVGL 的 UI 元素管理。

不过,基类中的SetupUI不是虚方法。

在不改变通用代码的情况下,我们重写SetupUI函数,新增显示标签gif_label_

void ZhengchenEyeLcdDisplay::SetupUI() { ESP_LOGI(TAG, "Starting UI setup"); DisplayLockGuard lock(this); /* overlay */ overlay_container = lv_obj_create(container_); lv_obj_add_flag(overlay_container, LV_OBJ_FLAG_HIDDEN); // 默认隐藏 gif_label_ = lv_gif_create(overlay_container); lv_gif_set_src(gif_label_, &happy); }

然后,在板子初始化时,调用一次:

display_ = new ZhengchenEyeLcdDisplay(panel_io, panel, DISPLAY_WIDTH, DISPLAY_HEIGHT, DISPLAY_OFFSET_X, DISPLAY_OFFSET_Y, DISPLAY_MIRROR_X, DISPLAY_MIRROR_Y, DISPLAY_SWAP_XY); display_->SetupUI();

接下来,如何显示不同的gif 表情包

重写SetEmotion函数!

主程序会调用SetEmotion来显示不同的emoji,因此,只需把emoji改成gif就 OK 了。

下面用注释给大家解释下具体实现逻辑:

void ZhengchenEyeLcdDisplay::SetEmotion(const char* emotion) { // idle状态且 neutral 情绪 - 隐藏表情层,显示正常界面 // 否则显示表情层 // 根据emoji查找匹配的表情 }

效果如下:

2. 触摸感应

2.1 工作原理

ESP32 内置电容式触摸传感器,基于电容变化,实现触摸检测:

  • 电容构成: 每个触摸引脚与地之间存在寄生电容。
  • 触摸效应: 当手指靠近或触摸电极时,人体作为额外的电容,总电容值就会增大

因此,看电容值大小,不就知道是否触摸了?

看效果:

未触摸状态:电容保持在 3w-

触摸:电容增大到 13w+

松手:电容减少到 2w+

2.2 功能实现

ESP32 官方文档中,触摸传感器共有 10 个 IO 口。

zhengchen-eye这块板子用了两个:

void touch_init() { touch_pad_init(); touch_pad_config(TOUCH_PAD_NUM4); // 配置 GPIO4 为触摸引脚 touch_pad_config(TOUCH_PAD_NUM5); // 配置 GPIO5 为触摸引脚 }

然后,我们新增一个定时任务,实现触摸数据读取:

static void touch_read_task(void* arg) { zhengchen_eye* self = static_cast<zhengchen_eye*>(arg); while (1) { touch_pad_read_raw_data(TOUCH_PAD_NUM4, &self->touch_value); touch_pad_read_raw_data(TOUCH_PAD_NUM5, &self->touch_value1); ESP_LOGI(TAG, "Touch pad 4: %d, pad 5: %d", self->touch_value, self->touch_value1); vTaskDelay(2000 / portTICK_PERIOD_MS); } }

问题来了,小智怎么知道我有没有触摸呢?

2.3 两大使用场景

换句话说,这个触摸感应到底可以用在什么场景?

笔者认为,至少可以有两大使用场景

一是,小智在和用户互动时,通过 MCP 发起主动问询!

放在设备端即可:

当然,为了避免小智偷懒,让它每轮对话发起主动调用,更新提示词如下:

二是,定时任务中加个判断,发生触摸动作时,主动上传到服务端,服务端每日统计触摸值,可作为 AI 和用户的亲密度属性。

当然,还有更多使用场景,欢迎大开脑洞,评论区聊~

写在最后

本文分享了小智AI: 眼神交流+触摸感应的基本原理和具体实现。

如果对你有帮助,不妨点赞收藏备用。

固件已做好,放到小智Pro官方文档,免费自取👇:

https://ai.feishu.cn/wiki/IfTawES0mi0YTqk8GQ4cw4qOnD3

有任何想法,欢迎来聊👇:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/28 16:31:36

从可视化工作流到系统架构企业功能增强:低代码技术内核的再审

在企业数字化不断深化的背景下&#xff0c;低代码被广泛视为提升交付效率的可行方案。但其真正价值并不取决于表层的可视化界面&#xff0c;而在于可视化工作流、数据模型、逻辑引擎与系统架构能力所构成的技术内核。对这些机制的深入理解&#xff0c;有助于判断低代码在扩展性…

作者头像 李华
网站建设 2026/4/30 1:10:48

城通网盘直连下载终极方案:告别限速的完整技术指南

城通网盘直连下载终极方案&#xff1a;告别限速的完整技术指南 【免费下载链接】ctfileGet 获取城通网盘一次性直连地址 项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 城通网盘解析工具提供了突破传统下载限制的完整解决方案&#xff0c;通过智能直连技术让用…

作者头像 李华
网站建设 2026/5/1 5:20:11

COLMAP三维重建实战指南:从零基础到高效建模

COLMAP三维重建实战指南&#xff1a;从零基础到高效建模 【免费下载链接】colmap COLMAP - Structure-from-Motion and Multi-View Stereo 项目地址: https://gitcode.com/GitHub_Trending/co/colmap 三维重建技术正在改变我们理解世界的方式&#xff0c;而COLMAP作为业…

作者头像 李华
网站建设 2026/5/8 17:50:17

C++入门全面指南:从基础到现代C++特性(收藏这一篇就够了)

C入门全面指南&#xff1a;从基础到现代C特性 前言 C作为一种强大、高效且广泛应用的编程语言&#xff0c;自1979年由Bjarne Stroustrup在贝尔实验室创建以来&#xff0c;已经发展成为软件开发领域的重要基石。它既保留了C语言的高效性和底层控制能力&#xff0c;又引入了面向…

作者头像 李华
网站建设 2026/5/8 0:08:03

Redis终极面试题:从基础到原理,从概念到实战的10道“必杀题”

面试题切记贪多&#xff0c;十道必会Redis面试题&#xff0c;都搞懂就够了~Redis作为内存数据库的标杆&#xff0c;是后端工程师面试的“必考题”。本文从基础概念→数据结构→持久化→分布式→高级特性→生产实践&#xff0c;整理了10道最具代表性的Redis终极面试题&#xff0…

作者头像 李华