news 2026/4/23 14:34:36

Siri 终于有“眼睛”了:屏幕感知功能如何改变 iOS 26.4 的一切

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Siri 终于有“眼睛”了:屏幕感知功能如何改变 iOS 26.4 的一切

如果你这两年对 Siri 的态度是——“能用就行,别添乱”,那接下来几个月,你可能要被迫改观一次。

因为苹果一直在拖、一直在改、一直在重做的那套“全新 Siri”,终于要露面了。多家报道都提到:iOS 26.4 可能会成为新 Siri 的第一站,时间窗口大概率落在2026 年 3 月或 4 月(仍有变数)。

而这次变化的关键,不是“更会聊天”。 是 Siri 终于开始具备一种能力:看见你正在看什么。

也就是所谓的On-screen awareness(屏幕感知 / 屏幕理解)

新 Siri 的三件套:不是花活,是“从工具变助手”的门槛

苹果在 WWDC 2024 首次把这套新 Siri 的能力讲清楚,大概分成三块:

1)个人上下文

你不需要像对讲机一样把路径报清楚。 Siri 会理解你设备上的信息脉络——邮件、信息、照片、日程、备忘录……你的问题不用再“解释到令人疲惫”。

换句话说:你不用说“打开某个 App 的某个页面”,你可以更接近人类说话。

2)屏幕感知

这才是“长眼睛”。

你不用再描述“我现在看到哪个按钮/哪段文字/哪张图”。因为 Siri 会把你屏幕上的内容当作上下文的一部分来理解——你说一句,它就能对着你正在看的东西做判断。

3)在 App 内代你做事

以前的 Siri 很像“语音搜索入口”: 它能帮你打开 App,但很少真正帮你把事做完。

新方向是:你不必每次都亲自点来点去,Siri 可以在系统与 App 之间执行更多动作(苹果也在 WWDC 2024 的 Apple Intelligence 介绍里强调了跨 App 的新动作能力)。

为什么拖这么久

原本这些能力曾被外界认为会更早落在某个中期更新里,但后来苹果自己也公开承认:第一版不够稳定,不够可靠,达不到苹果的上线标准,于是选择延后。

更直白点:这事不是“加点 UI 就能发”,而是工程栈要重新搭。 你可以理解为:以前 Siri 的骨架不适合承载 LLM 这一套,需要换基础设施。

更戏剧的

关于“新 Siri 到底用谁的模型”,最近的消息里最刺眼的一条就是:苹果与 Google 的 Gemini 合作正在被反复提及。

与此同时,苹果在 WWDC 2024 也明确介绍过Private Cloud Compute(私有云计算): 当请求需要上云,苹果会尽可能用它的隐私架构去处理,强调最小化暴露与可审计的安全边界。

所以才会出现一种很“苹果式”的组合拳:

  • 模型能力可以借(比如 Gemini)

  • 交互入口、系统权限、数据上下文由苹果掌控

  • 隐私叙事由 Private Cloud Compute 托底

这也解释了为什么大家会把 iOS 26.4 当作一个关键节点:如果要把这套“能看屏幕、能理解上下文、能在 App 内执行动作”的 Siri 推出来,苹果得确保它在体验与隐私上都能站住。

代码爆料

关于“iOS 26.4 会不会真的带来这些 Siri 能力”,目前有报道指向:一些功能线索在苹果相关代码与内部规划中出现过,并被科技媒体跟进解读。

注意:这类爆料通常意味着“方向大概率对”,但“上线范围、完成度、是否分批开放”都可能变动。

另一颗更大的雷

如果说“屏幕感知 Siri”是你每天都会碰到的变化,那另一件事更像苹果在憋大招:自研的生成式 AI 搜索

Mark Gurman 的报道提到,苹果内部有个代号World Knowledge Answers(WKA)的项目,目标是做一种新的问答式搜索体验,去对标 Perplexity、ChatGPT 这类产品,并且未来可能延伸到SafariSpotlight

更狠的是时间点:这项能力被描述为可能在2026 年 3 月左右和新版 Siri 的节奏靠近。

如果这条线成真,那 iPhone 的“搜索入口”会出现一次非常微妙的权力转移: 从“你去搜网页” → 变成“你问一句,系统直接给答案”。

发布时间

目前关于 iOS 26.4 的准确发布日期,外界并没有统一结论,但多方预测仍集中在2026 年 3 月或 4 月

按苹果的常见节奏,正式版之前会先有 Beta 露出。 也就是说——你可能很快就会看到“新 Siri 的第一眼”。

最后

过去 Siri 最大的问题不是“笨”,是它看不见你的处境。 你在屏幕上明明已经打开了某个页面,Siri 却还要你从头描述一遍,像在跟一个永远不在现场的人沟通。

On-screen awareness的意义,就是把沟通成本砍掉: 你不再需要解释“你正在看什么”,你只需要说“就这个,帮我处理一下”。

如果苹果这次真的把它做稳了,那 Siri 终于不再只是一个语音入口—— 它会更像一个真正站在你旁边、看得见、能动手的助手。

厦门快乐学习教师招聘

🔥 招聘岗位:小初高语数英物化史地生政 授课老师

🏫 工作校区:岛内外多校区均有需求

🧧双休、六险一金、寒暑假、子女免费就读、厦门落户、人才引进补贴、团建旅游...

✅ 内推通道:想回厦发展/寻求新平台的老师,私聊发送 姓名+电话+学科/学段+简历,内推沟通效率更高!

全栈AI·探索:涵盖动效、React Hooks、Vue 技巧、LLM 应用、Python 脚本等专栏,案例驱动实战学习,点击二维码了解更多详情。

最后:

CSS终极指南

Vue 设计模式实战指南

20个前端开发者必备的响应式布局

深入React:从基础到最佳实践完整攻略

python 技巧精讲

React Hook 深入浅出

CSS技巧与案例详解

vue2与vue3技巧合集

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 16:02:13

7种付费墙绕过工具:轻松解锁付费内容的神奇方法

7种付费墙绕过工具:轻松解锁付费内容的神奇方法 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 你是否曾经被付费墙阻挡了获取知识的脚步?今天我要为你揭秘7种…

作者头像 李华
网站建设 2026/4/13 15:34:11

Vue-Office终极指南:一站式文档预览解决方案

Vue-Office终极指南:一站式文档预览解决方案 【免费下载链接】vue-office 项目地址: https://gitcode.com/gh_mirrors/vu/vue-office Vue-Office是一个专业的文档预览组件库,为Vue开发者提供了开箱即用的多格式文档预览能力。无论你是新手开发者…

作者头像 李华
网站建设 2026/4/23 14:10:05

TranslucentTB透明任务栏终极配置手册:5分钟打造沉浸式桌面体验

TranslucentTB透明任务栏终极配置手册:5分钟打造沉浸式桌面体验 【免费下载链接】TranslucentTB 项目地址: https://gitcode.com/gh_mirrors/tra/TranslucentTB 想要彻底改变Windows任务栏的沉闷外观?TranslucentTB这款轻量级工具能够让你的桌面…

作者头像 李华
网站建设 2026/4/23 14:08:02

终极League Akari:英雄联盟智能助手的完整使用指南

终极League Akari:英雄联盟智能助手的完整使用指南 【免费下载链接】LeagueAkari ✨兴趣使然的,功能全面的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/LeagueAkari 你是否厌倦了…

作者头像 李华
网站建设 2026/4/23 14:16:57

企业年会抽奖系统:打造科技感十足的抽奖新体验

企业年会抽奖系统:打造科技感十足的抽奖新体验 【免费下载链接】lucky-draw 年会抽奖程序 项目地址: https://gitcode.com/gh_mirrors/lu/lucky-draw 还在为年会抽奖环节的平淡无奇而烦恼吗?Lucky Draw抽奖系统正是您需要的专业解决方案。这款基于…

作者头像 李华
网站建设 2026/4/22 23:00:24

亲测可用!IndexTTS 2.0支持混合输入拼音,中文发音更准

亲测可用!IndexTTS 2.0支持混合输入拼音,中文发音更准 你有没有遇到过这种情况:用AI生成一段中文语音,结果“重”字读成了“zhng”而不是“chng”,或者“行”字念得完全不对味?明明输入的是精心设计的台词…

作者头像 李华