news 2026/4/23 15:21:09

4.自注意机制__self-attention

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
4.自注意机制__self-attention

自注意机制也是一个常见的network架构

目前来说,输入都是一个向量,但是如果我们的输入变成了一排向量并且数目可以改变呢?这就是自注意机制解决的问题,现在model每次输入的sequence长度都不一样,如下图

假设network现在要进行文字处理,那么每一个输入的单词都可以用一个向量来表示,所以此时我们的向量长度是可以改变的,因为每个句子的单词数不一样

如何用向量来表示一个单词呢?最简单的我们可以用one-hot-encoding,用一个很长的向量,这个

向量维度和世界上的词汇一样,每一个维度都对应一个词汇,但是这样就有一个问题, 假设每一个词汇之间都没有关系,看不出来cat和dog都是动物,apple是植物

另一个方法是word embedding,我们会给每一个词汇一个向量,这个向量是有语义的,如果把word embedding全部画出来的话,那么可能会发现,所有的动物在一起,植物在一起,所有的动词在一起,word embedding不是本次重点,不讨论

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 10:23:47

LLM Weekly(2026.1.5-2026.1.11)

网络资讯 ChatGPT 健康功能全新上线 OpenAI 推出了 ChatGPT Health,这是一个专属加密空间,可将用户的医疗记录和健康类应用程序与 ChatGPT 相连接,从而提供个性化的非诊断性健康指导。该服务采用数据隔离机制,健康相关对话内容不会用于模型训练,同时支持多重身份验证(MF…

作者头像 李华
网站建设 2026/4/18 9:44:24

基于微信小程序的高校毕业生公考助手系统源码文档部署文档代码讲解等

课题介绍本课题针对高校毕业生公考备考信息零散、规划混乱、刷题低效等痛点,设计并实现一款基于微信小程序的高校毕业生公考助手系统,为毕业生提供一站式公考备考服务。系统以微信小程序为前端载体,采用Node.js搭建后端服务,结合M…

作者头像 李华
网站建设 2026/4/16 18:11:10

社交媒体AI架构中的算法选型:如何选择适合的推荐算法?

社交媒体AI架构中的算法选型:如何选择适合的推荐算法? 1. 标题 (Title) 社交媒体AI架构实战:推荐算法选型指南——从业务到落地的全流程解析告别“算法焦虑”:社交媒体推荐系统如何选对算法?一篇讲透核心方法论从协同过…

作者头像 李华
网站建设 2026/4/23 14:49:14

SSM284的留学生交流互动论坛网站vue

目录SSM284留学生交流互动论坛网站Vue摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!SSM284留学生交流互动论坛网站Vue摘要 该论坛网站基于SSM(SpringSpringMVCMyBatis)后端框架与Vue.js前端框架开…

作者头像 李华
网站建设 2026/4/16 10:57:43

URL末尾到底该不该加斜杠?前端老油条的血泪经验

URL末尾到底该不该加斜杠?前端老油条的血泪经验URL末尾到底该不该加斜杠?前端老油条的血泪经验引言:这事儿真没你想的那么简单先搞清楚服务器眼里的斜杠是啥浏览器和搜索引擎怎么看这事重定向风暴:你网站慢可能就因为这个前端路由…

作者头像 李华
网站建设 2026/4/23 15:18:18

Python:wxauto无法安装的问题解决

一、问题描述 我们在实现自动化发送微信消息的功能,需要wxauto工具包。 但是,现在直接pip install wxauto无法下载。 二、解决办法 直接上github下载源码使用。 https://github.com/cluic/wxauto/tree/main# 三、使用教程 下载源码后,直…

作者头像 李华