当前位置: 首页 > news >正文

快注销网站苏州做网站的公司哪家最好

快注销网站,苏州做网站的公司哪家最好,网站前台功能模块设计,河南软件开发app制作公司1.1注意力机制的基本原理#xff1a; 计算注意力权重#xff1a; 注意力权重是通过计算输入数据中各个部分之间的相关性来得到的。这些权重表示在给定上下文下#xff0c;数据的某个部分相对于其他部分的重要性。 加权求和#xff1a; 使用这些注意力权重对输入数据进行加权…1.1注意力机制的基本原理 计算注意力权重 注意力权重是通过计算输入数据中各个部分之间的相关性来得到的。这些权重表示在给定上下文下数据的某个部分相对于其他部分的重要性。 加权求和 使用这些注意力权重对输入数据进行加权求和以生成一个紧凑的表示该表示集中了输入数据的关键信息。 1.2数学原理 假设我们有一个输入序列 X[x1​,x2​,...,xn​] 其中 xi​ 是序列中的元素。在自注意力机制中我们首先将输入转换为查询Q、键K和值V 变体 多头注意力Multi-Head Attention 在 Transformer 模型中使用了多头注意力机制它将 Q、K、V 分割为多个“头”每个头在不同的表示子空间中学习注意力 1.3代码实现  class Attention(nn.Module):def __init__(self, dim, heads8, dim_head64, dropout0.):super().__init__()inner_dim dim_head * headsproject_out not (heads 1 and dim_head dim)self.heads headsself.scale dim_head ** -0.5 #缩放因子用于调整注意力得分的规模通常是 dim_head 的平方根的倒数self.attend nn.Softmax(dim -1) #Softmax 函数用于计算注意力权重self.to_qkv nn.Linear(dim, inner_dim * 3, bias False)self.to_out nn.Sequential(nn.Linear(inner_dim, dim),nn.Dropout(dropout)) if project_out else nn.Identity()def forward(self, x):qkv self.to_qkv(x).chunk(3, dim-1)q, k, v map(lambda t: rearrange(t, b p n (h d) - b p h n d, h self.heads), qkv)dots torch.matmul(q, k.transpose(-1, -2)) * self.scaleattn self.attend(dots)out torch.matmul(attn, v)out rearrange(out, b p h n d - b p n (h d))return self.to_out(out) forward(self, x): 生成查询Q、键K和值V: qkv self.to_qkv(x).chunk(3, dim-1): 这行代码使用一个线性变换self.to_qkv将输入 x 转换为查询Q、键K和值V这三组向量然后将其分割成三个部分。 重排为多头格式: q, k, v map(...): 这里使用 rearrange 函数将 Q、K 和 V 的形状转换为多头格式。原始的扁平形状被重排为一个具有多个头部的形状以便独立进行自注意力运算。 计算注意力得分: dots torch.matmul(q, k.transpose(-1, -2)) * self.scale: 这里计算查询Q和键K之间的点积以得到注意力得分。得分通过 self.scale一个基于头维度 dim_head 的缩放因子进行缩放以防止梯度消失或爆炸。 应用 Softmax 获取注意力权重: attn self.attend(dots): 使用 Softmax 函数对注意力得分进行归一化得到每个键对应的注意力权重。 加权和以得到输出: out torch.matmul(attn, v): 将注意力权重应用于值V得到加权和这是自注意力的输出。 重排并通过输出层: out rearrange(out, b p h n d - b p n (h d)): 将输出重排回原始格式并通过可能存在的输出线性层和 dropout 层。
http://www.w-s-a.com/news/777063/

相关文章:

  • 皮卡剧网站怎样做排名网
  • 网站开发 兼职哪个网站是做安全教育
  • 商品展示类网站怎么用群晖nas做网站
  • 长腿蜘蛛wordpresssem优化推广
  • 中国铁路建设监理协会官方网站深圳福田区怎么样
  • 互联网网站开发发展wordpress文章自定义栏目
  • 众筹网站平台建设工信部网站备案系统
  • 网站301重定向代码wordpress 加子目录
  • 淄博网站制作优化推广asp做学生信息网站
  • 海口招商建设有限公司网站淮安哪有专业做网站的公司
  • 喀什哪有做网站的国内正规seo网络推广
  • 网站设计初步规划公司网页打不开是什么原因
  • 深圳企业网站建设推广服务php做的商城网站设计论文
  • 韩雪冬网站手机网站开发 宽度
  • 奉贤专业做网站新手怎么做企业网站
  • 做网站用哪几个端口 比较好手机号网站源码
  • 手机免费代理ip网站那个旅游网站做攻略最好
  • 西安做网站找哪家公司好苏州专业网站建设开发
  • dedecms如何做网站网站设计实施方案
  • 网站建设合约品牌设计有哪些
  • 织梦企业门户网站宝塔搭建wordpress网站
  • 网站为什么没有排名了11月将现新冠感染高峰
  • 网站开发维护专员岗位职责辽阳企业网站建设
  • 做外国订单有什么网站网站设计论文提纲
  • 商城网站建设报价方案导师让做网站
  • 清远市企业网站seo联系方式动易官方网站
  • 手机上怎么做能打开的网站一级域名和二级域名跨域
  • 网站首页效果图wordpress 在线教育
  • 电商网站开发团队广西桂林商贸旅游技工学校
  • 网站模板文件怎么下载东莞常平镇邮政编码