当前位置: 首页 > news >正文

国内做的比较好的二手网站自己的网站中商城怎么做

国内做的比较好的二手网站,自己的网站中商城怎么做,wordpress手机无法访问,网上推广产品哪个网好在图文组合任务中#xff0c;常见的图文融合方式有多种#xff0c;比如简单的拼接、加权求和、注意力机制、跨模态Transformer等。为了让图片充分补充文本的语义信息#xff0c;我们可以使用一种简单且有效的图文融合方法#xff0c;比如通过注意力机制。 我们可以让文本特…在图文组合任务中常见的图文融合方式有多种比如简单的拼接、加权求和、注意力机制、跨模态Transformer等。为了让图片充分补充文本的语义信息我们可以使用一种简单且有效的图文融合方法比如通过注意力机制。 我们可以让文本特征作为查询Query图片特征作为键Key和值Value通过注意力机制让文本特征从图片特征中获取信息。这样图片特征就可以在文本的指导下为每个文本单词提供补充信息。 核心步骤 图片特征扩展由于图片特征是 [1, 768]而文本特征是 [8, 768]我们可以将图片特征扩展成与文本特征相同的形状 [8, 768]。 注意力机制使用文本特征作为查询Query图片特征作为键Key和值Value计算注意力权重并融合特征。 融合输出得到新的文本表示它不仅包含原始文本的语义信息还从图片中获取了相关的视觉信息。 import torch import torch.nn as nnclass ImageTextFusion(nn.Module):def __init__(self, feature_dim, num_heads):super(ImageTextFusion, self).__init__()self.feature_dim feature_dimself.text_proj nn.Linear(feature_dim, feature_dim) # 映射文本特征self.image_proj nn.Linear(feature_dim, feature_dim) # 映射图片特征self.attention nn.MultiheadAttention(embed_dimfeature_dim, num_headsnum_heads)def forward(self, image_feat, text_feat):image_feat: 图片特征, shape [1, 768]text_feat: 文本特征, shape [8, 768]# 扩展图片特征到与文本特征相同的形状image_feat_expanded image_feat.expand(text_feat.size(0), -1) # [8, 768]# 映射特征image_feat_proj self.image_proj(image_feat_expanded) # [8, 768]text_feat_proj self.text_proj(text_feat) # [8, 768]# 将文本特征作为查询图片特征作为键和值attn_output, attn_weights self.attention(querytext_feat_proj.unsqueeze(1), # [8, 1, 768]keyimage_feat_proj.unsqueeze(1), # [8, 1, 768]valueimage_feat_proj.unsqueeze(1), # [8, 1, 768]need_weightsFalse)# 将输出重新变形回 [8, 768]fused_text_feat attn_output.squeeze(1) # [8, 768]return fused_text_feat# 示例输入 image_feat torch.randn(1, 768) # 图片特征 text_feat torch.randn(8, 768) # 文本特征# 初始化模型 fusion_model ImageTextFusion(feature_dim768, num_heads8)# 前向传播 fused_output fusion_model(image_feat, text_feat)print(fused_output.shape) # 输出形状应为 [8, 768]代码解析 text_proj 和 image_proj分别用于将文本特征和图片特征映射到相同的特征空间以便进行特征融合。 MultiheadAttention这是 PyTorch 提供的多头注意力机制。我们将文本特征作为 Query图片特征作为 Key 和 Value通过注意力机制使得每个文本单词从图片特征中获取相关的信息。 image_feat.expand(text_feat.size(0), -1)扩展图片特征使其与文本特征具有相同的形状 [8, 768]。 unsqueeze(1)将特征的维度增加一个维度符合 MultiheadAttention 的输入格式。 squeeze(1)将多头注意力输出的维度恢复到 [8, 768]。 总结 这种方法使用了注意力机制让文本特征能够从图片特征中获取信息从而实现图文融合。注意力机制的优势在于它可以为每个文本单词动态地分配不同的图片信息。
http://www.w-s-a.com/news/396695/

相关文章:

  • 川畅科技联系 网站设计网站开发的教学视频
  • 为什么学网站开发凡科登陆
  • 设计师常备设计网站大全中山精品网站建设信息
  • 杭州建设工程网seo服务是什么
  • 兼职做问卷调查的网站wordpress mysql设置
  • 怎么在百度上能搜到自己的网站山西seo谷歌关键词优化工具
  • 网站搭建免费模板飞鱼crm下载
  • 网站开发竞品分析app制作公司深圳
  • 网站建设ssc源码修复设计班级网站建设
  • 网站重定向凡科做网站不要钱
  • 佛山html5网站建设微信营销软件破解版
  • 网站单页做301南京百度推广
  • 私人做网站要多少钱展芒设计网页
  • 怎样网站制作设计如何在网上推广农产品
  • 做关键词排名卖网站聚名网
  • 吉林省住房城乡建设厅网站首页体育器材网站建设方案
  • 网站建设及维护专业手机金融界网站
  • 常州网站建设工作室建立网站有怎么用途
  • 如何盗取网站推广策划书模板
  • 游戏网站建设计划书网络开发需要学什么
  • 手机网站维护费网站开发包括网站过程
  • 懂做游戏钓鱼网站的网站建设技术的发展
  • 网站被百度收录百度一下你就知道 官网
  • 雅客网站建设做网站用什么做
  • 做宣传海报网站专业网站设计速寻亿企邦
  • 秦皇岛市住房和城乡建设局网站有关网站开发的参考文献
  • 晋城城乡建设局网站深圳外贸业务员工资
  • 招聘网站开发的公司销售运营主要做什么
  • 徐州网站无障碍建设wordpress证书
  • c语言可以做网站吗请人做网站收费多少