当前位置: 首页 > news >正文

受欢迎的大连网站建设挂马网站现象

受欢迎的大连网站建设,挂马网站现象,中国旅游预订网站的建设始于哪一年,wordpress文章添加字段BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型#xff08;LLM#xff09;搭建一个具有图像理解能力的图文模型#xff0c;输入是图像和文本#xff0c;输出是文本。 BLIP2基于Q-Former结构#xff0c;如下图所示。Q-Former包含图像transformer和文本transfo…BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型LLM搭建一个具有图像理解能力的图文模型输入是图像和文本输出是文本。 BLIP2基于Q-Former结构如下图所示。Q-Former包含图像transformer和文本transformer两个transformer。两个transformer的self-attention layer是共享的。图像transformer的输入是固定数量的可学习的query embedding。query embedding先通过self-attention和文本交互再并通过cross-attention和图像特征交互。Q-Former的cross-attention的参数随机初始化其他参数用bert的参数初始化。Q-Former的优势是可以从图像encoder中提取出固定长度的特征。 BLIP2的训练分为两步 从固定参数的图像encoder学习视觉文本编码有Image-Text Contrastive Learning (ITC)、Image-grounded Text Generation (ITG) 、Image-Text Matching (ITM)三个训练目标。从固定参数的LLM学习理解图片生成文本。通过FC层连接Q-Former将queries的映射到和文本token相同维度拼接在文本前面。 图像encoder选择了CLIP的ViT-L/14和EVA-CLIP的ViT-G/14。LLM选择了OPT和FlanT5。 训练数据包含129M幅图片来自COCO、Visual Genome、CC3M、 CC12M、SBU、 LAION400M。互联网图片使用CapFilt方法生成文本描述。
http://www.w-s-a.com/news/586573/

相关文章:

  • 美食网站开发目的与意义网站开发环境选择
  • 青岛西海岸新区城市建设局网站开发板在null不可用
  • 企业信息管理系统免费seo优化个人博客
  • 做任务的设计网站泰州哪里做网站
  • 什么网站可以做设计赚钱吗南京十大软件公司排名
  • 网站开发时间进度北京有哪些著名网站
  • 深圳比较好的设计网站公司自己的网站到期域名如何续费
  • 温州做网站哪儿新云网站模版
  • 网站开发 视频存在哪检察院前期网站建设
  • 备案中的网站信息怎么填如何做分享赚钱的网站
  • 网站行程表怎么做注册公司费用要多少
  • 常见电子商务网站基本模式南山网站公司定
  • 网站搭建代码网站里面送礼物要钱怎么做代码
  • 大学英文网站建设举措wordpress 学院 模板
  • 爱 做 网站吗php网站作业模版
  • wordpress代码乱吗台州做网站seo的
  • 做ptt网站wordpress中文企业网站
  • 深圳雨棚制作深圳 网站优化公司排名
  • 深圳优秀网站建设价格wordpress没人用
  • 国企网站建设需要注意沈阳招标信息网
  • 东莞360推广的网站是谁做的上海网络推广产品
  • 网站可以换主机吗中国十大网站建设企业
  • 怎么做盗版小说网站官网做有下拉列表的网站的图片
  • 邢台网站建设电话网站界面类型
  • 网站制作合同模板做一个网站能挣多少钱
  • 汶上1500元网站建设互联网高端官网
  • 广州做公司网站网站开发培训机构
  • 网站建设与维护 课件网页版qq安全中心登录入口
  • 做三个月网站广告收入dw如何制作网页
  • ...课程网站建设简介工信部 网站备案查询