当前位置: 首页 > news >正文

微网站建设教程视频.net电子商城网站开发设计

微网站建设教程视频,.net电子商城网站开发设计,如何开发一个app软件,网站页面设计工具VideoBooth: Diffusion-based Video Generation with Image Prompts 概括 文章提出了一个视频生成模型VideoBooth#xff0c;输入一张图片和一个文本提示词#xff0c;即可输出保持图片中物体且符合文本提示词要求的视频。 方法 粗-细两阶段设计#xff1a;1#xff09;…VideoBooth: Diffusion-based Video Generation with Image Prompts 概括 文章提出了一个视频生成模型VideoBooth输入一张图片和一个文本提示词即可输出保持图片中物体且符合文本提示词要求的视频。 方法 粗-细两阶段设计1粗阶段利用CLIP图像编码器将图片视觉编码注入文本嵌入中融合后的嵌入送入cross attention层2细阶段将多尺度图片空间信息注入视频生成模型的cross-frame attentions层。 一些困惑 多尺度的图片编码是用什么图像编码器获取的通过VAE获取潜在表征而这个多尺度其实就是潜在编码在U-Net在不同阶段的输出。 预备知识 拓展2D卷积为了处理视频数据和时序关联我们将SD模型中的2D卷积扩展为了3D卷积。应该指的是U-Net中的卷积层交叉帧注意力模块SD模型中原本的自注意力模块被修改成了交叉帧注意力模块以提高时序一致性。交叉帧模块同时处理空间和时序域因此可以提高合成帧的时序一致性。时序注意力模块处理时序域对所有帧起作用提高时序一致性。 粗粒度视觉编码 使用CLIP获取图像提示词和文本提示词的编码信息然后将文本编码中目标物体的编码替换为图像视觉编码将融合后的视觉-图像编码送入交叉注意力层。CLIP图像编码器是固定的但是为了对齐图像和文本编码图像编码会经过MLP层。此外为了适配融合后的编码交叉注意力层中的K和V也被微调了。 细粒度视觉编码 这部分的编码信息应该是用来保证时序一致性的。首先通过VAE获取图像潜在编码然后加噪送入U-Net每个阶段的U-Net输出包括最初的潜在编码对应的K-V都会和原始的K-V进行拼接初始帧的V被更新并影响后续所有的Value。 实验
http://www.w-s-a.com/news/976368/

相关文章:

  • 58网站怎么做浏览度才高论坛网站怎么做排名
  • wordpress 手机网站支付京东网站建设的经费预算
  • 自己怎么样做游戏网站做海外贸易网站
  • 建立什么样的网站好制作网页网站代码
  • 岳麓区专业的建设网站公司尚一网常德论坛
  • 电商网站建设实训报告360站长平台链接提交
  • 个性化网站建设公司个人网站备案类型
  • 腾讯建站模板上海网站开发有限公司
  • 网站和小程序的区别请问做网站怎么赚钱
  • 网站logo设计免费版在线网站开发建设准备工作
  • wordpress多站点 主题南京做网站好的公司
  • 广州 门户seo到底是做什么的
  • 可以登录国外网站吗如何用家用电脑做网站
  • 吉安建站公司wordpress企业
  • 河北住房和城乡建设厅网站6thinkphp做视频网站
  • 遵义网站制作一般需要多少钱深圳全国网站制作哪个好
  • 公众平台网站价格哪个网站做餐饮推广最好
  • 深圳 公司网站设计重庆的网站设计公司价格
  • 网站开发市场分析餐饮平台app有哪些
  • 制作一个收费网站要多少钱开发网站需要什么技术
  • 网站流量统计平台二手域名做网站不收录
  • 蒙古网站后缀mysql8.0 wordpress
  • 免费建立一个网站互联网推广培训
  • WordPress多站点绑定域名深圳住房建设部官方网站
  • 网站建设公司zgkr上海网页网络技术有限公司
  • wordpress附件扩展格式徐州seo关键词
  • wordpress博客站模板织梦网站 联系方式修改
  • 北京城乡建设厅网站重庆网站建设解决方案
  • 网站建设和维护工作内容网站的空间与域名
  • 济南做门户网站开发公司网页发布的步骤