当前位置: 首页 > news >正文

做网站1500全包查询网站相关网址

做网站1500全包,查询网站相关网址,江宁网站制作,网站flash导入页目录 一. 项目概述 问题#xff1a; 解决#xff1a; 二. 方法详解 a) 整体结构 b) 自主题注意力 三. 文本控制的动漫角色驱动图像生成的结果 四. 文本控制的自然图像驱动图像生成的结果 五. 姿势控制角色驱动图像生成的结果 2023年的最后一天#xff0c;发个文记录… 目录 一. 项目概述 问题 解决 二. 方法详解 a) 整体结构 b) 自主题注意力 三. 文本控制的动漫角色驱动图像生成的结果 四. 文本控制的自然图像驱动图像生成的结果 五. 姿势控制角色驱动图像生成的结果 2023年的最后一天发个文记录下。马上就要迎来新的一年在这里预祝各位读者新年新气象 今天要介绍的是字节的DreamTuner: Single Image is Enough for Subject-Driven Generation可以通过单张图像实现特定主题的驱动生成。 一. 项目概述 什么是主题驱动生成使用一张或几张参考图像生成定制概念的个性化应用。 问题 现有的基于微调的方法需要在主题学习和维护预训练模型的生成能力之间进行权衡个人理解是模型特化和泛化的权衡。 基于附加图像编码器的其他方法往往由于编码压缩而丢失主题的一些重要细节。 解决 文中提出了 DreamTurner这是一种从粗到细注入定制主题的参考信息的新颖方法。 首先提出了一种用于粗略主题身份保留的主题编码器其中在视觉文本交叉注意之前通过附加注意层引入压缩的一般主题特征。 然后我们将预训练的文本到图像模型中的self-attention修改为self-subject-attention层以细化目标主体的细节。值得强调的是self-subject-attention是一种优雅、有效、免训练的方法用于维护定制概念的详细特征可以在推理过程中用作即插即用的解决方案。 最后通过仅对单个图像进行额外的微调DreamTurner 在由文本或姿势等其他条件控制的主题驱动图像生成方面取得了卓越的性能。 二. 方法详解 DreamTuner 作为一种基于微调和图像编码器的主题驱动图像生成的新颖框架它保持从粗到细的主题身份。 DreamTuner由三个阶段组成主题编码器预训练、主题驱动微调和主题驱动推理。 首先训练主题编码器以进行粗略的身份保留。主题编码器是一种图像编码器为生成模型提供压缩图像特征。冻结的 ControlNet 用于解耦内容和布局。 然后我们在参考图像和一些生成的常规图像上微调整个模型如 DreamBooth 中一样。请注意主题编码器和自主题注意力用于常规图像生成以细化常规数据。 在推理阶段通过微调获得的主题编码器、自身主题注意力和主题词[S*]用于从粗到细地进行主题身份保留。预训练的 ControlNet 还可用于布局控制生成。 a) 整体结构 提出的主题编码器作为一种图像编码器为主题驱动生成提供粗略参考。使用冻结的 CLIP 图像编码器来提取参考图像的压缩特征。使用显著对象检测SOD模型或分割模型来去除输入图像的背景并强调主题。 然后引入一些残差块ResBlock进行域移位。CLIP提取的多层特征在通道维度上cat操作然后通过残差块调整到与生成特征相同的维度。使用附加的主题编码器注意SEA层将主题编码器的编码参考特征注入到文本到图像模型中。主题编码器注意层添加在视觉文本交叉注意之前因为交叉注意层是控制生成图像的总体外观的模块。 根据与交叉注意力相同的设置构建主题编码器注意力并将输出层初始化为零。附加系数β引入来调整主题编码器的影响。 此外进一步引入ControlNet来帮助解耦内容和布局。具体来说我们训练主题编码器和冻结深度 ControlNet。由于ControlNet提供了参考图像的布局主题编码器可以更加关注主题内容。 b) 自主题注意力 由于主题编码器为生成过程提供了特定主题的一般外观因此进一步提出基于原始自注意力层的自主题注意力以实现良好的主题身份保存。 将预训练的文本到图像 U-Net 模型提取的参考图像的特征注入到自注意力层中。 参考特征可以提供精细且详细的参考因为它们与生成图像的特征共享相同的分辨率。具体来说在每个时间步长通过扩散前向过程对参考图像进行噪声处理t。 然后从噪声参考图像中提取每个自注意力层之前的参考特征这些特征与时间步长生成的图像特征共享相同的数据分布。 利用参考特征将原始的自注意力层修改为自主题注意力层。将生成图像的特征作为查询并将生成图像特征和参考图像特征的进行cat操作作为键和值。 为了消除参考图像背景的影响使用显著对象检测SOD模型创建前景掩模其中使用0和1来指示背景和前景。 此外掩模还可以通过权重策略来调整参考图像影响的大小即掩模乘以调整系数, 起到注意偏差的作用因此使用对数函数作为预处理。 将原来的分类器免引导方法也修改为 第一个方程强调参考图像的引导第二个方程强调条件的引导用概率控制选择第一个或者第二个的可能性。 三. 文本控制的动漫角色驱动图像生成的结果 结果显示了专注于动漫角色的文本控制的主题驱动图像生成的输出。 局部编辑结果例如第一行的表达式编辑和全局编辑结果包括后续五行的场景和动作编辑即使输入复杂的文本也能产生高度详细的图像。值得注意的是图像准确地保留了参考图像的细节。 四. 文本控制的自然图像驱动图像生成的结果 该方法在 DreamBooth 数据集上进行评估其中每个主题的一张图像用作参考图像。通过使用主题编码器和自我主题注意力生成精确的参考。 这使得 DreamTuner 能够成功生成与文本输入一致的高保真图像同时还保留关键的主题细节包括但不限于、小狗头上的白色条纹、包上的徽标、罐头上的图案和文字。 五. 姿势控制角色驱动图像生成的结果 该方法可以与 ControlNet 相结合将其适用性扩展到各种条件例如姿势。在下面的示例中仅使用一张图像进行 DreamTuner 微调并使用参考图像的姿态作为参考条件。为了保证帧间的一致性参考图像和生成图像的前一帧都用于自我注意力参考权重分别为10和1。  欢迎加入AI杰克王的免费知识星球海量干货等着你一起探讨学习AIGC!
http://www.w-s-a.com/news/498184/

相关文章:

  • 建设银行门户网站惠州公司网站建设价格
  • 用python开发网站网站如何取消验证码
  • 公司做企业网站互联网建网站
  • 建网站需要的费用公司注册后怎么做网站
  • 宣传电脑的网站开发运动网站建设教程
  • 网站建设公司都会有哪些花销做网站公司商丘
  • 网站风格有哪些软件定制和开发
  • 公司网络维护具体做什么河南网站推广优化公司哪家好
  • 中学生制作的网站常平哪里有招计算机网站开发的
  • 原创网站模版苏州响应式网站建设
  • 做海报在哪个网站可以找素材网址申请注册方法
  • 网站建设分哪些类别别人做的网站不能用
  • 做网站网站会怎么样全国高校校园网站联盟建设
  • 整站下载器 做网站地图地产项目网站设计
  • 创意设计网站公司手机wap网站建设多少钱
  • 甘肃省第八建设集团公司网站seo高级优化方法
  • 精美的商城网站介绍最多人用的wordpress子主题
  • 检察门户网站建设情况俄外长抵达北京
  • 老电脑做网站服务器网站在线留言如何做
  • 南宁广告公司网站建设小程序源码破解
  • 沛县做网站xlec网站建设开发方式包括哪些方面
  • 山西网站建设 哪家好四川城乡和建设厅网站
  • 有瀑布流的网站小型商城网站
  • 百石网怎么做网站二次开发软件
  • 网站域名是什么东西制作网页哪家好
  • 合肥网站建设团队简述网站内容管理流程
  • 网站广告是内容营销吗wordpress增加背景图片
  • 网站建设技术jsp课程设计响应式布局网站开发
  • 东莞网站排名优化seo套路网站怎么做的
  • 我做网站网络建站一般多少钱