当前位置: 首页 > news >正文

做生意网站广州网站建设哪里买

做生意网站,广州网站建设哪里买,如何建立网站空间,集翔网大网站建设文章目录1. 去噪扩散概率模型2. 前向扩散3. 反向采样3. 图像条件扩散模型4. 可以考虑改进的点5. 实现代码1. 去噪扩散概率模型 扩散模型是一类生成模型, 和生成对抗网络GAN 、变分自动编码器VAE和标准化流模型NFM等生成网络不同的是, 扩散模型在前向扩散过程中对图像逐步施加噪… 文章目录1. 去噪扩散概率模型2. 前向扩散3. 反向采样3. 图像条件扩散模型4. 可以考虑改进的点5. 实现代码1. 去噪扩散概率模型 扩散模型是一类生成模型, 和生成对抗网络GAN 、变分自动编码器VAE和标准化流模型NFM等生成网络不同的是, 扩散模型在前向扩散过程中对图像逐步施加噪声, 直至图像被破坏变成完全的高斯噪声, 然后在反向采样过程中学习从高斯噪声还原为真实图像。在模型训练完成后只需要随机给定一个高斯噪声就可以生成丰富的真实图像。 2. 前向扩散 前向扩散过程就是向图像不断加高斯噪声使其逐渐接近一个与输入数据相关的高斯分布。此处将未加噪声的数据记为x0x_0x0​x0∼q(x0)x_0\sim q(x_0)x0​∼q(x0​)q(x0)q(x_0)q(x0​)是为被噪声破坏的原始数据分布则在ttt时刻的噪化状态和上一时刻t−1t-1t−1之间的关系为 q(xt∣xt−1)N(xt;1−βt⋅xt−1,βt⋅I),(1)q(x_t|x_{t-1})\mathcal{N}(x_t; \sqrt{1-\beta_t}\cdot x_{t-1}, \beta_t\cdot\textbf{I}), \tag{1}q(xt​∣xt−1​)N(xt​;1−βt​​⋅xt−1​,βt​⋅I),(1)其中t∈{0,1,...,T}t\in{\{0, 1, ..., T\}}t∈{0,1,...,T}N\mathcal{N}N表示高斯噪声分布βt\beta_tβt​是与时刻t相关的噪声方差调节因子I\textbf{I}I是一个与初始状态x0x_0x0​维度相同的单位矩阵。则输入x0x_0x0​的条件下x1,x2,...,xTx_1, x_2, ..., x_Tx1​,x2​,...,xT​的联合分布可以表示为 q(x1,x2,...,xT∣x0)∏t1Tq(xt∣xt−1)(2)q(x_1, x_2, ..., x_T|x_0)\displaystyle\prod_{t1}^{T}q(x_t|x_{t-1}) \tag{2}q(x1​,x2​,...,xT​∣x0​)t1∏T​q(xt​∣xt−1​)(2)则根据根据马尔科夫性可以直接得到输入x0x_0x0​的条件下ttt时刻的噪化状态为 q(xt∣x0)N(xt;α‾t⋅x0,(1−α‾t)⋅I),(3)q(x_t|x_0)\mathcal{N}(x_t; \sqrt{\overline{\alpha}_t}\cdot x_0, (1-\overline{\alpha}_t)\cdot\textbf{I}), \tag{3}q(xt​∣x0​)N(xt​;αt​​⋅x0​,(1−αt​)⋅I),(3)其中αt:1−βt\alpha_t:1-\beta_tαt​:1−βt​, α‾t:∏s0tαs\overline{\alpha}_t:\prod_{s0}^{t}\alpha_sαt​:∏s0t​αs​。根据公式(1)(1)(1)可以得到ttt时刻的噪化状态xtx_txt​与t−1t-1t−1时刻的噪化状态xt−1x_{t-1}xt−1​的关系为 xtαt⋅xt−11−αt⋅ϵt−1,(4)x_t\sqrt{\alpha_t}\cdot x_{t-1}\sqrt{1-\alpha_t}\cdot\epsilon_{t-1}, \tag{4}xt​αt​​⋅xt−1​1−αt​​⋅ϵt−1​,(4)其中ϵt−1∼N(0,I)\epsilon_{t-1}\sim\mathcal{N}(\textbf{0}, \textbf{I})ϵt−1​∼N(0,I)通过不断取代递推可以得到ttt时刻的噪化状态xtx_txt​与输入x0x_0x0​之间的关系为 xtαt⋅xt−11−αt⋅ϵt−1αtαt−1⋅xt−21−αtαt−1⋅ϵ‾t−2αtαt−1αt−2⋅xt−31−αtαt−1αt−2⋅ϵ‾t−3…α‾t⋅x01−α‾t⋅ϵ(5)\begin{equation*} \begin{aligned} x_t \sqrt{\alpha_t}\cdot x_{t-1}\sqrt{1-\alpha_t}\cdot\epsilon_{t-1} \\ ~ \sqrt{\alpha_t\alpha_{t-1}}\cdot x_{t-2}\sqrt{1-\alpha_t\alpha_{t-1}}\cdot\overline{\epsilon}_{t-2} \\ ~ \sqrt{\alpha_t\alpha_{t-1}\alpha_{t-2}}\cdot x_{t-3}\sqrt{1-\alpha_t\alpha_{t-1}\alpha_{t-2}}\cdot\overline{\epsilon}_{t-3} \\ ~ \dots \\ ~ \sqrt{\overline{\alpha}_t}\cdot x_0\sqrt{1-\overline{\alpha}_t}\cdot\epsilon \\ \end{aligned} \end{equation*} \tag{5} xt​    ​αt​​⋅xt−1​1−αt​​⋅ϵt−1​αt​αt−1​​⋅xt−2​1−αt​αt−1​​⋅ϵt−2​αt​αt−1​αt−2​​⋅xt−3​1−αt​αt−1​αt−2​​⋅ϵt−3​…αt​​⋅x0​1−αt​​⋅ϵ​​(5)其中ϵ∼N(0,I)\epsilon\sim\mathcal{N}(\textbf{0}, \textbf{I})ϵ∼N(0,I) ϵ‾t−2\overline{\epsilon}_{t-2}ϵt−2​是两个高斯分布相加后的分布。第一步到第二步的公式推导需要说明一下根据高斯噪声的特点对于两个方差不同的高斯分布N(0,σ12⋅I)\mathcal{N}(\textbf{0}, \sigma_1^2\cdot\textbf{I})N(0,σ12​⋅I)和N(0,σ22⋅I)\mathcal{N}(\textbf{0}, \sigma_2^2\cdot\textbf{I})N(0,σ22​⋅I)其相加后的高斯分布为N(0,(σ12σ22)⋅I)\mathcal{N}(\textbf{0}, (\sigma_1^2\sigma_2^2)\cdot\textbf{I})N(0,(σ12​σ22​)⋅I)表现在公式中即 xtαt⋅xt−11−αt⋅ϵt−1αt⋅(αt−1⋅xt−21−αt−1⋅ϵt−2)1−αt⋅ϵt−1αtαt−1⋅xt−2αt(1−αt−1)⋅ϵt−21−αt⋅ϵt−1αtαt−1⋅xt−21−αtαt−1⋅ϵ‾t−2(6)\begin{equation} \begin{aligned} x_t \sqrt{\alpha_t}\cdot x_{t-1}\sqrt{1-\alpha_t}\cdot\epsilon_{t-1} \\ ~ \sqrt{\alpha_t}\cdot( \sqrt{\alpha_{t-1}}\cdot x_{t-2}\sqrt{1-\alpha_{t-1}}\cdot\epsilon_{t-2})\sqrt{1-\alpha_t}\cdot\epsilon_{t-1} \\ ~ \sqrt{\alpha_t\alpha_{t-1}}\cdot x_{t-2} \sqrt{\alpha_t(1-\alpha_{t-1})}\cdot\epsilon_{t-2}\sqrt{1-\alpha_t}\cdot\epsilon_{t-1} \\ ~ \sqrt{\alpha_t\alpha_{t-1}}\cdot x_{t-2}\sqrt{1-\alpha_t\alpha_{t-1}}\cdot\overline{\epsilon}_{t-2} \end{aligned} \end{equation} \tag{6} xt​   ​αt​​⋅xt−1​1−αt​​⋅ϵt−1​αt​​⋅(αt−1​​⋅xt−2​1−αt−1​​⋅ϵt−2​)1−αt​​⋅ϵt−1​αt​αt−1​​⋅xt−2​αt​(1−αt−1​)​⋅ϵt−2​1−αt​​⋅ϵt−1​αt​αt−1​​⋅xt−2​1−αt​αt−1​​⋅ϵt−2​​​(6)其中两个高斯分布相加后的标准差为 αt(1−αt−1)(1−αt)1−αtαt−1,(7)\sqrt{\alpha_t(1-\alpha_{t-1})(1-\alpha_t)}\sqrt{1-\alpha_t\alpha_{t-1}}, \tag{7}αt​(1−αt−1​)(1−αt​)​1−αt​αt−1​​,(7)依此得到第二步进而逐渐递推到最后一步。公式(3)(3)(3)和公式(5)(5)(5)的目的就是表明在前向扩散过程中由于每步加的噪声均是同分布的高斯噪声因此不需要逐步进行加噪直接就可以由输入x0x_0x0​的到TTT时刻的噪化状态xTx_TxT​。当α‾T≈0\overline{\alpha}_T\approx0αT​≈0TTT时刻的分布xtx_txt​则几乎就是一个高斯分布据此其可以定义为 q(xT):∫q(xT∣x0)q(x0)dx0≈N(xT;0,I),(5)q(x_T):\int q(x_T|x_0)q(x_0)dx_0\approx\mathcal{N}(x_T; \textbf{0}, \textbf{I}), \tag{5}q(xT​):∫q(xT​∣x0​)q(x0​)dx0​≈N(xT​;0,I),(5)其中∫\int∫表示积分最终的噪化状态xTx_TxT​也可以在图像上看出其分布特点。 3. 反向采样 反向采样过程就是根据已有的噪化状态通过学习来估计噪声分布进一步获得上一时刻的状态并逐渐从高斯分布中构造出真实数据。根据前向扩散过程的结果可以认为TTT时刻噪化状态xTx_TxT​的后验分布p(xt)∼N(xt;0,I)p(x_t)\sim\mathcal{N}(x_t; \textbf{0}, \textbf{I})p(xt​)∼N(xt​;0,I)则联和分布pθ(x0,x1,...,xT)p_{\theta}(x_0, x_1, ..., x_T)pθ​(x0​,x1​,...,xT​)也是一个马尔科夫链其被定义为: pθ(x0,x1,...,xT):p(xT)∏t1Tpθ(xt−1∣xt),(6)p_{\theta}(x_0, x_1, ..., x_T):p(x_T)\displaystyle\prod_{t1}^{T}p_{\theta}(x_{t-1}|x_t), \tag{6}pθ​(x0​,x1​,...,xT​):p(xT​)t1∏T​pθ​(xt−1​∣xt​),(6)则t−1t-1t−1时刻的噪状态xt−1x_{t-1}xt−1​可以由上一时刻ttt的状态xtx_txt​得到其条件分布可以表示为 pθ(xt−1∣xt)N(xt−1;μθ(xt,t),∑θ(xt,t)),(7)p_{\theta}(x_{t-1}|x_t)\mathcal{N}(x_{t-1}; \mu_{\theta}(x_t, t), {\tiny{\sum}}_{\theta}(x_t, t)), \tag{7}pθ​(xt−1​∣xt​)N(xt−1​;μθ​(xt​,t),∑θ​(xt​,t)),(7)其中μθ(xt,t)\mu_\theta(x_t, t)μθ​(xt​,t)和∑θ(xt,t)){\tiny{\sum}}_{\theta}(x_t, t))∑θ​(xt​,t))分别为ttt时刻由噪声估计网络得到的噪声均值和方差θ\thetaθ为噪声估计网络的参数。此时在输入为x0x_0x0​时t−1t-1t−1时刻的噪状态xt−1x_{t-1}xt−1​与上一时刻ttt的状态xtx_txt​之间的真实条件分布为 q(xt−1∣xt,x0)N(xt−1;μ~t(xt,x0),β~t⋅I),(8)q(x_{t-1}|x_t, x_0)\mathcal{N}(x_{t-1}; \tilde{\mu}_{t}(x_t, x_0), \tilde{\beta}_t\cdot\textbf{I}), \tag{8}q(xt−1​∣xt​,x0​)N(xt−1​;μ~​t​(xt​,x0​),β~​t​⋅I),(8)其中噪声后验分布参数μ~t\widetilde{\mu}_tμ​t​, β~t\tilde{\beta}_tβ~​t​分别为 μ~t1αt(xt−βt1−α‾t⋅ϵt),β~t1−α‾t−11−α‾t⋅βt,(9)\tilde{\mu}_t\frac{1}{\sqrt{\alpha_t}}(x_t-\frac{\beta_t}{\sqrt{1-\overline{\alpha}_t}}\cdot\epsilon_t), \tilde{\beta}_t\frac{1-\overline{\alpha}_{t-1}}{1-\overline{\alpha}_t}\cdot\beta_t, \tag{9}μ~​t​αt​​1​(xt​−1−αt​​βt​​⋅ϵt​),β~​t​1−αt​1−αt−1​​⋅βt​,(9)此处认为∑θ(xt,t)σt2⋅I{\small{\sum}}_\theta(x_t, t)\sigma_t^2\cdot\textbf{I}∑θ​(xt​,t)σt2​⋅I即σt2β~t\sigma_t^2\tilde{\beta}_tσt2​β~​t​则预测的后验条件分布变为 pθ(xt−01∣xt)N(xt−1;μθ(xt,t),σt2⋅I),,(10)p_{\theta}(x_{t-01}|x_t)\mathcal{N}(x_{t-1}; \mu_\theta(x_t, t), \sigma_t^2\cdot\textbf{I}), \tag{10}, pθ​(xt−01​∣xt​)N(xt−1​;μθ​(xt​,t),σt2​⋅I),,(10)即利用噪声估计网络μθ\mu_\thetaμθ​来估计真实噪声分布均值μ~t\tilde{\mu}_tμ~​t​则公式(9)(9)(9)中的噪声分布均值可以被估计为 μθ(xt,t)1αt(xt−βt1−α‾t⋅ϵθ(xt,t)),(11)\mu_\theta(x_t, t)\frac{1}{\sqrt{\alpha_t}}(x_t-\frac{\beta_t}{\sqrt{1-\overline{\alpha}_t}}\cdot\epsilon_\theta(x_t, t)), \tag{11}μθ​(xt​,t)αt​​1​(xt​−1−αt​​βt​​⋅ϵθ​(xt​,t)),(11)而根据公式已知ttt时刻的噪化状态xtx_txt​满足xtα‾t⋅x01−α‾t⋅ϵx_t\sqrt{\overline{\alpha}_t}\cdot x_0\sqrt{1-\overline{\alpha}_t}\cdot\epsilonxt​αt​​⋅x0​1−αt​​⋅ϵ则网络学习的优化目标就是让估计出的噪声分布接近真实的噪声分布即 Ex0,t,ϵt∼N(0,I)[∣∣ϵt−ϵθ(α‾t⋅x01−α‾t⋅ϵ,t)∣∣2],(12)\mathbb{E}_{x_0, t, \epsilon_t\sim\mathcal{N}(0, \textbf{I})}[||\epsilon_t-\epsilon_\theta(\sqrt{\overline\alpha}_t\cdot x_0\sqrt{1-\overline{\alpha}_t}\cdot\epsilon, t)||^2], \tag{12}Ex0​,t,ϵt​∼N(0,I)​[∣∣ϵt​−ϵθ​(α​t​⋅x0​1−αt​​⋅ϵ,t)∣∣2],(12)而t−1t-1t−1时刻的噪化状态xt−1x_{t-1}xt−1​可以表示为 (这块尚没搞清楚这个公式的由来似乎与原论文中的公式不一样) xt−1α‾t−1(xt−1−α‾t⋅ϵθ(xt,t)α‾t)1−α‾t−1⋅ϵθ(xt,t),(13)x_{t-1}\sqrt{\overline\alpha_{t-1}}(\frac{x_t-\sqrt{1-\overline{\alpha}_t}\cdot\epsilon_\theta(x_t, t)}{\sqrt{\overline{\alpha}_t}})\sqrt{1-\overline{\alpha}_{t-1}}\cdot\epsilon_\theta(x_t, t), \tag{13}xt−1​αt−1​​(αt​​xt​−1−αt​​⋅ϵθ​(xt​,t)​)1−αt−1​​⋅ϵθ​(xt​,t),(13)其中z∼N(0,I)z\sim\mathcal{N}(\textbf{0}, \textbf{I})z∼N(0,I)。则根据不同时刻噪声估计网络对噪声分布的估计可以依据公式(13)(13)(13)逐渐反向采样得到真实数据分布。 3. 图像条件扩散模型 在图像恢复任务中必须使用条件扩散模型才能生成我们预期的恢复图像实际中即将退化的图像作为条件引入到噪声估计网络中来估计条件噪声分布。如图所示 图像条件扩散模型与经典扩散模型的前向扩散过程完全一样区别仅在于反向采样过程中是否引入图像条件。则反向采样过程中x1,x2,...,xTx_1, x_2, ..., x_Tx1​,x2​,...,xT​的联合分布变为 pθ(x0,x1,...,xT∣x^):p(xT)∏t1Tpθ(xt−1∣xt,x^),(14)p_{\theta}(x_0, x_1, ..., x_T|\hat{x}):p(x_T)\displaystyle\prod_{t1}^{T}p_{\theta}(x_{t-1}|x_t, \hat{x}), \tag{14}pθ​(x0​,x1​,...,xT​∣x^):p(xT​)t1∏T​pθ​(xt−1​∣xt​,x^),(14)其中x^\hat{x}x^为作为条件输入噪声估计网络的退化图像。此时噪声分布估计变为 ϵθ(xt,t)→ϵθ(xt,x^,t)(15)\epsilon_\theta(x_t, t)\rightarrow\epsilon_\theta(x_t, \hat{x}, t) \tag{15}ϵθ​(xt​,t)→ϵθ​(xt​,x^,t)(15)t−1t-1t−1时刻的噪化状态xt−1x_{t-1}xt−1​也由公式(13)(13)(13)变为 xt−1α‾t−1(xt−1−α‾t⋅ϵθ(xt,x^,t)α‾t)1−α‾t−1⋅ϵθ(xt,x^,t),(16)x_{t-1}\sqrt{\overline\alpha_{t-1}}(\frac{x_t-\sqrt{1-\overline{\alpha}_t}\cdot\epsilon_\theta(x_t, \hat{x}, t)}{\sqrt{\overline{\alpha}_t}})\sqrt{1-\overline{\alpha}_{t-1}}\cdot\epsilon_\theta(x_t, \hat{x}, t), \tag{16}xt−1​αt−1​​(αt​​xt​−1−αt​​⋅ϵθ​(xt​,x^,t)​)1−αt−1​​⋅ϵθ​(xt​,x^,t),(16) 实际中条件的引入由多种方式最常见的方法是直接通过与噪化状态拼接后作为噪声估计网络的输入。 4. 可以考虑改进的点 以下是我问chatGPT得到的答案 我的拙见 引入天气退化图像恢复中虽然扩散模型已经出现众多研究但在图像去雨、去雾、去雨滴、去雪等方面的研究屈指可数改进噪声估计网络经典的扩散模型是基于U-Net结构的主要模块也是卷积 (也包括自注意力)近来有一些研究发现Transformer架构在扩散模型上可以取得更好地效果Follow最新的更快地扩散模型传统的扩散模型要进行图像恢复一幅图片的处理时长基本都是几十秒实时性太差目前有一些研究提出快速反向采样的方法无监督目前多数给予扩散模型的图像恢复算法仍然是有监督的 (当然不算是监督学习只是条件生成)可以采用一些无监督策略来利用扩散模型实现图像恢复。 5. 实现代码 完整的用于图像恢复的扩散模型代码见完整可直接运行代码其中包括详细的实验操作流程只需要修改数据集路径即可直接使用。
http://www.w-s-a.com/news/403425/

相关文章:

  • 自助外贸网站建设可直接打开网站的网页
  • 江苏城嘉建设工程有限公司网站潍坊网站定制公司
  • 四川省住房和城乡建设厅新网站宜昌建设厅网站
  • 建设网站一般流程建设开发网站
  • 设计外贸英文网站国家企业信息信用公信系统
  • 主题资源网站创建时 如何突出设计的特点阿里云是做网站的吗
  • 乌市建设工程质量监督站网站外资公司注册
  • 档案馆网站机房建设做游戏网站打鱼
  • 网站建设平台 创新模式搭建好ftp服务器 如何通过网站访问
  • 苏州集团网站制作设计网页制作软件ai
  • 网站建设新手教程视频教程手帐风格wordpress主题
  • 做投标网站条件网站更改指定字段
  • mvc5 网站开发之美做印刷网站公司
  • 医疗网站建设精英微信网站用什么制作的
  • 银川网站设计联系电话地推加人2元1个
  • 龙华网站 建设深圳信科北京知名的网站建设公司
  • 怎么做qq刷赞网站搜盘 资源网
  • 微网站怎么做的好名字吗陕西省医院网站建设管理
  • 泉州seo-泉州网站建设公司温州企业自助建站系统
  • 网站建设属于什么费网站建设网络推广
  • 德州网站开发人员网站怎么才能被百度收录
  • wordpress网站怎么加小游戏乐山网站制作公司
  • 企业购 网站建设做兼职有哪些网站
  • 湖州网站做等保费用大型网站建站
  • 优创智汇高端网站建设网站设计工作流程
  • 什么网站可以学做西餐个人网站怎么做支付功能
  • 千户微建站平台做网站需要切图吗
  • 织梦cms 学校网站模板网站建设中的问题
  • 山东济南网站建设公司制作wordpress模板教程视频教程
  • 档案网站的建设怎样更新网站内容