当前位置: 首页 > news >正文

南昌电影网站开发有哪些网站是响应式的

南昌电影网站开发,有哪些网站是响应式的,微信小程序开发常见问题,网站对企业的好处在Transformer模型中#xff0c;解码器的计算过程涉及多个步骤#xff0c;主要包括自注意力机制、编码器-解码器注意力和前馈神经网络。以下是解码器的详细计算过程及数据维度变化#xff1a; 1. 输入嵌入和位置编码 解码器的输入首先经过嵌入层和位置编码#xff1a; I…在Transformer模型中解码器的计算过程涉及多个步骤主要包括自注意力机制、编码器-解码器注意力和前馈神经网络。以下是解码器的详细计算过程及数据维度变化 1. 输入嵌入和位置编码 解码器的输入首先经过嵌入层和位置编码 Input d Embedding ( x ) PositionEncoding ( x ) \text{Input}_d \text{Embedding}(x) \text{PositionEncoding}(x) Inputd​Embedding(x)PositionEncoding(x) 维度变化 x x x: 输入序列的标记维度为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​) Embedding ( x ) \text{Embedding}(x) Embedding(x): 输出维度为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​) PositionEncoding ( x ) \text{PositionEncoding}(x) PositionEncoding(x): 输出维度为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​) 2. 自注意力机制 自注意力机制计算如下 Q Input d W Q , K Input d W K , V Input d W V Q \text{Input}_d W_Q, \quad K \text{Input}_d W_K, \quad V \text{Input}_d W_V QInputd​WQ​,KInputd​WK​,VInputd​WV​ 这里 W Q , W K , W V W_Q, W_K, W_V WQ​,WK​,WV​ 是参数矩阵维度为 ( d m o d e l , d k ) (d_{model}, d_k) (dmodel​,dk​)假设 d k d m o d e l d_k d_{model} dk​dmodel​。维度变化 Q , K , V Q, K, V Q,K,V: 输出维度为 ( n , d k ) (n, d_k) (n,dk​) 自注意力的计算为 Attention ( Q , K , V ) softmax ( Q K T d k M ) V \text{Attention}(Q, K, V) \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}} M\right)V Attention(Q,K,V)softmax(dk​ ​QKT​M)V维度变化 Q K T QK^T QKT: 维度为 ( n , n ) (n, n) (n,n) softmax \text{softmax} softmax: 结果维度为 ( n , n ) (n, n) (n,n)最终输出的维度为 ( n , d v ) (n, d_v) (n,dv​)假设 d v d m o d e l d_v d_{model} dv​dmodel​。 3. 残差连接与层归一化 自注意力的输出与输入相加然后进行层归一化 Output d ( l ) LayerNorm ( Attention Input d ) \text{Output}_d^{(l)} \text{LayerNorm}(\text{Attention} \text{Input}_d) Outputd(l)​LayerNorm(AttentionInputd​) 维度变化维度保持为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​)。 4. 编码器-解码器注意力 接下来解码器会对编码器的输出进行注意力计算 Q ′ Output d ( l ) W Q ′ , K ′ EncoderOutput W K ′ , V ′ EncoderOutput W V ′ Q \text{Output}_d^{(l)} W_Q, \quad K \text{EncoderOutput} W_K, \quad V \text{EncoderOutput} W_V Q′Outputd(l)​WQ′​,K′EncoderOutputWK′​,V′EncoderOutputWV′​ 这里 W Q ′ , W K ′ , W V ′ W_Q, W_K, W_V WQ′​,WK′​,WV′​ 的维度也是 ( d m o d e l , d k ) (d_{model}, d_k) (dmodel​,dk​)。编码器输出的维度为 ( T e , d m o d e l ) (T_e, d_{model}) (Te​,dmodel​)。 注意力计算为 Attention ( Q ′ , K ′ , V ′ ) softmax ( Q ′ K ′ T d k ) V ′ \text{Attention}(Q, K, V) \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V Attention(Q′,K′,V′)softmax(dk​ ​Q′K′T​)V′维度变化 Q ′ K ′ T QK^T Q′K′T: 维度为 ( n , T e ) (n, T_e) (n,Te​)最终输出的维度为 ( n , d v ) (n, d_v) (n,dv​)。 然后与自注意力的输出进行残差连接和层归一化 Output d ( l ) LayerNorm ( EncoderDecoderAttention Output d ( l ) ) \text{Output}_d^{(l)} \text{LayerNorm}(\text{EncoderDecoderAttention} \text{Output}_d^{(l)}) Outputd(l)​LayerNorm(EncoderDecoderAttentionOutputd(l)​) 5. 前馈神经网络 接下来是前馈神经网络的处理 FFN ( x ) ReLU ( x W 1 b 1 ) W 2 b 2 \text{FFN}(x) \text{ReLU}(xW_1 b_1)W_2 b_2 FFN(x)ReLU(xW1​b1​)W2​b2​ W 1 W_1 W1​ 维度为 ( d m o d e l , d f f ) (d_{model}, d_{ff}) (dmodel​,dff​) W 2 W_2 W2​ 维度为 ( d f f , d m o d e l ) (d_{ff}, d_{model}) (dff​,dmodel​)其中 d f f d_{ff} dff​ 是前馈层的隐藏单元数。维度变化输入维度为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​)输出维度为 ( n , d m o d e l ) (n, d_{model}) (n,dmodel​)。 6. 最终输出 在最后一步再次进行残差连接和层归一化 Output d ( l ) LayerNorm ( FFN Output d ( l ) ) \text{Output}_d^{(l)} \text{LayerNorm}(\text{FFN} \text{Output}_d^{(l)}) Outputd(l)​LayerNorm(FFNOutputd(l)​) 接下来解码器的最终输出通过线性层和Softmax层生成词汇表的概率分布 Logits Output d ( l ) W o u t b o u t \text{Logits} \text{Output}_d^{(l)} W_{out} b_{out} LogitsOutputd(l)​Wout​bout​ Probabilities softmax ( Logits ) \text{Probabilities} \text{softmax}(\text{Logits}) Probabilitiessoftmax(Logits) 维度变化 W o u t W_{out} Wout​ 维度为 ( d m o d e l , V ) (d_{model}, V) (dmodel​,V)其中 V V V 是词汇表的大小。 Logits \text{Logits} Logits 的维度为 ( n , V ) (n, V) (n,V) Probabilities \text{Probabilities} Probabilities 的维度同样为 ( n , V ) (n, V) (n,V)表示每个时间步上各个词汇的概率。 通过这些步骤解码器能够生成序列的下一个标记。
http://www.w-s-a.com/news/190415/

相关文章:

  • 手机网站404页面室内设计公司排名前100
  • 做民宿需要和多家网站合作吗创建软件的步骤
  • 网站导航栏设计要求辽宁省住房和城乡建设厅
  • 海外网站平台腾讯营销平台
  • 东道网站建设良品铺子网络营销案例
  • 免费企业查询软件优化模型
  • 兰亭集势的网站平台建设凡科网站免费版怎么做
  • 在网站做推广要钱吗网站根目录是哪个文件夹
  • 网站建设如何弄链接海外vps一键配置WordPress
  • 1个ip可以做几个网站吗动画制作可以自学吗
  • 顺德建设局网站如何搭建网站
  • 精品网站建设费用 干净磐石网络网页制作简单作业
  • 网站建设需要用软件群晖怎样做网站
  • 网站建设公司有哪博客网站建设方案书
  • 服装商城的网站建设宿迁论坛
  • 网站建设服务市场趋势淮南市网站开发的方式
  • 交互设计包含网站设计wordpress和discuz共存
  • 淮阳城乡建设局网站在线网页翻译软件
  • 什么是电商视觉设计郑州seo服务
  • google网站设计原则青海网站建设与管理
  • 简述网站的创建流程广西网站建设定制
  • 唐河网站制作汉中建设工程招标新闻中心
  • 网站过期就可以抢注PHP框架和wordpress
  • 天津做网站得公司克隆网站到wordpress修改
  • 郫县网站建设网站建设报价单及项目收费明细表
  • 商标做网站logo建网站作业
  • 网站顶部展出的大幅广告中建八局第二建设有限公司
  • 公众微信绑定网站帐号优秀中文网页设计
  • 如何做漫画赚钱的网站企业网站管理系统c
  • 安康公司网站制作搜狗网站