当前位置: 首页 > news >正文

有后台的网站怎么做网络服务器机柜检验报告多久过期

有后台的网站怎么做,网络服务器机柜检验报告多久过期,怎么提升学历最快,千万别学交互设计Mamaba3–RNN、状态方程、勒让德多项式 一、简单回顾 在Mamba1和Mamba2中分别介绍了RNN和状态方程。 下面从两个图和两个公式出发#xff0c;对RNN和状态方程做简单的回顾#xff1a; R N N : s t W s t − 1 U x t #xff1b; O t V s t RNN: s_t Ws_{t-1}Ux_t对RNN和状态方程做简单的回顾 R N N : s t W s t − 1 U x t O t V s t RNN: s_t Ws_{t-1}Ux_tO_t Vs_t RNN:st​Wst−1​Uxt​Ot​Vst​ 状态方程 x t ^ A x t − 1 B u t y C x t 状态方程\hat{x_t}Ax_{t-1}Bu_tyCx_t 状态方程xt​^​Axt−1​But​yCxt​ 可以看到RNN的本质表达是一个状态方程。 再重复一遍状态变量、状态方程和输出方程的定义加深理解 状态变量刻画系统状态的变量称为状态变量比如机械系统中的速度、位置。 状态方程描述系统输入如何影响状态变量变化的方程。 输出方程描述状态变量与输出变量关系的一组代数方程。 二、勒让德多项式 勒让德多项式可以被理解为一组多项式基函数和傅里叶级数类似允许将某个未知信号分解为不同多项式函数的组合。 三、记忆的本质 记忆是通过重新复盘过去发生的事情且记忆的内容 f ^ ( t ) \hat{f}(t) f^​(t) ≠ 事件本身 f ( t ) f(t) f(t) 。而是拟合逼近的关系. 对于一段序列信号可以被一组基函数(S4中为勒让德多项式) e i ( t ) e_i(t) ei​(t)进行线性组合来表示。即 f ^ ( t ) ∑ i 1 ∞ c i e i ( t ) \hat{f}(t)\sum_{i1}^{\infty}c_ie_i(t) f^​(t)∑i1∞​ci​ei​(t) 在真实场景中信号是持续输入的因此拟合和逼近也是在持续进行。 其中 f t f_{t} ft​表示目标函数f在t时刻之前的逼近。即不同时刻对应着不同的拟合系数 t 1 时刻 f ^ t 1 ( t ) ∑ i 1 N c t 1 , i e i ( t ) t 4 时刻 f ^ t 4 ( t ) ∑ i 1 N c t 4 , i e i ( t ) t_1时刻\hat{f}_{t_1}(t)\sum_{i1}^Nc_{t_1,i}e_i(t) \\ t_4时刻\hat{f}_{t_4}(t)\sum_{i1}^Nc_{t_4,i}e_i(t) t1​时刻f^​t1​​(t)i1∑N​ct1​,i​ei​(t)t4​时刻f^​t4​​(t)i1∑N​ct4​,i​ei​(t) 在上式中勒让德多项式 e i ( t ) e_i(t) ei​(t)是固定的 c i c_i ci​表示多项式基函数的系数且随着输入 f ( t ) f(t) f(t)不断更新。 介绍到这里脑子里有一个想法前面介绍的状态变量也是随着输入不断的更新 使用N阶勒让德多项式逼近序列信号即意味着将信号映射至N维空间中而 c ( t ) c(t) c(t)是刻画信号的状态变量。 接下来计算 c ( t ) c(t) c(t)。 对上面的公式进行微分并经过数学推理可以得到一个ODE 对上式进行整理可得 d d t c ( t ) 1 t A c ( t ) 1 t B f ( t ) − c ˙ ( t ) A c ( t ) B f ( t ) \frac{d}{dt}c(t)\frac{1}{t}Ac(t)\frac{1}{t}Bf(t)-\dot{c}(t)Ac(t)Bf(t) dtd​c(t)t1​Ac(t)t1​Bf(t)−c˙(t)Ac(t)Bf(t) 其中矩阵AHippo矩阵为 四、总结 本文说明了RNN、SSM与勒让德多项式之间的关系 RNN本质上是一个SSMS4将序列信号映射至勒让德基函数空间状态向量即为多项式系数S4中将RNN中权重矩阵W替换成Hippo矩阵 额外说明 PSMamba所采用的基本框架仍是S4, Mamba则在S4的基础上引入了若干关键改进主要可以总结为以下几点 选择性扫描算法Selective Scan AlgorithmMamba采用了一种硬件感知的并行化算法称为选择性扫描算法它能够在加速训练和推理速度的同时保持对历史上下文的有效利用。与S4相比Mamba不仅存储整个历史上下文而且选择性地将部分历史上下文总结为固定上下文这样既保留了详细的历史信息又提高了处理效率。 参数化矩阵与Attention效果Mamba模型通过参数化矩阵对输入信息进行有选择性的处理类似于注意力机制Attention不同输入拥有不同的状态表示增强了模型对不同token信息的处理能力。 简化的SSM模型Mamba还可能包含了对SSMSparse State Machines或Structured State Machines的简化进一步提升了模型的效率和可解释性。 五、参考文章 [1]一文通透想颠覆Transformer的Mamba从SSM、HiPPO、S4到Mamba [2]现代控制理论——状态、状态空间、状态空间描述 [3]Mamba4 魔幻矩阵A [4]Mamba3 记忆殿堂
http://www.w-s-a.com/news/711043/

相关文章:

  • 网页网站自做全搞定西安建设工程信息网诚信平台
  • 网站vip怎么做建网站外包公司
  • 胶州建网站域名不备案可以正常使用吗
  • 网站建设客户开发方案软件工程师行业分析
  • 沈阳网站建设黑酷科技微信小程序怎么一键删除
  • 做网站产品搜索展示实现西安百度推广服务公司
  • 建立网站接受投注是什么意思一般使用的分辨率的显示密度是多少
  • 怎么建立一个网站开展业务网站建设人员的工资分配
  • 求职网站建设方案企业网站开发需求分析
  • 西安企业网站开发可以做哪些有趣的网站
  • 房产类网站开发云南百度建站
  • 泰州网站建设电话彩票网站怎么做代理
  • 泉州网站制作推广山西网站开发建设
  • 百度商桥怎样绑定网站百度推广登陆
  • 重庆网站建设论坛株洲论坛
  • 网站怎么做切换中英文济南广运建设公司网站
  • 网页游戏网站搭建免费建网站哪个模板多
  • 公司起名打分最准的免费网站直播网站app开发
  • 医疗器械类网站前置审批网站临时域名
  • 金融网站策划方案网站开发表格整体页面居中
  • 句容本地网站黄石下陆区建设局网站
  • 免费网站服务陕西省咸阳市建设银行网站
  • 网站建设活动计划做网站意义
  • 莱芜新闻主持人名单seo sem 外贸建站 网站建设 文化墙设计
  • 易语言可以做网站嘛赣州网站建设开发
  • 网站建设规范布局网站建设费往什么科目
  • 乐清手机网站设计哪个汽车网站汽贸店免费做
  • 网站建设课程总结报告推广软文
  • 企业网站哪里可以做烟台seo网站推广
  • 怎样建设网站优化珠海网站建设开发