当前位置: 首页 > news >正文

php网站开发第三章设计网站什么叫空间不稳定

php网站开发第三章,设计网站什么叫空间不稳定,智慧城市,wordpress主题注册验证码文章目录 1. 背景基础知识1.1 什么是状态空间模型#xff08;State Space Model#xff0c;SSM#xff09;#xff1f;1.2 什么是离散化#xff08;Discretization#xff09;#xff1f;1.3 为什么需要离散化#xff1f; 2. SSM离散化过程推导2.1 为什么在离散化过程中… 文章目录 1. 背景基础知识1.1 什么是状态空间模型State Space ModelSSM1.2 什么是离散化Discretization1.3 为什么需要离散化 2. SSM离散化过程推导2.1 为什么在离散化过程中要先进行积分2.2 为什么不直接对 x ˙ ( t ) \dot{x}(t) x˙(t)进行积分2.2 状态方程的改造以及 α ( t ) \alpha(t) α(t)的设计2.3 离散时间积分近似2.3 状态方程的离散化 3. SSM离散化结果 本文首发于 Mamba系列日积月累一状态空间模型SSM的离散化过程推导 最近Mamba系列Mamba、VMamba、Vision Mamba比较火在同样具备高效长距离建模能力的情况下Transformer具有平方级计算复杂度而Mamba架构则是线性级计算复杂度并且推理速度更快。 秉承着公众号科研的思路扩展视野的思路笔者觉得需要学习一下相关内容于是挑选了目前较新的Vision Mamba论文准备开始学习。由于缺乏之前的基础知识储备Preliminaries里面的状态空间模型及其离散化过程直接给我干蒙想着不能出师未捷身先死于是决定搜索相关资料把这个过程弄明白不过由于本人水平有限如果内容存在错误希望大家能给出指导进行纠正。 1. 背景基础知识 1.1 什么是状态空间模型State Space ModelSSM 状态空间模型State Space Model简称SSM是一种数学模型用于描述和分析动态系统的行为。这种模型在多个领域都有应用包括控制理论、信号处理、经济学和机器学习等。在深度学习领域状态空间模型被用来处理序列数据如时间序列分析、自然语言处理NLP和视频理解等。通过将序列数据映射到状态空间可以更好地捕捉数据中的长期依赖关系。 状态空间模型的核心思想是将系统的当前状态state x ( t ) ∈ R n x(t) \in \mathbb{R}^n x(t)∈Rn与输入input u ( t ) ∈ R p u(t) \in \mathbb{R}^p u(t)∈Rp和输出output y ( t ) ∈ R q y(t) \in \mathbb{R}^q y(t)∈Rq之间的关系用一组方程来表示 x ˙ ( t ) A ( t ) x ( t ) B ( t ) u ( t ) y ( t ) C ( t ) x ( t ) D ( t ) u ( t ) (1) \begin{aligned} \dot{x}(t)A(t) x(t)B(t) u(t) \\ y(t)C(t) x(t)D(t) u(t) \end{aligned} \tag{1} ​x˙(t)A(t)x(t)B(t)u(t)y(t)C(t)x(t)D(t)u(t)​(1) 状态方程State Equation描述系统状态随时间的演变。状态方程通常包含当前状态和输入以及可能的系统参数。数学上状态方程可以表示为 x ˙ ( t ) A ( t ) x ( t ) B ( t ) u ( t ) \dot{x}(t)A(t) x(t)B(t) u(t) x˙(t)A(t)x(t)B(t)u(t) 其中 x ( t ) x(t) x(t)是在时间步 t t t 的系统状态 x ˙ ( t ) \dot{x}(t) x˙(t)是状态向量 x ( t ) x(t) x(t)关于时间 t t t的导数 u ( t ) u(t) u(t) 是在时间步 t t t的输入 A ( t ) A(t) A(t)是状态转移矩阵 dim ⁡ [ A ( ⋅ ) ] n × n \operatorname{dim}[A(\cdot)]n \times n dim[A(⋅)]n×n B B B 是输入矩阵 dim ⁡ [ B ( ⋅ ) ] n × p \operatorname{dim}[B(\cdot)]n \times p dim[B(⋅)]n×p。观测方程Observation Equation描述系统输出与状态之间的关系。观测方程允许我们从系统的输出中观察到系统的状态。数学上观测方程可以表示为 y ( t ) C ( t ) x ( t ) D ( t ) u ( t ) y(t)C(t) x(t)D(t) u(t) y(t)C(t)x(t)D(t)u(t) 其中 y ( t ) y(t) y(t) 是在时间步 t t t 的系统输出 C ( t ) C(t) C(t)是观测矩阵 dim ⁡ [ C ( ⋅ ) ] q × n \operatorname{dim}[C(\cdot)]q \times n dim[C(⋅)]q×n D ( t ) D(t) D(t) 是前馈矩阵 dim ⁡ [ D ( ⋅ ) ] q × p \operatorname{dim}[D(\cdot)]q \times p dim[D(⋅)]q×p。 当式(1)中的所有矩阵均随着时间 t t t而变化时此时所表示的线性时变系统而当所有矩阵都不随时间 t t t​变化时此时表示的是线性非时变系统在Mamba系列中实际上是线性非时变系统 x ˙ ( t ) A x ( t ) B u ( t ) y ( t ) C x ( t ) D u ( t ) (2) \begin{aligned} \dot{x}(t)A x(t)B u(t) \\ y(t)C x(t)D u(t) \end{aligned} \tag{2} ​x˙(t)Ax(t)Bu(t)y(t)Cx(t)Du(t)​(2) 1.2 什么是离散化Discretization 离散化Discretization是将连续的数学对象或过程转换为离散形式的过程。在不同的领域中离散化有着不同的应用和含义但核心思想是一致的将连续的变量或函数映射到有限的、离散的集合中。这个过程在数学、工程、计算机科学和许多其他领域中都非常常见。 1.3 为什么需要离散化 SSM作为一个连续时间系统其难以直接集成到现代深度学习算法中 计算效率现代深度学习框架和硬件通常是基于离散时间操作而设计的对SSM进行离散化后才能将其转化为可以在这些框架和硬件上高效运行的模型。训练算法大多数深度学习训练算法如梯度下降和反向传播都是为离散时间模型设计的。离散化使得这些算法可以直接应用于状态空间模型简化了训练过程。实际应用在许多实际应用中数据是离散的如文本数据单词序列、时间序列数据股票价格、传感器读数等。离散时间模型更自然地与这些数据格式相匹配。模型复杂度离散化过程可以通过选择合适的时间步长 T T T 来控制模型的复杂度。较小的时间步长可以提供更精细的控制但计算成本更高较大的时间步长可以减少计算量但可能牺牲一些精度。 2. SSM离散化过程推导 这里再贴上状态方程公式 x ˙ ( t ) A x ( t ) B u ( t ) (3) \dot{x}(t)A x(t)B u(t) \tag{3} x˙(t)Ax(t)Bu(t)(3) 为了进行离散化我们首先要对状态方程(3)进行积分。 2.1 为什么在离散化过程中要先进行积分 在离散化连续状态方程的过程中积分是一个关键步骤因为它涉及到状态变量随时间的累积效应我们需要考虑在每个离散时间步长内状态变量是如何累积变化的。 在离散时间系统中我们不能直接处理导数因为离散时间点上没有导数的概念。相反我们需要考虑在每个时间步长内状态变量的累积变化。这可以通过对连续时间积分进行离散化来实现即将连续时间的积分转换为离散时间的求和。 在实际的数值模拟中我们通常使用数值积分方法如梯形法则、矩形法则、辛普森法则等来近似连续时间积分。这些方法允许我们在离散时间点上近似连续时间的累积效应从而得到离散时间状态方程。这个转换过程涉及到将连续时间的导数项替换为离散时间的差分项这通常涉及到指数函数和采样间隔 T T T​ 的计算。 2.2 为什么不直接对 x ˙ ( t ) \dot{x}(t) x˙(t)进行积分 在式(3)中假设我们直接对 x ˙ ( t ) \dot{x}(t) x˙(t)进行积分的话结果如下 x ( t ) x ( 0 ) ∫ 0 t ( A x ( τ ) B u ( τ ) ) d τ (4) x(t)x(0)\int_0^t(A x(\tau)B u(\tau)) d \tau \tag{4} x(t)x(0)∫0t​(Ax(τ)Bu(τ))dτ(4) 此时积分项中会包含 x ( τ ) x(\tau) x(τ)项本身由于我们是离散系统我们是无法获取在一个连续的时刻 0 → t 0\rightarrow t 0→t内所有的 x ( τ ) x(\tau) x(τ)值的因此无法完成该积分结果的计算。 对于离散系统来说我们希望将公式(4)这个积分表达式转变为以下形式 x ( k 1 ) x ( k ) ∑ i 0 k ( A x ( i ) B u ( i ) ) Δ t (5) x(k1)x(k)\sum_{i0}^k(A x(i)B u(i)) \Delta t \tag{5} x(k1)x(k)i0∑k​(Ax(i)Bu(i))Δt(5) 这个形式要求我们对公式(3)进行一些改造目标是消除 x ˙ ( t ) \dot{x}(t) x˙(t)表达式中的 x ( t ) x(t) x(t)本身。 2.2 状态方程的改造以及 α ( t ) \alpha(t) α(t)的设计 为了消除 x ˙ ( t ) \dot{x}(t) x˙(t)表达式中的 x ( t ) x(t) x(t)本身我们通常会构造一个新的函数 α ( t ) x ( t ) \alpha(t)x(t) α(t)x(t)通过对这个新函数进行求导来简化相应的导数项。 我们对 α ( t ) x ( t ) \alpha(t)x(t) α(t)x(t)​进行求导 d d t [ α ( t ) x ( t ) ] α ( t ) x ˙ ( t ) x ( t ) d α ( t ) d t (6) \frac{d}{d t}[\alpha(t) x(t)]\alpha(t) \dot{x}(t)x(t) \frac{d \alpha(t)}{d t} \tag{6} dtd​[α(t)x(t)]α(t)x˙(t)x(t)dtdα(t)​(6) 我们将公式(3)代入到公式(6)中替换 x ˙ ( t ) \dot{x}(t) x˙(t) d d t [ α ( t ) x ( t ) ] α ( t ) ( A x ( t ) B u ( t ) ) x ( t ) d α ( t ) d t (7) \frac{d}{d t}[\alpha(t) x(t)]\alpha(t) (A x(t)B u(t))x(t) \frac{d \alpha(t)}{d t} \tag{7} dtd​[α(t)x(t)]α(t)(Ax(t)Bu(t))x(t)dtdα(t)​(7) 我们进一步对公式(7)进行改写合并 x ( t ) x(t) x(t)的相关系数 d d t [ α ( t ) x ( t ) ] ( A α ( t ) d α ( t ) d t ) x ( t ) B α ( t ) u ( t ) (8) \frac{d}{d t}[\alpha(t) x(t)](A\alpha(t) \frac{d \alpha(t)}{d t})x(t)B \alpha(t) u(t) \tag{8} dtd​[α(t)x(t)](Aα(t)dtdα(t)​)x(t)Bα(t)u(t)(8) 由于我们的目的是消除导数项中的 x ( t ) x(t) x(t)因此我们令 x ( t ) x(t) x(t)的系数项为0即可 A α ( t ) d α ( t ) d t 0 (9) A\alpha(t) \frac{d \alpha(t)}{d t} 0 \tag{9} Aα(t)dtdα(t)​0(9) 此时我们可以得到 α ( t ) \alpha(t) α(t)的表达式 α ( t ) e − A t (10) \alpha(t)e^{-At} \tag{10} α(t)e−At(10) 将 α ( t ) \alpha(t) α(t)的表达式代入公式(8)可以得到 d d t [ e − A t x ( t ) ] B e − A t u ( t ) (11) \frac{d}{d t}[e^{-At} x(t)]B e^{-At} u(t) \tag{11} dtd​[e−Atx(t)]Be−Atu(t)(11) 这时我们已经完成了在导数项中消除 x ( t ) x(t) x(t)的目标对 e − A t x ( t ) e^{-At}x(t) e−Atx(t)进行积分 e − A t x ( t ) x ( 0 ) ∫ 0 t e − A τ B u ( τ ) d τ (12) e^{-At}x(t)x(0)\int_0^t e^{-A\tau} B u(\tau) d \tau \tag{12} e−Atx(t)x(0)∫0t​e−AτBu(τ)dτ(12) 对公式(12)进行整理 x ( t ) e A t x ( 0 ) ∫ 0 t e A ( t − τ ) B u ( τ ) d τ (13) x(t)e^{At}x(0)\int_0^t e^{A(t-\tau)} B u(\tau) d \tau \tag{13} x(t)eAtx(0)∫0t​eA(t−τ)Bu(τ)dτ(13) 2.3 离散时间积分近似 2.3 状态方程的离散化 在离散系统中我们需要将公式(13)转化为离散形式大致步骤如下 参数定义采样时刻 t k t_k tk​和 t k 1 t_{k1} tk1​其中 k k k是采样索引 T T T是采样间隔即 T t k 1 − t k Tt_{k1}-t_k Ttk1​−tk​​ 积分区间离散化在连续时间积分中我们通常有一个积分区间例如从 t t t 到 t △ t t\triangle{t} t△t。在离散时间系统中我们需要将这个区间划分为 k k k 个等长的子区间每个子区间的长度为 T T T​​。 在某个子区间内公式(13)的形式变为 x ( t k 1 ) e A ( t k 1 − t k ) x ( t k ) ∫ t k t k 1 e A ( t k 1 − τ ) B u ( τ ) d τ (14) x(t_{k1})e^{A(t_{k1}-t_k)}x(t_{k})\int_{t_{k}}^{t_{k1}} e^{A(t_{k1}-\tau)} B u(\tau) d \tau \tag{14} x(tk1​)eA(tk1​−tk​)x(tk​)∫tk​tk1​​eA(tk1​−τ)Bu(τ)dτ(14) 近似积分对于每个子区间来说考虑使用数值积分方法来近似积分这里考虑对 u ( t ) u(t) u(t)应用零阶保持法即假设 u ( t ) u(t) u(t)在采样时刻 t k t_k tk​和 t k 1 t_{k1} tk1​之间是恒定的此时我们可以将 u ( t ) u(t) u(t)当做常数项从积分项中取出 ∫ t k t k 1 e A ( t − τ ) B u ( τ ) d τ ∫ t k t k 1 e A ( t k 1 − τ ) d τ B u ( t k ) (15) \int_{t_{k}}^{t_{k1}} e^{A(t-\tau)} B u(\tau) d \tau \int_{t_{k}}^{t_{k1}} e^{A(t_{k1}-\tau)} d \tau B u(t_k) \tag{15} ∫tk​tk1​​eA(t−τ)Bu(τ)dτ∫tk​tk1​​eA(tk1​−τ)dτBu(tk​)(15) 离散时间状态方程构建将公式(15)的积分结果代入到公式(14)中同时使用 T t k 1 − t k Tt_{k1}-t_k Ttk1​−tk​​进行化简我们可以得到 x ( t k 1 ) e A T x ( t k ) ∫ t k t k 1 e A ( t k 1 − τ ) d τ B u ( t k ) (16) x(t_{k1})e^{AT}x(t_{k})\int_{t_{k}}^{t_{k1}} e^{A(t_{k1}-\tau)} d \tau Bu\left(t_k\right) \tag{16} x(tk1​)eATx(tk​)∫tk​tk1​​eA(tk1​−τ)dτBu(tk​)(16) 引入新变量 λ t k 1 − τ \lambdat_{k1}-\tau λtk1​−τ对原积分进行简化得到 x ( t k 1 ) e A T x ( t k ) B u ( t k ) ∫ 0 T e A τ d τ (17) x(t_{k1})e^{AT}x(t_{k})Bu\left(t_k\right)\int_{0}^{T} e^{A\tau} d \tau \tag{17} x(tk1​)eATx(tk​)Bu(tk​)∫0T​eAτdτ(17) 这里涉及到矩阵作为指数的积分这个部分我是查阅一些资料得到的结果 ∫ 0 T e A τ d τ A − 1 ( e A T − I ) (18) \int_{0}^{T} e^{A\tau} d \tauA^{-1}(e^{AT}- I) \tag{18} ∫0T​eAτdτA−1(eAT−I)(18) 最终我们得到了离散时间状态方程 x ( t k 1 ) e A T x ( t k ) ( e A T − I ) A − 1 B u ( t k ) (19) x(t_{k1})e^{AT}x(t_{k})(e^{AT}- I)A^{-1}B u\left(t_k\right) \tag{19} x(tk1​)eATx(tk​)(eAT−I)A−1Bu(tk​)(19) 3. SSM离散化结果 对比公式(19)和Vision Mamba论文中的离散化结果 两者形式基本一致至此我们完成了SSM的离散化过程的完整推导。
http://www.w-s-a.com/news/198879/

相关文章:

  • 成都市网站建设服务商怎么进网站后台管理系统
  • 企业网站站内优化30岁做网站编辑
  • 与安网站建设网站建设征求意见稿
  • 学校网站推广做网站手把手
  • 网站开发遇到的难题wordpress文章调用
  • 网站建设做的好在线logo免费设计生成器标智客
  • 郑州做网站齿轮网站排名怎么做 site
  • 船员专用网站开发建议wordpress 图片占用id
  • 桌面软件开发跟网站开发那个上海网站备案在哪里查询
  • 罗湖网站建设陕西省建设网官网住房和城乡厅官网
  • 做一个网站的详细教学wordpress 忘记用户名密码
  • 建设银行的网站是多少wordpress添加新页面跳转
  • 网站设计费用抓取网站访客qq号码
  • 驾校视频网站模板郑州网站建设价格
  • 上海 有哪些做网站的公司成都企业网站备案流程
  • 移动端快速建站的方法青海公司网站建设
  • 网站重新搭建程序要多少钱移动互联网应用的使用情况
  • 学建站论坛给别人做网站怎么赚钱吗
  • 响应式网站代码校友会网站建设的目的
  • 北京公司网站网站建设html模板
  • 专门做医疗器械的网站免费网页制作系统团队
  • 网站开发技术 html临夏网站建设
  • flash网站模板免费下载拍卖网站开发多少钱
  • 北京网站建设制作颍州网站建设
  • 网站制作报价表做网站上海公司
  • 简洁大气蓝色文章资讯网站百度搜索广告推广
  • 河南建设工程协会网站网站收银系统建设
  • 网站制作 服务企业网站案例展示
  • 咸宁网站建设wordpress手动降级
  • 昆明做网站建设怎么样做网站赚钱全攻略