当前位置: 首页 > news >正文

辽宁pc网站建设开发重庆手机网站推广方法

辽宁pc网站建设开发,重庆手机网站推广方法,wordpress插件后台慢,百度关键词搜索量查询文章目录 1. 概述2. 泰勒公式3. 雅可比矩阵4. 经典牛顿法4.1 经典牛顿法理论4.2 牛顿迭代法解求方程根4.3 牛顿迭代法解求方程根 Python 5. 梯度下降和经典牛顿法5.1 线搜索方法5.2 经典牛顿法 6. 凸优化问题6.1 约束问题6.1 凸集组合 Mit麻省理工教授视频如下#xff1a;逐步… 文章目录 1. 概述2. 泰勒公式3. 雅可比矩阵4. 经典牛顿法4.1 经典牛顿法理论4.2 牛顿迭代法解求方程根4.3 牛顿迭代法解求方程根 Python 5. 梯度下降和经典牛顿法5.1 线搜索方法5.2 经典牛顿法 6. 凸优化问题6.1 约束问题6.1 凸集组合 Mit麻省理工教授视频如下逐步最小化一个函数 1. 概述 主要讲的是无约束情况下的最小值问题。涉及到如下 矩阵求导泰勒公式函数到向量的转换梯度下降牛顿法梯度下降 2. 泰勒公式 我们之前在高等数学中学过关于f(x)的泰勒展开如下 定义 lim ⁡ x → a h k ( x ) 0 \lim\limits_{x\to a}h_k(x)0 x→alim​hk​(x)0 f ( x ) f ( a ) f ′ ( a ) ( x − a ) f ′ ′ ( a ) 2 ! ( x − a ) 2 ⋯ f ( k ) ( a ) k ! ( x − a ) k h k ( x ) ( x − a ) k \begin{equation} f(x)f(a)f(a)(x-a)\frac{f(a)}{2!}(x-a)^2\cdots\frac{f^{(k)}(a)}{k!}(x-a)^kh_k(x)(x-a)^k \end{equation} f(x)f(a)f′(a)(x−a)2!f′′(a)​(x−a)2⋯k!f(k)(a)​(x−a)khk​(x)(x−a)k​​ 那么我们只提取二次项 x Δ x → x ; x → a x\Delta x \rightarrow x;x\rightarrow a xΔx→x;x→a 可得如下 f ( x Δ x ) ≈ f ( x ) f ′ ( x ) Δ x f ′ ′ ( x ) 2 ! Δ x 2 \begin{equation} f(x\Delta x)\approx f(x)f(x)\Delta x\frac{f(x)}{2!}\Delta x^2 \end{equation} f(xΔx)≈f(x)f′(x)Δx2!f′′(x)​Δx2​​上面的公式中x为标量现在我们需要用到向量 x a , b a,b a,b均为1维列向量S为对称矩阵时我们可得得到如下 a T b c , x T S x d → c , d 均为标量 \begin{equation} a^Tbc,x^TSxd\rightarrow c,d均为标量 \end{equation} aTbc,xTSxd→c,d均为标量​​定义如下 x [ x 1 x 2 ⋯ x n ] T , f [ f 1 f 2 ⋯ f n ] T \begin{equation} x\begin{bmatrix}x_1x_2\cdotsx_n\end{bmatrix}^T,f\begin{bmatrix}f_1f_2\cdotsf_n\end{bmatrix}^T \end{equation} x[x1​​x2​​⋯​xn​​]T,f[f1​​f2​​⋯​fn​​]T​​ f ′ ( x ) ∇ F [ ∂ f ∂ x 1 ∂ f ∂ x 1 ⋯ ∂ f ∂ x n ] T → f ′ ( x ) Δ x ( Δ x ) T ∇ F ( x ) \begin{equation} f(x)\nabla F\begin{bmatrix}\frac{\partial f}{\partial x_1}\frac{\partial f}{\partial x_1}\cdots\frac{\partial f}{\partial x_n}\end{bmatrix}^T \rightarrow f(x)\Delta x(\Delta x)^T \nabla F(x) \end{equation} f′(x)∇F[∂x1​∂f​​∂x1​∂f​​⋯​∂xn​∂f​​]T→f′(x)Δx(Δx)T∇F(x)​​ H j k H_{jk} Hjk​为hessian matrix具有对称性 f ′ ′ ( x ) H j k ∂ 2 F ∂ x j ⋅ ∂ x k → f ′ ′ ( x ) 2 ! Δ x 2 1 2 ( Δ x ) T H j k ( Δ x ) \begin{equation} f(x)H_{jk}\frac{\partial^2F}{\partial x_j\cdot \partial x_k}\rightarrow \frac{f(x)}{2!}\Delta x^2\frac{1}{2}(\Delta x)^T H_{jk}(\Delta x) \end{equation} f′′(x)Hjk​∂xj​⋅∂xk​∂2F​→2!f′′(x)​Δx221​(Δx)THjk​(Δx)​​整理上述公式可得 F ( x Δ x ) ≈ F ( x ) ( Δ x ) T ∇ F ( x ) 1 2 ( Δ x ) T H j k ( Δ x ) \begin{equation} F(x\Delta x)\approx F(x)(\Delta x)^T \nabla F(x)\frac{1}{2}(\Delta x)^T H_{jk}(\Delta x) \end{equation} F(xΔx)≈F(x)(Δx)T∇F(x)21​(Δx)THjk​(Δx)​​ 3. 雅可比矩阵 假设有一个m维度向量函数 f ( x ) [ f 1 ( x ) f 2 ( x ) ⋯ f m ( x ) ] T f(x)\begin{bmatrix}f_1(x)f_2(x)\cdots f_m(x)\end{bmatrix}^T f(x)[f1​(x)​f2​(x)​⋯fm​(x)​]T[列向量],其中 x [ x 1 x 2 ⋯ x n ] T x\begin{bmatrix}x_1x_2\cdotsx_n\end{bmatrix}^T x[x1​​x2​​⋯​xn​​]T是一个n维输入向量雅可比矩阵J是一个 m × n m\times n m×n的矩阵其元素由函数的偏导数组成雅可比矩阵第i行第j列表示的是 f i ( x ) f_i(x) fi​(x)对 x i x_i xi​的偏导 J i j ∂ f i ( x ) ∂ x j \begin{equation} J_{ij}\frac{\partial f_i(x)}{\partial x_j} \end{equation} Jij​∂xj​∂fi​(x)​​​ 本质上就是函数值 f i ( x ) f_i(x) fi​(x)对 x i x_i xi​的每个元素求导 第一步假设 f i ( x ) f_i(x) fi​(x)是常数 ∂ f i ( x ) ∂ X \frac{\partial f_i(x)}{\partial X} ∂X∂fi​(x)​为分子布局遵循标量不变向量拉伸原则 XY拉伸术分子布局X横向拉Y纵向拉可得如下 ∂ f i ( x ) ∂ X [ ∂ f i ( x ) ∂ x 1 ∂ f i ( x ) ∂ x 2 ⋯ ∂ f i ( x ) ∂ x n ] \begin{equation} \frac{\partial f_i(x)}{\partial X} \begin{bmatrix} \frac{\partial f_i(x)}{\partial x_1} \frac{\partial f_i(x)}{\partial x_2} \cdots \frac{\partial f_i(x)}{\partial x_n} \end{bmatrix} \end{equation} ∂X∂fi​(x)​[∂x1​∂fi​(x)​​∂x2​∂fi​(x)​​⋯​∂xn​∂fi​(x)​​]​​ 第二步假设 f ( x ) f(x) f(x)为向量 ∂ f ( x ) ∂ X \frac{\partial f(x)}{\partial X} ∂X∂f(x)​为分子布局遵循标量不变向量拉伸原则 XY拉伸术分子布局X横向拉Y 纵向拉可得如下 J [ ∂ f 1 ( x ) ∂ x 1 ∂ f 1 ( x ) ∂ x 2 ⋯ ∂ f 1 ( x ) ∂ x n ∂ f 2 ( x ) ∂ x 1 ∂ f 2 ( x ) ∂ x 2 ⋯ ∂ f 2 ( x ) ∂ x n ⋮ ⋮ ⋯ ⋮ ∂ f m ( x ) ∂ x 1 ∂ f m ( x ) ∂ x 2 ⋯ ∂ f m ( x ) ∂ x n ] \begin{equation} \mathrm{J} \begin{bmatrix} \frac{\partial f_1(x)}{\partial x_1}\frac{\partial f_1(x)}{\partial x_2}\cdots\frac{\partial f_1(x)}{\partial x_n}\\\\ \frac{\partial f_2(x)}{\partial x_1}\frac{\partial f_2(x)}{\partial x_2}\cdots\frac{\partial f_2(x)}{\partial x_n} \\\\ \vdots\vdots\cdots\vdots\\\\\ \frac{\partial f_m(x)}{\partial x_1}\frac{\partial f_m(x)}{\partial x_2}\cdots \frac{\partial f_m(x)}{\partial x_n} \end{bmatrix} \end{equation} J ​∂x1​∂f1​(x)​∂x1​∂f2​(x)​⋮ ∂x1​∂fm​(x)​​∂x2​∂f1​(x)​∂x2​∂f2​(x)​⋮∂x2​∂fm​(x)​​⋯⋯⋯⋯​∂xn​∂f1​(x)​∂xn​∂f2​(x)​⋮∂xn​∂fm​(x)​​ ​​​ 泰勒公式1阶展开可得 f ( x Δ x ) f ( x ) f ′ ( x ) Δ x \begin{equation} f(x\Delta x)f(x)f(x)\Delta x \end{equation} f(xΔx)f(x)f′(x)Δx​​ 转换成雅可比矩阵可得 f ( x Δ x ) f ( x ) J j k Δ x ; J j k ∂ f j ( x ) ∂ x k \begin{equation} f(x\Delta x)f(x)\mathrm{J}_{jk}\Delta x;\mathrm{J}_{jk}\frac{\partial f_j(x)}{\partial x_k} \end{equation} f(xΔx)f(x)Jjk​Δx;Jjk​∂xk​∂fj​(x)​​​ 4. 经典牛顿法 4.1 经典牛顿法理论 我们已经知道了函数的二阶泰勒展开表示如下 F ( x Δ x ) ≈ F ( x ) ( Δ x ) T ∇ F ( x ) 1 2 ( Δ x ) T H j k ( Δ x ) \begin{equation} F(x\Delta x)\approx F(x)(\Delta x)^T \nabla F(x)\frac{1}{2}(\Delta x)^T H_{jk}(\Delta x) \end{equation} F(xΔx)≈F(x)(Δx)T∇F(x)21​(Δx)THjk​(Δx)​​ 一般如果在 x ∗ x^* x∗处取得最小值那么其导数为0现在我们求导可得 d F ( x ) d Δ x 0 ; ( Δ x ) T ∇ F ( x ) d Δ x ∇ F ( x ) ; d 1 2 ( Δ x ) T H j k ( Δ x ) d Δ x H j k Δ x ; \begin{equation} \frac{\mathrm{d}F(x)}{\mathrm{d}\Delta x}0;\frac{(\Delta x)^T \nabla F(x)}{\mathrm{d}\Delta x}\nabla F(x);\frac{\mathrm{d}\frac{1}{2}(\Delta x)^T H_{jk}(\Delta x)}{\mathrm{d}\Delta x}H_{jk}\Delta x; \end{equation} dΔxdF(x)​0;dΔx(Δx)T∇F(x)​∇F(x);dΔxd21​(Δx)THjk​(Δx)​Hjk​Δx;​​ d F ( x Δ x ) d Δ x 0 ∇ F ( x ) H j k Δ x 0 \begin{equation} \frac{\mathrm{d}F(x\Delta x)}{\mathrm{d}\Delta x}0\nabla F(x)H_{jk}\Delta x0 \end{equation} dΔxdF(xΔx)​0∇F(x)Hjk​Δx0​​当 H j k J j k H_{jk}\mathrm{J}_{jk} Hjk​Jjk​可逆时 Δ x x k 1 − x k \Delta xx_{k1}-x_k Δxxk1​−xk​可得 − [ H j k ] − 1 ∇ F ( x ) x k 1 − x k → x k 1 x k − [ J j k ] − 1 ∇ F ( x ) \begin{equation} -[H_{jk}]^{-1}\nabla F(x)x_{k1}-x_k\rightarrow x_{k1}x_k-[\mathrm{J}_{jk}]^{-1}\nabla F(x) \end{equation} −[Hjk​]−1∇F(x)xk1​−xk​→xk1​xk​−[Jjk​]−1∇F(x)​​我们定义 ∇ F ( x ) f ( x k ) \nabla F(x)f(x_k) ∇F(x)f(xk​), J j k J x k \mathrm{J}_{jk}\mathrm{J}_{x_k} Jjk​Jxk​​ x k 1 x k − [ J x k ] − 1 f ( x k ) \begin{equation} x_{k1}x_k-[\mathrm{J}_{x_k}]^{-1}f(x_k) \end{equation} xk1​xk​−[Jxk​​]−1f(xk​)​​ 4.2 牛顿迭代法解求方程根 已知 f ( x ) x 2 − 9 0 f(x)x^2-90 f(x)x2−90用牛顿迭代的方法求解方程的根根据迭代公式可得 f ′ ( x ) J x k 2 x , f ( x k ) x k 2 − 9 f(x)\mathrm{J}_{x_k}2x,f(x_k)x_k^2-9 f′(x)Jxk​​2x,f(xk​)xk2​−9 x k 1 x k − [ J x k ] − 1 f ( x k ) → x k 1 x k − f ( x k ) J x k \begin{equation} x_{k1}x_k-[\mathrm{J}_{x_k}]^{-1}f(x_k)\rightarrow x_{k1}x_k-\frac{f(x_k)}{\mathrm{J}_{x_k}} \end{equation} xk1​xk​−[Jxk​​]−1f(xk​)→xk1​xk​−Jxk​​f(xk​)​​​整理可得 x k 1 x k − x k 2 − 9 2 x k 1 2 x k 9 2 x k \begin{equation} x_{k1}x_k-\frac{x_k^2-9}{2x_k}\frac{1}{2}x_k\frac{9}{2x_k} \end{equation} xk1​xk​−2xk​xk2​−9​21​xk​2xk​9​​​收敛依据 判断新的近似值 x k 1 x_{k1} xk1​与当前值 x k x_k xk​之间的差距是否小于某个值 ϵ 1 0 − 10 \epsilon10^{-10} ϵ10−10如果小于该值则认为收敛否则继续迭代。我们先设置初始值 x 0 2 x_02 x0​2可得 x 1 x_1 x1​ x 1 1 2 x 0 9 2 x 0 3.25 ; \begin{equation} x_{1}\frac{1}{2}x_0\frac{9}{2x_0}3.25; \end{equation} x1​21​x0​2x0​9​3.25;​​继续迭代得 x 2 x_2 x2​ x 2 1 2 x 1 9 2 x 1 3.0096153846153846 ; \begin{equation} x_{2}\frac{1}{2}x_1\frac{9}{2x_1}3.0096153846153846; \end{equation} x2​21​x1​2x1​9​3.0096153846153846;​​继续迭代得 x 3 x_3 x3​ x 3 1 2 x 2 9 2 x 2 3.000015360039322 \begin{equation} x_{3}\frac{1}{2}x_2\frac{9}{2x_2}3.000015360039322 \end{equation} x3​21​x2​2x2​9​3.000015360039322​​继续迭代得 x 4 x_4 x4​ x 4 1 2 x 3 9 2 x 3 3.0000000000393214 \begin{equation} x_{4}\frac{1}{2}x_3\frac{9}{2x_3}3.0000000000393214 \end{equation} x4​21​x3​2x3​9​3.0000000000393214​​可得 x 2 − 9 0 x^2-90 x2−90的解为 x 1 ∗ 3 x_1^*3 x1∗​3,同理初始化为 x 0 − 2 x_0-2 x0​−2 可得 x 2 ∗ − 3 x_2^*-3 x2∗​−3 4.3 牛顿迭代法解求方程根 Python 代码 Python代码如下 def newton_raphson(f, f_prime, x0, tol1e-10, max_iter100):x x0for i in range(max_iter):fx f(x)fpx f_prime(x)# Newton-Raphson iterationx_new x - fx / fpxprint(fIteration {i 1}: x {x_new})if abs(x_new - x) tol:return x_newx x_newraise ValueError(Newton-Raphson method did not converge)# Define the function and its first derivative f lambda x: x ** 2 - 9 f_prime lambda x: 2 * x# Initial guesses initial_guesses [2, -2]# Find the roots for x0 in initial_guesses:root newton_raphson(f, f_prime, x0)print(fThe root starting from {x0} is: {root})运行结果 Iteration 1: x 3.25 Iteration 2: x 3.0096153846153846 Iteration 3: x 3.000015360039322 Iteration 4: x 3.0000000000393214 Iteration 5: x 3.0 The root starting from 2 is: 3.0 Iteration 1: x -3.25 Iteration 2: x -3.0096153846153846 Iteration 3: x -3.000015360039322 Iteration 4: x -3.0000000000393214 Iteration 5: x -3.0 The root starting from -2 is: -3.05. 梯度下降和经典牛顿法 对于无约束问题的梯度下降我们一般有两种方法 5.1 线搜索方法 运用泰勒一阶信息迭代方向为负梯度方向 迭代方程 x k 1 x k α k p k \begin{equation} x_{k1}x_k \alpha_k p_k \end{equation} xk1​xk​αk​pk​​​方向 p k p_k pk​负梯度方向 − ∇ F -\nabla F −∇F步长 α k s k \alpha_ks_k αk​sk​深度学习中叫学习率更新后的方程如下 x k 1 x k − s k ∇ F \begin{equation} x_{k1}x_k -s_k \nabla F \end{equation} xk1​xk​−sk​∇F​​ 5.2 经典牛顿法 运用泰勒二阶信息迭代方向为牛顿方向迭代步长为 α 1 1 \alpha_11 α1​1 迭代方程为,hessian matrix- H j k H_{jk} Hjk​可逆 x k 1 x k − [ H j k ] − 1 ∇ F ( x ) \begin{equation} x_{k1}x_k-[H_{jk}]^{-1}\nabla F(x) \end{equation} xk1​xk​−[Hjk​]−1∇F(x)​​经典牛顿法为二次性收敛速度非常快具体分析请参考如下博客 [优化算法]经典牛顿法 6. 凸优化问题 6.1 约束问题 我们定义凸函数为 f ( x ) f(x) f(x)凸集为 K \mathrm{K} K,我们的目的是为了求得凸函数 f ( x ) f(x) f(x)的最小值 min ⁡ x ∈ K f ( x ) K : A x b \begin{equation} \min\limits_{x\in K} f(x) \mathrm{K}:Axb \end{equation} x∈Kmin​f(x)K:Axb​​ f ( x ) f(x) f(x)表示的是所有在碗内部上的和碗内表面上的点求的是在碗内表面的上的最小值碗的形状就是约束条件 A x b Axb Axb 6.1 凸集组合 如果 x 1 , x 2 x_1,x_2 x1​,x2​均在凸集里面则由 x 1 , x 2 x_1,x_2 x1​,x2​组成的直线L在凸集里面 如果 x 1 , x 2 x_1,x_2 x1​,x2​分别在不同的凸集里面则由 x 1 , x 2 x_1,x_2 x1​,x2​组成的直线L不在凸集里面 小结合并图集里面组合的直线不在凸集里面。如果 x 1 , x 2 x_1,x_2 x1​,x2​都在不同的凸集里面的交集里面则由 x 1 , x 2 x_1,x_2 x1​,x2​组成的直线L在凸集中 假设我们有两个凸函数 F 1 ( x ) , F 2 ( x ) F_1(x),F_2(x) F1​(x),F2​(x),我们定义如下 min ⁡ ( x ) min ⁡ [ F 1 ( x ) , F 2 ( x ) ] ; max ⁡ ( x ) max ⁡ [ F 1 ( x ) , F 2 ( x ) ] ; \begin{equation} \min(x)\min[F_1(x),F_2(x)];\max(x)\max[F_1(x),F_2(x)]; \end{equation} min(x)min[F1​(x),F2​(x)];max(x)max[F1​(x),F2​(x)];​​如果两个凸集相交那么相交的凸集最大值最小值如下 min ⁡ ( x ) min ⁡ [ F 1 ( x ) , F 2 ( x ) ] − 非凸 max ⁡ ( x ) max ⁡ [ F 1 ( x ) , F 2 ( x ) ] − 凸 ; \begin{equation} \min(x)\min[F_1(x),F_2(x)]- 非凸\max(x)\max[F_1(x),F_2(x)]-凸; \end{equation} min(x)min[F1​(x),F2​(x)]−非凸max(x)max[F1​(x),F2​(x)]−凸;​​凸函数判断 d 2 f ( x ) d x 2 ≥ 0 \begin{equation} \frac{\mathrm{d}^2f(x)}{\mathrm{d}x^2}\ge 0 \end{equation} dx2d2f(x)​≥0​​
http://www.w-s-a.com/news/900890/

相关文章:

  • wordpress制作单页网站导航页面鞍山信息港招聘信息
  • 屏蔽ip地址访问网站自己做衣服的网站
  • 网站建设 域名业务 邮箱哪里有网站建设中心
  • 免费网站赚钱重庆建设摩托车股份有限公司
  • 合肥水运建设工程监理网站自己买服务器能在wordpress建网站
  • wordpress积分商城主题整站seo排名要多少钱
  • 鲜花网站建设的利息分析网站设计与制作专业
  • 深圳网站建设排名做网站的公司高创
  • 杭州哪家做外贸网站全国物流网站有哪些平台
  • 企业网站建设个人博客鞍山晟宇网站建设
  • 广东省自然资源厅网站h5移动端网站模板下载
  • 网站建设和安全管理制度云南九泰建设工程有限公司官方网站
  • 网站的关键词和描述做外贸家纺资料网站
  • 绥化市建设工程网站招投标地址链接怎么生成
  • 网站制作设计发展前景网页链接制作生成二维码
  • 廊坊哪里有制作手机网站的企业网站建设费用财务处理
  • 手机网站建设书籍工商咨询服务
  • 麻花星空影视传媒制作公司网站美食网站网站建设定位
  • 网站的切图是谁来做学会网站 建设
  • 交通局网站建设方案答辩ppt模板免费下载 素材
  • 个人摄影网站推介网手机版
  • 有哪些免费的视频网站网站开发和竞价
  • 学校网站如何做广州商城型网站建设
  • 微网站建设哪家便宜易优建站系统
  • 推荐做木工的视频网站毕业设计做的网站抄袭
  • 网站导航页面制作wordpress调用文章阅读量
  • app小程序网站开发品牌购物网站十大排名
  • 用wordpress做购物网站龙岩品牌设计
  • 网站开发是指wordpress系统在线升级
  • 网站建设运营的灵魂是什么意思页面跳转中