seo门户网站建设方案,如何用word做网站地图,孝感市最新消息,做网站的证书非线性最小二乘
目录 文章目录 非线性最小二乘目录 [toc]1 非线性最小二乘估计3 非线性最小二乘的实现 1 非线性最小二乘估计
在经典最小二乘法估计中#xff0c;假定被解释变量的条件期望是关于参数的线性函数#xff0c;例如 E ( y ∣ x ) a b x E(y|x) abx E(y∣x)a…非线性最小二乘
目录 文章目录 非线性最小二乘目录 [toc]1 非线性最小二乘估计3 非线性最小二乘的实现
1 非线性最小二乘估计
在经典最小二乘法估计中假定被解释变量的条件期望是关于参数的线性函数例如 E ( y ∣ x ) a b x E(y|x) abx E(y∣x)abx 其中 a , b a,b a,b为待估参数 E ( y ∣ x ) E(y|x) E(y∣x)是关于参数 a , b a,b a,b的线性函数。但 E ( y ∣ x ) E(y|x) E(y∣x)是关于参数的非线性函数则利用ols求出的正规方程组没有解析解。只能通过相关数值计算。考虑一个简单的非线性模型 Y i β X 1 i β 2 X 2 i ε i Y_{i}\beta X_{1 i}\beta^{2} X_{2 i}\varepsilon_{i} YiβX1iβ2X2iεi 其中扰动项 ε i \varepsilon_i εi满足 E ( ε i ) 0 , var ( ε i ) σ 2 \mathrm{E}\left(\varepsilon_{i}\right)0,\operatorname{var}\left(\varepsilon_{i}\right)\sigma^{2} E(εi)0,var(εi)σ2,且为独立同分布。其残差平方和为 S ( β ) ∑ i 1 n ε i 2 ∑ i 1 n [ Y i − f ( X i , β ) ] 2 ∑ i 1 n [ Y i − β X 1 i − β 2 X 2 i ] 2 \begin{aligned} S(\beta) \sum_{i1}^{n} \varepsilon_{i}^{2}\sum_{i1}^{n}\left[Y_{i}-f\left(X_{i}, \beta\right)\right]^{2} \\ \sum_{i1}^{n}\left[Y_{i}-\beta X_{1 i}-\beta^{2} X_{2 i}\right]^{2} \end{aligned} S(β)i1∑nεi2i1∑n[Yi−f(Xi,β)]2i1∑n[Yi−βX1i−β2X2i]2 为了使回归线尽可能接近观测值要求残差平方和最小。根据微积分的知识 d S d β 2 ∑ i 1 n [ Y i − f ( X i , β ) ] ( − d f ( X i , β ) d β ) 2 ∑ i 1 n [ Y i − β X 1 i − β 2 X 2 i ] [ − X 1 i − 2 β X 2 i ] 0 \begin{aligned} \frac{\mathrm{d} S}{\mathrm{~d} \beta} 2 \sum_{i1}^{n}\left[Y_{i}-f\left(X_{i}, \beta\right)\right]\left(-\frac{\mathrm{d} f\left(X_{i}, \beta\right)}{\mathrm{d} \beta}\right) \\ 2 \sum_{i1}^{n}\left[Y_{i}-\beta X_{1 i}-\beta^{2} X_{2 i}\right]\left[-X_{1 i}-2 \beta X_{2 i}\right]0 \end{aligned} dβdS2i1∑n[Yi−f(Xi,β)](−dβdf(Xi,β))2i1∑n[Yi−βX1i−β2X2i][−X1i−2βX2i]0 整理得 2 β 3 ∑ i 1 n X 2 i 2 3 β 2 ∑ i 1 n X 1 i X 2 i β ( ∑ i 1 n X 1 i 2 − 2 ∑ i 1 n X 2 i Y i ) − ∑ i 1 n X 1 i Y i 0 2 \beta^{3} \sum_{i1}^{n} X_{2 i}^{2}3 \beta^{2} \sum_{i1}^{n} X_{1 i} X_{2 i}\beta\left(\sum_{i1}^{n} X_{1 i}^{2}-2 \sum_{i1}^{n} X_{2 i} Y_{i}\right)-\sum_{i1}^{n} X_{1 i} Y_{i}0 2β3i1∑nX2i23β2i1∑nX1iX2iβ(i1∑nX1i2−2i1∑nX2iYi)−i1∑nX1iYi0 这是关于参数 β \beta β的三次函数。尽管三次函数存在解析解利用卡丹或盛金公式其结果极为复杂。若上述三次方程存在实根 β i ( i 1 , 2 , 3 ) \beta_i(i1,2,3) βi(i1,2,3)最多三个则将 β i \beta_i βi代入残差平方和取 S ( β ) S(\beta) S(β)最小所对应的 β i \beta_i βi。上述例子中被解释变量条件期望是关于参数的二次函数如果将这种函数形式改为指数、对数或三角函数形式则一般不存在解析解。 因此数值分析自然成为解决上述问题的有力武器。考虑一般化的非线性回归问题设总体回归模型满足 Y f ( X , β ) ε Yf(X, \beta)\varepsilon Yf(X,β)ε 对应的残差平方和为 S ( β ) ∑ i 1 n [ Y i − f ( X i , β ) ] 2 S(\beta)\sum_{i1}^{n}\left[Y_{i}-f\left(X_{i}, \beta\right)\right]^{2} S(β)i1∑n[Yi−f(Xi,β)]2 要使其最小化需要满足一阶条件 d S d β − 2 [ ∑ i 1 n [ Y i − f ( X i , β ) ] ( − d f ( X i , β ) d β ) ] 0 \frac{\mathrm{d} S}{\mathrm{~d} \beta}-2\left[\sum_{i1}^{n}\left[Y_{i}-f\left(X_{i}, \beta\right)\right]\left(-\frac{\mathrm{d} f\left(X_{i}, \boldsymbol{\beta}\right)}{\mathrm{d} \beta}\right)\right]0 dβdS−2[i1∑n[Yi−f(Xi,β)](−dβdf(Xi,β))]0 显然上述问题不存在解析解因此考虑对 f ( X i , β ) f(X_i, \beta) f(Xi,β)进行一阶泰勒展开。设参数向量 β \beta β的初始值为 β 1 \beta_1 β1,则可以在 β 1 \beta_1 β1附近找到函数 f ( X i , β ) f(X_i, \beta) f(Xi,β)使得 f ( X i , β ) ≈ f ( X i , β 1 ) d f ( X i , β ) d β ∣ β β 1 ( β − β 1 ) f\left(X_{i}, \beta\right) \approx f\left(X_{i}, \beta_{1}\right)\frac{\mathrm{d} f\left(X_{i}, \beta\right)}{\mathrm{d} \beta} \mid_{\beta \beta_{1}}\left(\beta-\beta_{1}\right) f(Xi,β)≈f(Xi,β1)dβdf(Xi,β)∣ββ1(β−β1) 记 d f ( X i , β ) d β ∣ β 1 ≈ f ( X i , β ) − f ( X , β ) β − β 1 \left.\frac{\mathrm{d} f\left(X_{i}, \beta\right)}{\mathrm{d} \beta}\right|_{\beta_{1}} \approx \frac{f\left(X_{i}, \beta\right)-f(X, \beta)}{\beta-\beta_{1}} dβdf(Xi,β) β1≈β−β1f(Xi,β)−f(X,β)简记 X ~ i ( β 1 ) d f ( X i , β ) d β ∣ β 1 \widetilde{X}_{i}\left(\beta_{1}\right)\left.\frac{\mathrm{d} f\left(X_{i}, \beta\right)}{\mathrm{d} \beta}\right|_{\beta_{1}} X i(β1)dβdf(Xi,β) β1则 S ( β ) ∑ i 1 n [ Y i − f ( X i , β 1 ) − X ~ i ( β 1 ) ( β − β 1 ) ] 2 ∑ i 1 n [ Y ~ i ( β 1 ) − X i ( β 1 ) β ] 2 \begin{aligned} S(\beta) \sum_{i1}^{n}\left[Y_{i}-f\left(X_{i}, \beta_{1}\right)-\widetilde{X}_{i}\left(\beta_{1}\right)\left(\beta-\beta_{1}\right)\right]^{2} \\ \sum_{i1}^{n}\left[\widetilde{Y}_{i}\left(\beta_{1}\right)-X_{i}\left(\beta_{1}\right) \beta\right]^{2} \end{aligned} S(β)i1∑n[Yi−f(Xi,β1)−X i(β1)(β−β1)]2i1∑n[Y i(β1)−Xi(β1)β]2 其中 Y ~ i ( β 1 ) Y i − f ( X i , β 1 ) X ~ i ( β 1 ) β 1 \widetilde{Y}_{i}\left(\beta_{1}\right)Y_{i}-f\left(X_{i}, \beta_{1}\right)\widetilde{X}_{i}\left(\beta_{1}\right) \beta_{1} Y i(β1)Yi−f(Xi,β1)X i(β1)β1 给定初始值向量 β i \beta_i βi则 Y ~ i ( β 1 ) \widetilde{Y}_{i}\left(\beta_{1}\right) Y i(β1)与 X ~ i ( β 1 ) \widetilde{X}_{i}\left(\beta_{1}\right) X i(β1)可计算从而求出最小残差平方和。 S ( β ) S(\beta) S(β)对应的回归方程为 Y ~ i ( β 1 ) X ~ i ( β ) β ε i \widetilde{Y}_{i}\left(\beta_{1}\right)\widetilde{X}_{i}(\beta) \beta\varepsilon_{i} Y i(β1)X i(β)βεi 最小二乘估计量为 β 2 [ X ~ ( β 1 ) ′ X ~ ( β 1 ) ] − 1 X ~ ( β 1 ) ′ Y ~ ( β 1 ) \beta_{2}\left[\widetilde{X}\left(\beta_{1}\right)^{\prime} \widetilde{X}\left(\beta_{1}\right)\right]^{-1} \widetilde{X}\left(\beta_{1}\right)^{\prime} \widetilde{Y}\left(\beta_{1}\right) β2[X (β1)′X (β1)]−1X (β1)′Y (β1) 其中 X ~ ( β 1 ) [ X ~ 1 ( β 1 ) ⋮ X ~ n ( β 1 ) ] , Y ^ ( β 1 ) [ Y ~ 1 ( β 1 ) ⋮ Y ~ n ( β 1 ) ] \widetilde{X}\left(\beta_{1}\right)\left[\begin{array}{c} \widetilde{X}_{1}\left(\beta_{1}\right) \\ \vdots \\ \widetilde{X}_{n}\left(\beta_{1}\right) \end{array}\right], \quad \hat{Y}\left(\beta_{1}\right)\left[\begin{array}{c} \widetilde{Y}_{1}\left(\beta_{1}\right) \\ \vdots \\ \widetilde{Y}_{n}\left(\beta_{1}\right) \end{array}\right] X (β1) X 1(β1)⋮X n(β1) ,Y^(β1) Y 1(β1)⋮Y n(β1) 此时我们求出 β 2 \beta_2 β2,再将 β 2 \beta_2 β2作为初始值依次迭代计算得到关于向量参数 β i \beta_i βi的一个序列当且仅当 ∣ ∣ β ( k 1 ) − β ( k ) ∣ ∣ δ ||\beta^{(k1)}-\beta^{(k)}||\delta ∣∣β(k1)−β(k)∣∣δ 其中 δ 0 \delta0 δ0为事先预定的绝对误差。不难得到参数 β \beta β满足递推关系 β n 1 [ X ~ ( β n ) ′ X ~ ( β n ) ] − 1 X ~ ( β n ) ′ Y ~ ( β n ) [ X ~ ( β n ) ′ X ~ ( β n ) ] − 1 X ~ ( β n ) ′ [ Y − f ( X ~ , β n ) X ~ ( β n ) β n ] β n [ X ~ ( β n ) ′ X ~ ( β n ) ] − 1 X ~ ( β n ) ′ [ Y − f ( X , β n ) ] \begin{aligned} \boldsymbol{\beta}_{n1} \left[\widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)\right]^{-1} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime} \widetilde{Y}\left(\boldsymbol{\beta}_{n}\right) \\ \left[\widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)\right]^{-1} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime}\left[\boldsymbol{Y}-f\left(\widetilde{X}, \boldsymbol{\beta}_{n}\right)\widetilde{X}\left(\boldsymbol{\beta}_{n}\right) \boldsymbol{\beta}_{n}\right] \\ \boldsymbol{\beta}_{n}\left[\widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)\right]^{-1} \widetilde{X}\left(\boldsymbol{\beta}_{n}\right)^{\prime}\left[Y-f\left(X, \boldsymbol{\beta}_{n}\right)\right] \end{aligned} βn1[X (βn)′X (βn)]−1X (βn)′Y (βn)[X (βn)′X (βn)]−1X (βn)′[Y−f(X ,βn)X (βn)βn]βn[X (βn)′X (βn)]−1X (βn)′[Y−f(X,βn)] 通过证明随着样本容量 n → ∞ n\to\infty n→∞,参数 β \beta β估计量服从渐进正态分布即 β ~ ∼ N ( β , σ ^ 2 [ X ~ ( β ) ′ X ~ ( β ) ] − 1 ) , σ ^ 2 S ( β ~ ) n − 1 \widetilde{\beta} \sim N\left(\beta, \hat{\sigma}^{2}\left[\widetilde{X}(\beta)^{\prime} \widetilde{X}(\beta)\right]^{-1}\right), \hat{\sigma}^{2}\frac{S(\widetilde{\beta})}{n-1} β ∼N(β,σ^2[X (β)′X (β)]−1),σ^2n−1S(β ) 3 非线性最小二乘的实现
在R语言中可以适用nls函数实现非线性最小二乘法。以C-D函数为例
设一国产出取决于资本、劳动与全要素的投入即 Y A K α L β μ Y AK^{\alpha}L^{\beta}\mu YAKαLβμ 下面通过R代码运行实现对参数 α , β \alpha,\beta α,β的估计
t 1:12 #时间设定
Yc(26.74, 34.81, 44.72, 57.46, 73.84, 88.45, 105.82,126.16, 150.9, 181.6, 204.3, 222.8) #产出序列
Kc(23.66,30.55,38.12,46.77,56.45,67.15,78.92,91.67,105.5, 121.3, 128.6, 132.5) #资本序列
Lc(26, 28, 32, 36, 41, 45, 48, 52, 56, 60, 66, 70) #劳动投入序列
Cdnls - nls(Y~A*K^a*L^b,start list(A 0.1,a 0.5,b 0.5)) #非线性最小二乘,start为参数初始值向量
summary(Cdnls)
#-------------------运行结果---------------------------
#Formula: Y ~ A * K^a * L^b
Parameters:Estimate Std. Error t value Pr(|t|)
A 0.1129 0.0159 7.12 5.6e-05 ***
a 0.6568 0.0652 10.07 3.4e-06 ***
b 1.0298 0.1044 9.86 4.0e-06 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 1.7 on 9 degrees of freedomNumber of iterations to convergence: 9
Achieved convergence tolerance: 7.55e-06结果显示参数 α 0.6568 \alpha 0.6568 α0.6568, β 1.0298 \beta 1.0298 β1.0298。对比直接取对数的OLS,即估计 l n Y l n A α l n K β l n L e lnY lnA\alpha lnK\beta lnLe lnYlnAαlnKβlnLe
CDlm - lm(log(Y)~log(K)log(L)) #对数形式
summary(CDlm)
#--------------------运行结果--------------
Call:
lm(formula log(Y) ~ log(K) log(L))Residuals:Min 1Q Median 3Q Max
-0.02714 -0.00595 -0.00118 0.00764 0.02557 Coefficients:Estimate Std. Error t value Pr(|t|)
(Intercept) -2.0737 0.2355 -8.80 1.0e-05 ***
log(K) 0.6258 0.0916 6.83 7.6e-05 ***
log(L) 1.0379 0.1621 6.40 0.00012 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 0.0173 on 9 degrees of freedom
Multiple R-squared: 1, Adjusted R-squared: 0.999
F-statistic: 9.16e03 on 2 and 9 DF, p-value: 1.29e-15结果显示参数 α 0.6268 \alpha 0.6268 α0.6268, β 1.0379 \beta 1.0379 β1.0379。因此CD函数对数化的结果回归与非线性最小二乘回归的参数基本一致。但一些不能对数化的方程非线性最小二乘的作用更为明显。考虑真实模型 y 2 s i n ( x ) 4 c o s ( x ) y 2sin(x)4cos(x) y2sin(x)4cos(x) 接下来我们进行仿真模拟
set.seed(123) #随机种子
x - seq(1,100,by 0.1) #1-100步长为0.1
e - rnorm(length(x),0,1) #长度为序列x的长度服从标准正态分布的误差
y - 2*sin(x)4*cos(x)e #实际观测的被解释变量
plot(x,y,type o) #打印散点图nls1 - nls(y~a*sin(x)b*cos(x),start list(a 0,b 0)) #非线性最小二乘初始值设定为00
nls1
#-------------运行结果------------------
Nonlinear regression modelmodel: y ~ a * sin(x) b * cos(x)data: parent.frame()a b
1.92 4.03 residual sum-of-squares: 974Number of iterations to convergence: 1
Achieved convergence tolerance: 6.73e-10结果显示估计量 a 1.92 a 1.92 a1.92, b 4.03 b 4.03 b4.03与总体参数 a 2 , b 4 a 2,b 4 a2,b4即为接近 -END- 参考文献 王斌会(2015).计量经济学建模及R语言应用[M].北京大学出版社