当前位置: 首页 > news >正文

机关单位网站建设工作方案如何做视频网站 需要注意的地方

机关单位网站建设工作方案,如何做视频网站 需要注意的地方,讯杰网站建设,百度识别图片找图非线性回归是一种用于模拟变量之间复杂关系的强大工具。然而#xff0c;离群值的存在可能会显着扭曲结果#xff0c;导致参数估计不准确和预测不可靠。因此#xff0c;检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术离群值的存在可能会显着扭曲结果导致参数估计不准确和预测不可靠。因此检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术确保您获得可靠和准确的结果。 了解非线性回归 什么是非线性回归 非线性回归是回归分析的一种形式其中观测数据由模型参数的非线性组合函数建模并取决于一个或多个自变量。与线性回归不同它假设变量之间的直线关系非线性回归可以模拟更复杂的关系。 离群值检测的重要性 离群值是指显著偏离数据总体模式的数据点。在非线性回归的背景下离群值可能对模型产生不成比例的影响导致有偏的参数估计和较差的预测性能。检测和适当处理离群值对于保持回归分析的完整性至关重要。 非线性回归中离群值的检测方法 1.目视检查 散点图散点图是直观检查数据是否存在潜在离群值的简单而有效的方法。通过绘制因变量与自变量的关系图您可以确定与预期关系相差甚远的点。残差图残差图显示相对于自变量或拟合值的残差观测值和预测值之间的差异。离群值通常表现为具有较大残差的点这些点与其余数据显著偏离。 2.统计方法 学生化残差学生化残差是残差除以其标准差的估计值。它们遵循t分布从而更容易识别离群值。具有大于特定阈值的学生化残差的点例如2或3被认为是离群值。Cook距离Cook距离测量每个数据点对拟合值的影响。Cook距离大于特定阈值通常为4/n其中n为数据点数量的点被视为有影响力和潜在离群值。Hadi’s PotentialHadi’s Potential是一种结合杠杆和残差来识别影响点的度量。它在非线性回归中特别有用其中单独的杠杆可能不足以检测离群值。 3.鲁棒回归方法 最小绝对偏差LAD最小绝对偏差最小化绝对残差之和而不是残差平方之和。该方法对离群值不太敏感并提供了普通最小二乘OLS回归的稳健替代方案。M-估计M-估计通过使用减少离群值影响的损失函数来推广最大似然估计。常用的M估计量包括Huber’s T和Tukey’s Bigweight。最小二乘LTS最小二乘回归最小化最小平方残差的总和有效地忽略了可能由于离群值引起的最大残差。该方法在存在离群值的情况下提供稳健的参数估计。 非线性回归检测离群值实例 步骤1 导入相关模块库 import numpy as np import pandas as pd import statsmodels.api as sm import statsmodels.formula.api as smf import matplotlib.pyplot as plt import seaborn as sns from statsmodels.robust.robust_linear_model import RLM from statsmodels.robust.norms import HuberT, LeastSquares from sklearn.metrics import mean_squared_error步骤2 创建随机数据集 n 100 x np.linspace(0, 10, n) y 2.5 * np.sin(1.5 * x) np.random.normal(0, 0.5, n) # Adding some outliers x_outliers np.append(x, [1, 2, 3]) y_outliers np.append(y, [10, -10, 12]) data pd.DataFrame({tumor_size: x_outliers, metastasis_fraction: y_outliers})步骤3使用普通最小二乘回归拟合非线性模型 # Adding a nonlinear term for the regression model data[tumor_size_squared] data[tumor_size] ** 2 ols_model smf.ols(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit()步骤4可视化数据 plt.figure(figsize(12, 6)) plt.subplot(1, 2, 1) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) plt.plot(data[tumor_size], ols_model.fittedvalues, colorred) plt.title(Scatter Plot with OLS Fit)plt.subplot(1, 2, 2) sns.residplot(xols_model.fittedvalues, yols_model.resid) plt.title(Residual Plot) plt.show() 步骤5应用于回归模型 # Robust regression using Least Absolute Deviations (LAD) lad_model smf.quantreg(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit(q0.5)# Robust regression using M-Estimation with HuberT norm rlm_huber RLM(data[metastasis_fraction], sm.add_constant(data[[tumor_size, tumor_size_squared]]), MHuberT()).fit()步骤6使用统计方法识别离群值 # Studentized Residuals data[studentized_residuals] ols_model.get_influence().resid_studentized_internal# Cooks Distance data[cooks_distance] ols_model.get_influence().cooks_distance[0]# Hadis Potential (not directly available in statsmodels, so we use an approximation) data[leverage] ols_model.get_influence().hat_matrix_diag# Mark potential outliers outlier_indices data[(np.abs(data[studentized_residuals]) 2) | (data[cooks_distance] 4/(n-2)) | (data[leverage] 0.2)].index outliers data.loc[outlier_indices]步骤7比较不同方法的结果 # OLS model print(OLS Model Summary:) print(ols_model.summary())# LAD model print(\nLAD Model Summary:) print(lad_model.summary())# RLM model with HuberT norm print(\nRLM Model (HuberT) Summary:) print(rlm_huber.summary())# Goodness-of-fit measures print(\nGoodness-of-Fit Measures:) print(fOLS Mean Squared Error: {mean_squared_error(data[metastasis_fraction], ols_model.fittedvalues)}) print(fLAD Mean Squared Error: {mean_squared_error(data[metastasis_fraction], lad_model.fittedvalues)}) print(fRLM (HuberT) Mean Squared Error: {mean_squared_error(data[metastasis_fraction], rlm_huber.fittedvalues)})# Plotting the outliers plt.figure(figsize(12, 6)) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) sns.scatterplot(xtumor_size, ymetastasis_fraction, dataoutliers, colorred) plt.title(Scatter Plot with Outliers Highlighted) plt.show()输出 OLS Model Summary:OLS Regression Results Dep. Variable: metastasis_fraction R-squared: 0.125 Model: OLS Adj. R-squared: 0.107 Method: Least Squares F-statistic: 7.134 Date: Tue, 30 Jul 2024 Prob (F-statistic): 0.00127 Time: 21:15:45 Log-Likelihood: -237.57 No. Observations: 103 AIC: 481.1 Df Residuals: 100 BIC: 489.0 Df Model: 2 Covariance Type: nonrobust coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 2.6754 0.709 3.772 0.000 1.268 4.083 tumor_size -1.2510 0.332 -3.769 0.000 -1.910 -0.593 tumor_size_squared 0.1196 0.032 3.712 0.000 0.056 0.183Omnibus: 35.806 Durbin-Watson: 1.658 Prob(Omnibus): 0.000 Jarque-Bera (JB): 299.629 Skew: 0.732 Prob(JB): 8.64e-66 Kurtosis: 11.226 Cond. No. 142. Notes: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified.LAD Model Summary:QuantReg Regression Results Dep. Variable: metastasis_fraction Pseudo R-squared: 0.1515 Model: QuantReg Bandwidth: 2.178 Method: Least Squares Sparsity: 5.458 Date: Tue, 30 Jul 2024 No. Observations: 103 Time: 21:15:45 Df Residuals: 100Df Model: 2 coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 3.0050 0.785 3.828 0.000 1.447 4.563 tumor_size -1.6699 0.367 -4.545 0.000 -2.399 -0.941 tumor_size_squared 0.1686 0.036 4.729 0.000 0.098 0.239 RLM Model (HuberT) Summary:Robust linear Model Regression Results Dep. Variable: metastasis_fraction No. Observations: 103 Model: RLM Df Residuals: 100 Method: IRLS Df Model: 2 Norm: HuberT Scale Est.: mad Cov Type: H1 Date: Tue, 30 Jul 2024 Time: 21:15:45 No. Iterations: 11 coef std err z P|z| [0.025 0.975] -------------------------------------------------------------------------------------- const 2.5250 0.540 4.674 0.000 1.466 3.584 tumor_size -1.2436 0.253 -4.919 0.000 -1.739 -0.748 tumor_size_squared 0.1208 0.025 4.923 0.000 0.073 0.169 If the model instance has been used for another fit with different fit parameters, then the fit options might not be the correct ones anymore .Goodness-of-Fit Measures: OLS Mean Squared Error: 5.900980188225848 LAD Mean Squared Error: 6.09596526991115 RLM (HuberT) Mean Squared Error: 5.909805102901932总结 离群值检测是非线性回归分析的一个重要内容。通过采用目视检查统计方法和鲁棒的回归技术相结合研究人员可以确保准确可靠的参数估计。使用先进的方法如ROUT方法和蒙特卡罗模拟能进一步提高了分析的鲁棒性。正确处理离群值会产生更值得信赖的模型和更好的基于数据的决策。
http://www.w-s-a.com/news/733131/

相关文章:

  • 网站推广策划报告航空航天可以做游戏可以视频约会的网站
  • 云南建设学院的网站划分切片来做网站
  • 建设视频网站需要什么知识辽阳建设网站
  • 提供o2o网站建设打扑克网站推广软件
  • 制作简单门户网站步骤中国建设局网站查询
  • 漳州专业网站建设网站建设的面试要求
  • 有哪些网站是封面型汕头网站上排名
  • 自动优化网站软件没有了做的新网站做百度推广怎么弄
  • 高陵县建设局网站商标查询网站
  • 郑州建设网站哪家好东莞网络公司排行榜
  • 成都网站开发费用做行程的网站
  • 做地铁建设的公司网站手机网站首页布局设计
  • 福建亨立建设集团有限公司网站搜狗网页游戏大厅
  • 设计网站musil访问量大的网站选择多少流量的服务器何时
  • 公司网站包括哪些内容新网站怎样做外链
  • 淘宝宝贝链接怎么做相关网站广州好蜘蛛网站建设
  • 长春网站制作网页博山区住房和城乡建设局网站
  • 云南大学网站建设解析到网站怎样做
  • 网站维护的要求包括锦溪网站建设
  • 金站网.营销型网站学校安全教育网站建设
  • 临沂市建设局网站公示军事新闻头条2023
  • 购物网网站建设lamp 做网站
  • 做网站网站庄家html5网站开发技术
  • 无锡门户网站制作电话广告设计公司的未来
  • 白云区专业网站建设网页设计模拟试题答案
  • 毕业设计网站代做多少钱制作旅游网站设计概述
  • 网站开发维护运维无人在线电视剧免费观看
  • 电子商务网站建设开题报告展馆网站建设
  • 门户网站建设的背景和意义手机网站前
  • 国内免费视频素材无水印素材网站国家最新消息