当前位置: 首页 > news >正文

做优惠券网站需要淘宝哪些接口宣城做w网站的公司

做优惠券网站需要淘宝哪些接口,宣城做w网站的公司,百度一下搜索一下,流浪动物网站开发非线性回归是一种用于模拟变量之间复杂关系的强大工具。然而#xff0c;离群值的存在可能会显着扭曲结果#xff0c;导致参数估计不准确和预测不可靠。因此#xff0c;检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术离群值的存在可能会显着扭曲结果导致参数估计不准确和预测不可靠。因此检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术确保您获得可靠和准确的结果。 了解非线性回归 什么是非线性回归 非线性回归是回归分析的一种形式其中观测数据由模型参数的非线性组合函数建模并取决于一个或多个自变量。与线性回归不同它假设变量之间的直线关系非线性回归可以模拟更复杂的关系。 离群值检测的重要性 离群值是指显著偏离数据总体模式的数据点。在非线性回归的背景下离群值可能对模型产生不成比例的影响导致有偏的参数估计和较差的预测性能。检测和适当处理离群值对于保持回归分析的完整性至关重要。 非线性回归中离群值的检测方法 1.目视检查 散点图散点图是直观检查数据是否存在潜在离群值的简单而有效的方法。通过绘制因变量与自变量的关系图您可以确定与预期关系相差甚远的点。残差图残差图显示相对于自变量或拟合值的残差观测值和预测值之间的差异。离群值通常表现为具有较大残差的点这些点与其余数据显著偏离。 2.统计方法 学生化残差学生化残差是残差除以其标准差的估计值。它们遵循t分布从而更容易识别离群值。具有大于特定阈值的学生化残差的点例如2或3被认为是离群值。Cook距离Cook距离测量每个数据点对拟合值的影响。Cook距离大于特定阈值通常为4/n其中n为数据点数量的点被视为有影响力和潜在离群值。Hadi’s PotentialHadi’s Potential是一种结合杠杆和残差来识别影响点的度量。它在非线性回归中特别有用其中单独的杠杆可能不足以检测离群值。 3.鲁棒回归方法 最小绝对偏差LAD最小绝对偏差最小化绝对残差之和而不是残差平方之和。该方法对离群值不太敏感并提供了普通最小二乘OLS回归的稳健替代方案。M-估计M-估计通过使用减少离群值影响的损失函数来推广最大似然估计。常用的M估计量包括Huber’s T和Tukey’s Bigweight。最小二乘LTS最小二乘回归最小化最小平方残差的总和有效地忽略了可能由于离群值引起的最大残差。该方法在存在离群值的情况下提供稳健的参数估计。 非线性回归检测离群值实例 步骤1 导入相关模块库 import numpy as np import pandas as pd import statsmodels.api as sm import statsmodels.formula.api as smf import matplotlib.pyplot as plt import seaborn as sns from statsmodels.robust.robust_linear_model import RLM from statsmodels.robust.norms import HuberT, LeastSquares from sklearn.metrics import mean_squared_error步骤2 创建随机数据集 n 100 x np.linspace(0, 10, n) y 2.5 * np.sin(1.5 * x) np.random.normal(0, 0.5, n) # Adding some outliers x_outliers np.append(x, [1, 2, 3]) y_outliers np.append(y, [10, -10, 12]) data pd.DataFrame({tumor_size: x_outliers, metastasis_fraction: y_outliers})步骤3使用普通最小二乘回归拟合非线性模型 # Adding a nonlinear term for the regression model data[tumor_size_squared] data[tumor_size] ** 2 ols_model smf.ols(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit()步骤4可视化数据 plt.figure(figsize(12, 6)) plt.subplot(1, 2, 1) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) plt.plot(data[tumor_size], ols_model.fittedvalues, colorred) plt.title(Scatter Plot with OLS Fit)plt.subplot(1, 2, 2) sns.residplot(xols_model.fittedvalues, yols_model.resid) plt.title(Residual Plot) plt.show() 步骤5应用于回归模型 # Robust regression using Least Absolute Deviations (LAD) lad_model smf.quantreg(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit(q0.5)# Robust regression using M-Estimation with HuberT norm rlm_huber RLM(data[metastasis_fraction], sm.add_constant(data[[tumor_size, tumor_size_squared]]), MHuberT()).fit()步骤6使用统计方法识别离群值 # Studentized Residuals data[studentized_residuals] ols_model.get_influence().resid_studentized_internal# Cooks Distance data[cooks_distance] ols_model.get_influence().cooks_distance[0]# Hadis Potential (not directly available in statsmodels, so we use an approximation) data[leverage] ols_model.get_influence().hat_matrix_diag# Mark potential outliers outlier_indices data[(np.abs(data[studentized_residuals]) 2) | (data[cooks_distance] 4/(n-2)) | (data[leverage] 0.2)].index outliers data.loc[outlier_indices]步骤7比较不同方法的结果 # OLS model print(OLS Model Summary:) print(ols_model.summary())# LAD model print(\nLAD Model Summary:) print(lad_model.summary())# RLM model with HuberT norm print(\nRLM Model (HuberT) Summary:) print(rlm_huber.summary())# Goodness-of-fit measures print(\nGoodness-of-Fit Measures:) print(fOLS Mean Squared Error: {mean_squared_error(data[metastasis_fraction], ols_model.fittedvalues)}) print(fLAD Mean Squared Error: {mean_squared_error(data[metastasis_fraction], lad_model.fittedvalues)}) print(fRLM (HuberT) Mean Squared Error: {mean_squared_error(data[metastasis_fraction], rlm_huber.fittedvalues)})# Plotting the outliers plt.figure(figsize(12, 6)) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) sns.scatterplot(xtumor_size, ymetastasis_fraction, dataoutliers, colorred) plt.title(Scatter Plot with Outliers Highlighted) plt.show()输出 OLS Model Summary:OLS Regression Results Dep. Variable: metastasis_fraction R-squared: 0.125 Model: OLS Adj. R-squared: 0.107 Method: Least Squares F-statistic: 7.134 Date: Tue, 30 Jul 2024 Prob (F-statistic): 0.00127 Time: 21:15:45 Log-Likelihood: -237.57 No. Observations: 103 AIC: 481.1 Df Residuals: 100 BIC: 489.0 Df Model: 2 Covariance Type: nonrobust coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 2.6754 0.709 3.772 0.000 1.268 4.083 tumor_size -1.2510 0.332 -3.769 0.000 -1.910 -0.593 tumor_size_squared 0.1196 0.032 3.712 0.000 0.056 0.183Omnibus: 35.806 Durbin-Watson: 1.658 Prob(Omnibus): 0.000 Jarque-Bera (JB): 299.629 Skew: 0.732 Prob(JB): 8.64e-66 Kurtosis: 11.226 Cond. No. 142. Notes: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified.LAD Model Summary:QuantReg Regression Results Dep. Variable: metastasis_fraction Pseudo R-squared: 0.1515 Model: QuantReg Bandwidth: 2.178 Method: Least Squares Sparsity: 5.458 Date: Tue, 30 Jul 2024 No. Observations: 103 Time: 21:15:45 Df Residuals: 100Df Model: 2 coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 3.0050 0.785 3.828 0.000 1.447 4.563 tumor_size -1.6699 0.367 -4.545 0.000 -2.399 -0.941 tumor_size_squared 0.1686 0.036 4.729 0.000 0.098 0.239 RLM Model (HuberT) Summary:Robust linear Model Regression Results Dep. Variable: metastasis_fraction No. Observations: 103 Model: RLM Df Residuals: 100 Method: IRLS Df Model: 2 Norm: HuberT Scale Est.: mad Cov Type: H1 Date: Tue, 30 Jul 2024 Time: 21:15:45 No. Iterations: 11 coef std err z P|z| [0.025 0.975] -------------------------------------------------------------------------------------- const 2.5250 0.540 4.674 0.000 1.466 3.584 tumor_size -1.2436 0.253 -4.919 0.000 -1.739 -0.748 tumor_size_squared 0.1208 0.025 4.923 0.000 0.073 0.169 If the model instance has been used for another fit with different fit parameters, then the fit options might not be the correct ones anymore .Goodness-of-Fit Measures: OLS Mean Squared Error: 5.900980188225848 LAD Mean Squared Error: 6.09596526991115 RLM (HuberT) Mean Squared Error: 5.909805102901932总结 离群值检测是非线性回归分析的一个重要内容。通过采用目视检查统计方法和鲁棒的回归技术相结合研究人员可以确保准确可靠的参数估计。使用先进的方法如ROUT方法和蒙特卡罗模拟能进一步提高了分析的鲁棒性。正确处理离群值会产生更值得信赖的模型和更好的基于数据的决策。
http://www.w-s-a.com/news/965281/

相关文章:

  • 哈尔滨松北区建设局网站美妆网站建设
  • 不需要网站备案的空间网站推广的基本方法是哪四个
  • 如何检查网站死链劳动仲裁院内部网站建设
  • 江西省住房和城乡建设网站合同管理系统
  • 网站建设质量保证福州网络推广
  • 高唐网站建设公司广州南站在哪个区
  • 广西柳州网站制作公司郴州网红打卡景点
  • 做网站要固定ip拍摄公司宣传片制作
  • 专业微网站电话号码做软件难吗
  • 邢台网站制作哪家强上海做网站设计
  • 大连网站建设外贸wordpress添加文章属性
  • 商城网站建设合同范本网上哪里可以免费学编程
  • 服务器公司网站博客wordpress怎么编辑
  • 网站建设网络推广柯西乡塘网站建设
  • 企业做网站需要多少钱企业资质查询系统官网
  • 网站建设需要知识百度统计数据
  • 自已如何做网站建设通网站会员共享密码
  • 做网站学习什么wordpress 文件夹
  • 前端移动网站开发wordpress图文混排
  • 企业网站建站那种好商城类网站怎么优化
  • 手机微网站怎么制作的网上找设计师
  • 网站建设包括哪些方面学校网站 建设
  • 贵阳网站优化公司建筑设计师用什么软件
  • 网站建设的小说静态网页模板免费网站
  • 芜湖建设厅官方网站wordpress自动设置缩略图
  • 推荐网站网页湛江网站建设哪家优惠多
  • 传奇网站免费空间网店装修店面
  • 网站改版 重新收录湖南建筑信息一体化管理平台
  • 可以做直播卖产品的网站陕西省建设银行网站
  • 搭建网站的英语seo优化专员招聘