当前位置: 首页 > news >正文

图书网站开发需求文档模板视频网站怎么赚钱

图书网站开发需求文档模板,视频网站怎么赚钱,最新新闻热点评论,好的搜索引擎推荐一元线性回归预测模型 实验目的 通过一元线性回归预测模型#xff0c;掌握预测模型的建立和应用方法#xff0c;了解线性回归模型的基本原理 实验内容 一元线性回归预测模型 实验步骤和过程 (1)第一步#xff1a;学习一元线性回归预测模型相关知识。 线性回归模型属于…一元线性回归预测模型 实验目的 通过一元线性回归预测模型掌握预测模型的建立和应用方法了解线性回归模型的基本原理 实验内容 一元线性回归预测模型 实验步骤和过程 (1)第一步学习一元线性回归预测模型相关知识。 线性回归模型属于经典的统计学模型该模型的应用场景是根据已 知的变量自变量来预测某个连续的数值变量因变量。例如餐 厅根据每天的营业数据包括菜谱价格、就餐人数、预定人数、特价菜 折扣等预测就餐规模或营业额网站根据访问的历史数据包括新用 户的注册量、老用户的活跃度、网页内容的更新频率等预测用户的支 付转化率医院根据患者的病历数据如体检指标、药物服用情况、平 时的饮食习惯等预测某种疾病发生的概率。 站在数据挖掘的角度看待线性回归模型它属于一种有监督的学习 算法即在建模过程中必须同时具备自变量x和因变量y。 相关性分析 一元线性回归模型 一元线性回归模型也被称为简单线性回归模型是指模型中只含有一个自变量和一个因变量用来建模的数据集可以表示成{(x1,y1)(x2,y2)……(xn,yn)}。其中xi表示自变量x的第i个值yi表示因变量y的第i个值n表示数据集的样本量。当模型构建好之后就可以根据其他自变量x的值预测因变量y的值该模型的数学公式可以表示成 yabxε 其中 a为模型的截距项 b为模型的斜率项 ε为模型的误差项。 模型中的a和b统称为回归系数误差项ε的存在主要是为了平衡等号两边的值通常被称为模型无法解释的部分。 拟合线的求解 接下来要学会如何根据自变量x和因变量y求解回归系数a和b。前面已经提到误差项ε是为了平衡等号两边的值如果拟合线能够精确地捕捉到每一个点所有的散点全部落在拟合线上那么对应的误差项ε应该为0。按照这个思路来看要想得到理想的拟合线就必须使误差项ε达到最小。由于误差项是y与abx的差结果可能为正值或负值因此误差项ε达到最小的问题需转换为误差平方和最小的问题最小二乘法的思路。误差平方和的公式可以表示为 由于建模时的自变量值和因变量值都是已知的因此求解误差平方和最小值的问题就是求解函数J(a,b)的最小值而该函数的参数就是回归系数a和b。 该目标函数其实就是一个二元二次函数如需使得目标函数J(a,b)达到最小可以使用偏导数的方法求解出参数a和b进而得到目标函数的最小值。关于目标函数的求导过程如下 (2)第二步数据准备数据来源于课本例题。 序号 x1 年份 水路货运量y 1 1991 1659 2 1992 1989 3 1993 2195 4 1994 2255 5 1995 2329 6 1996 2375 7 1997 2364 8 1998 2354 9 1999 2418 10 2000 2534 11 2001 2568 12 2002 2835(3)第三步使用 Python 编写实验代码并做图。 import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression # 设置中文字体 plt.rcParams[font.sans-serif] [SimHei] # 读取Excel文件 data pd.read_excel(E:\\File\\class\\数据挖掘\\test1.xlsx) x data[[年份]] y data[水路货运量y] # 训练模型 model LinearRegression() model.fit(x, y) # 预测值 x_new [[2004]] y_pred model.predict(x_new) print(预测值为, y_pred[0]) # 绘制图像 plt.scatter(x, y) plt.plot(x, model.predict(x), colorr) plt.xlabel(年份) plt.ylabel(水路货运量y) plt.title(一元线性回归预测模型案例) plt.show() 代码解释 导入了 sklearn.linear_model 中的 LinearRegression 类用于构建线性回归模型 设置了中文字体为 SimHei 使用 pandas 读取了名为 test1.xlsx 的 Excel 文件并将年份列作为自变量 x将水路货运量列作为因变量 y 使用 LinearRegression 类构建了一个线性回归模型并使用 fit() 方法拟合了数据 定义了一个新的自变量 x_new它的值为 [[2004]]即预测年份为2004 使用 predict() 方法预测了 x_new 对应的因变量 y_pred 输出预测值 y_pred 使用 matplotlib.pyplot 绘制了数据的散点图和线性回归模型的拟合曲线 添加了坐标轴标签和标题并显示了图像。 在上面的代码中首先使用pd.read_excel()函数读取名为test1.xlsx的Excel文件并将其转化为DataFrame格式的数据存储在data变量中。然后从data中选择了x列和y列的数据并将其转化为numpy数组的形式分别存储在x和y变量中。接着使用sklearn中的LinearRegression模型进行训练得到训练好的模型。然后构造了一个新的自变量x_new使用训练好的模型进行预测得到预测值y_pred。最后使用matplotlib库绘制了数据散点图和拟合直线图并添加了x轴标签、y轴标签和图像标题以便进行可视化分析。 需要注意的是在使用pd.read_excel()函数读取Excel文件时需要将文件名和路径指定为正确的文件名和路径。如果Excel文件中有缺失值或格式不规范的数据需要进行数据清洗和预处理以保证模型的准确性。 (4)第四步实验结果。 绘图和预测2004年的水路货运量。 这里的预测结果为2884.0792540792318
http://www.w-s-a.com/news/251587/

相关文章:

  • 怎样做理财投资网站装修平面图用什么软件简单
  • 建手机wap网站大概多少钱苏州网站设计公司有哪些
  • 网站建设需求文件学校网站建设方案及报价
  • 网站开发一般多少钱wordpress打赏赞插件
  • 做中国o2o网站领导唐山网站制作软件
  • 门户网站简介做网站一天能接多少单
  • 论坛类网站建设遵义网站制作外包
  • vps服务器购买网站小视频做网站怎么赚钱
  • 网站用图片wordpress同步发布
  • 织梦图片自适应网站源码网页美工的设计要点
  • 渝快办官方网站wordpress产品图片怎么改
  • 高端网站特色深圳建网站哪
  • 宝塔搭建网站软文小故事200字
  • 公司网站设计免费虚拟主机网站源码
  • 怎样做好网站用户体验申请网站空间
  • 网站建设优化公司招聘福州网站建设思企
  • 设计网站会员wordpress rss聚合
  • 网站建设过程中的收获html5官方网站开发流程
  • 网站建设-信科网络h5美食制作网站模板下载
  • 聊城九洲建设有限公司网站师大暨大网站建设
  • 烟台网站建设学校潍坊市建设监理协会网站
  • 大良营销网站建设资讯建设厅网站总经济师是干什么的
  • 网站优化推广软件网站制作公司dedecms
  • 在哪一个网站做社保申报百度小程序开发平台
  • 东莞网站建设_东莞网页设计网站色调代号
  • 濮阳住房和城乡建设部网站给别人做ppt的网站
  • 电子商务网站建设规划心得广告投放媒体
  • 淘宝店铺购买价格宝应百度seo
  • 同一虚拟主机 2个网站如果网站设计时
  • 网站维护的协议做网站 需要 域名 空间