当前位置: 首页 > news >正文

网站关键词收入软件辽宁大连最新发布

网站关键词收入软件,辽宁大连最新发布,elegant wordpress,珠海横琴天聚建设工程有限公司网站文章目录 1. 简单线性回归理论2. python通过简单线性回归预测房价2.1 预测数据2.2导入标准库2.3 导入数据2.4 划分数据集2.5 导入线性回归模块2.6 对测试集进行预测2.7 计算均方误差 J2.8 计算参数 w0、w12.9 可视化训练集拟合结果2.10 可视化测试集拟合结果2.11 保存模型2.12 … 文章目录 1. 简单线性回归理论2. python通过简单线性回归预测房价2.1 预测数据2.2导入标准库2.3 导入数据2.4 划分数据集2.5 导入线性回归模块2.6 对测试集进行预测2.7 计算均方误差 J2.8 计算参数 w0、w12.9 可视化训练集拟合结果2.10 可视化测试集拟合结果2.11 保存模型2.12 加载模型并预测 在机器学习和统计学中简单线性回归是一种基础而强大的工具用于建立自变量与因变量之间的关系。 假设你是一个房产中介想通过房屋面积来预测房价。简单线性回归可以帮助你找到房屋面积与房价之间的线性关系进而为客户提供更合理的报价。 本文将带你深入了解简单线性回归的理论基础、公式推导以及如何在Python中实现这一模型。 1. 简单线性回归理论 简单线性回归的基本假设是因变量 Y例如房价与自变量 X例如人口之间存在线性关系。我们可以用以下的线性方程来表示这种关系 其中 y 是因变量我们要预测的变量。 x 是自变量我们用来进行预测的变量。 w0是截距当x0) 时y的值。 w1是斜率自变量变化一个单位时因变量的变化量。 我们的目标是求 w0和w1的值来找到一条跟预测值相关的直线。 从图中我们可以看出预测值与真实值之间存在误差那么我们引入机器学习中的一个概念均方误差它表示的是这些差值的平方和的平均数。这些误差的表达式如下 均方误差的表达式如下 2. python通过简单线性回归预测房价 2.1 预测数据 数据如下 polulation,median_house_value 961,3.03 234,0.68 1074,2.92 1547,4.24 805,2.39 597,1.59 784,2.21 498,1.31 1602,4.28 292,0.54 1499,4.18 718,1.95 180,0.43 1202,3.62 1258,3.48 453,1.08 845,2.31 1032,2.96 384,0.68 896,2.62 425,0.82 928,2.95 1324,3.59 1435,4.02 543,1.62 1132,3.34 328,0.76 638,1.54 1389,3.78 692,1.79x 轴是人口数量y轴是房价 2.2导入标准库 # 导入标准库 import numpy as np import matplotlib.pyplot as plt import matplotlib import pandas as pd matplotlib.use(TkAgg)2.3 导入数据 # 导入数据集 dataset pd.read_csv(Data.csv) x dataset.iloc[:, :-1] y dataset.iloc[:, 1]2.4 划分数据集 # 数据集划分 训练集/测试集 from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test train_test_split(x,y,test_size0.2,random_state0)2.5 导入线性回归模块 # 简单线性回归算法 from sklearn.linear_model import LinearRegression regressor LinearRegression() regressor.fit(X_train, y_train)2.6 对测试集进行预测 # 对测试集进行预测 y_pred regressor.predict(X_test)2.7 计算均方误差 J # 计算J J 1/X_train.shape[0] * np.sum((regressor.predict(X_train) - y_train)**2) print(J {}.format(J))输出结果 J 0.0311989353198326922.8 计算参数 w0、w1 # 计算参数 w0、w1 w0 regressor.intercept_ w1 regressor.coef_[0] print(w0 {}, w1 {}.format(w0, w1))输出结果 w0 -0.16411984840092098, w1 0.00293839655959420672.9 可视化训练集拟合结果 # 可视化训练集拟合结果 plt.figure(1) plt.scatter(X_train, y_train, color red) plt.plot(X_train, regressor.predict(X_train), color blue) plt.title(population VS median_house_value (training set)) plt.xlabel(population) plt.ylabel(median_house_value) plt.show()输出结果 可以很好的看到拟合的直线可以很好的表示原始数据的人口和房价的走势 2.10 可视化测试集拟合结果 # 可视化测试集拟合结果 plt.figure(2) plt.scatter(X_test, y_test, color red) plt.plot(X_train, regressor.predict(X_train), color blue) plt.title(population VS median_house_value (test set)) plt.xlabel(population) plt.ylabel(median_house_value) plt.show()输出结果 可以看到拟合的直线在测试集上的表现是相当不错了说明我们训练的线性模型有很好的应用效果。 2.11 保存模型 # 保存模型 import pickle with open(../model/simple_house_price_model.pkl,wb) as file:pickle.dump(regressor,file);2.12 加载模型并预测 import pickle import numpy as np import pandas as pd # 加载模型并预测 with open(../model/simple_house_price_model.pkl,rb) as file:model pickle.load(file)x_test np.array([693,694]) x_test pd.DataFrame(x_test) x_test.columns[polulation] y_pred model.predict(x_test) print(y_pred)输出结果 [1.87218897 1.87512736]
http://www.w-s-a.com/news/924033/

相关文章:

  • 公司网站定位建议wordpress怎么用模板
  • 中国十大热门网站排名计算机选什么专业最好
  • 怀化建设企业网站太原网站关键词排名
  • 空间注册网站网站制作是怎么做的
  • 数码家电商城网站源码一个网站的成本
  • 网站伪静态是什么意思麻涌东莞网站建设
  • 理县网站建设公司郑州仿站定制模板建站
  • 手机网站建设网站报价诸城人才网招聘网
  • 一起做网站怎么下单临沂网站制作
  • 公司网站案例企业网站 模版
  • 做的好的响应式网站有哪些网站界面设计案例
  • 上海创意型网站建设icp备案网站信息
  • 网站没收录中山手机网站制作哪家好
  • 代驾软件开发流程wordpress 博客主题 seo
  • 成都的教育品牌网站建设网站广告js代码添加
  • 网站找人做seo然后网站搜不到了网站建设seoppt
  • 做网站优化有用吗学做文案的网站
  • wordpress 知名网站怎么做微网站
  • 用电脑怎么做原创视频网站河南建设工程信息网一体化平台官网
  • 云服务器和网站空间郑州做招商的网站
  • 规模以上工业企业的标准北京seo结算
  • 软件开发过程模型如何做网站性能优化
  • 网站建站公司广州南京江北新区楼盘
  • 哪些做展架图的网站好开发公司2022年工作计划
  • 磨床 东莞网站建设wordpress下载类主题系统主题
  • 免费学编程网站芜湖做网站都有哪些
  • 能发外链的网站门户网站网页设计规范
  • 网站建设所需人力南城区网站建设公司
  • 网站做图尺寸大小手机模板网站模板下载网站有哪些内容
  • 德阳市建设管理一体化平台网站做美食网站