网站开发相关文献,张家港网站seo,js 获取 网站路径,网站数据流分析怎么做最小二乘法是一种数学优化技术#xff0c;用于查找最适合一组数据点的函数。 该方法主要用于线性回归分析#xff0c;当然#xff0c;也可用于非线性问题。
开始之前#xff0c;我们先理解一下什么是回归。
回归#xff1a;回归是一种监督学习算法#xff0c;用于建模和…最小二乘法是一种数学优化技术用于查找最适合一组数据点的函数。 该方法主要用于线性回归分析当然也可用于非线性问题。
开始之前我们先理解一下什么是回归。
回归回归是一种监督学习算法用于建模和分析两个或多个变量之间的关系。 具体来说回归分析旨在了解自变量输入特征和因变量输出或目标之间的关系。 当您有数据点并想要使用一个或多个变量来预测或解释另一个变量时通常会使用回归分析。
回归有很多中 线性回归因变量和自变量之间的关系被建模为线性方程 y a x b yaxb yaxb 多元线性回归允许有两个或多个自变量。 y a 1 x 1 a 2 x 2 ⋯ a n x n b ya 1x 1a 2x 2⋯a nx nb ya1x1a2x2⋯anxnb 多项式回归因变量和自变量之间的关系被建模为多项式方程。 y a 1 x 2 a 2 x b ya 1x 2a 2xb ya1x2a2xb
逻辑回归、岭回归、决策树回归、随机森林回归等等…
由于一些问题这里我们只从简单的线性回归开始。 如果还有其他疑问或者想了解更多内容欢迎评论。
简单线性方程公式如下 y a x b yaxb yaxb
其中
y 是因变量x 是自变量a 是斜率b 是截距
x 和 y 是我们已知的值。 当我们找到a和b的值时我们可以将它们带入公式来解决线性回归问题。
要求斜率和截距的值可以使用最小二乘法来计算。
最小二乘法求解a、b公式如下 a n ( ∑ x y ) − ( ∑ x ) ( ∑ y ) n ( ∑ x 2 ) − ( ∑ x ) 2 a \frac{n(\sum xy) - (\sum x)(\sum y)}{n(\sum x^2) - (\sum x)^2} \ an(∑x2)−(∑x)2n(∑xy)−(∑x)(∑y) b ∑ y − a ∑ x n b \frac{\sum y - a \sum x}{n} \ bn∑y−a∑x
其中 ∑ x \sum x ∑x 是 x 值的总和 ∑ y \sum y ∑y 是 y 值的总和 ∑ x y \sum xy ∑xy 是 x 和 y 的乘积的总和 ∑ x 2 \sum x^2 ∑x2 是 x 的平方的总和 n n n 是样本数量
假设我们有一堆数据
a [[1, 2], [2, 4], [3, 3], [4, 6], [5, 6]]让我们使用这些公式来手动计算 a 和 b 的值
import numpy as npa np.array([[1, 2], [2, 4], [3, 3], [4, 6], [5, 6]])
x a[:, 0]
y a[:, 1]n len(x)sum_x np.sum(x)
sum_y np.sum(y)
sum_x2 np.sum(x ** 2)
sum_xy np.sum(x * y)slope (n * sum_xy - sum_x * sum_y) / (n * sum_x2 - sum_x ** 2)
intercept (sum_y - slope * sum_x) / nslope, intercept
你可以复制自己尝试一下或者依此作为参考按照自己的想法手写一个。
得出的值为(1.0, 1.2)所以使用最小二乘法我们得到拟合直线的斜率 a1.0 和截距 b1.2。因此这条最佳拟合直线的方程是 y 1.0 x 1.2 y1.0x1.2 y1.0x1.2。 有了这个公式就可以进行预测了比如我有一个坐标x10根据x来预测y的值
y1.0*101.2 11.2
如果你已经准备好了或者想使用现有库可以
使用线性回归根据评分预测票房
此外你也可以尝试搜索更多数据集比如房价汽车速度等完成更多挑战。