商城开发网站建设开发,自己本地可以做网站服务器,jpress与wordpress,做酒类网站一,Multiple features(多类特征) 多元线性回归#xff1a; 1,多类特征的符号表示: (可以类比二维数组) 2,多元线性回归模型: 二,Vectorization#xff08;向量化#xff09; (简化代码缩短运行速度)#xff1a; 向量化实现多元线性回归模型#xff1a; 向量化实现多…一,Multiple features(多类特征) 多元线性回归 1,多类特征的符号表示: (可以类比二维数组) 2,多元线性回归模型: 二,Vectorization向量化 (简化代码缩短运行速度) 向量化实现多元线性回归模型 向量化实现多元线性回归的梯度下降: 拓展正规方程(normal equation)求线性回归模型的W和b (调用机器学习库,无需迭代和下降但是不利于推广且当n足够大时速度慢) 三Feature Scaling特征缩放: 定义当不同特征的取值范围相差很大太大或者太小时可通过重新缩放不同的特征使其取值在可比的范围内即当数据集的特征值取值范围大时模型的所对应的参数尽可能的小反之则尽可能的大来提高梯度下降的运行速度 实现 1法一除以特征的最大值 2法二均值归一化 缩放后特征值的取值范围为[-1,1] 3法三Z分数归一化(与法二相似将普通正态分布转换为标准正态分布) ①分别计算特征X的均值和标准差 ②缩放后的X为(X-均值)/标准差
四判断梯度下降是否收敛 法一绘制以迭代次数为横坐标以成本函数J为纵坐标的学习曲线观察曲线何时趋于平稳法二规定ɛ(值很小的变量)若成本函数一次迭代中减少的量小于ɛ即收敛
五学习率的选择尝试一系列学习率从而找到最优解 方法选择一个最小的值如0.001绘制学习曲线后扩大倍数绘制其学习曲线不断重复。 0.001 - 0.003 - 0.01 - 0.03 - 0.1 -............ 直到筛选出最小的学习率最大的学习率略小于最大的学习率
六特征方程 利用自己的知识和直觉来设计新特征或通过变换或组合将原始特征转换为一个更贴近核心问题的特征从而提高预测的准确性 注组合后的新特征取值范围可能差别较大可利用特征缩放进行处理
七多项式回归 多项式回归多元线性回归特征工程 组合后的数据可能会出现多次方可以将曲线非线性函数拟合到数据中从而提高预测的准确性这就是多项式回归