新闻发布系统网站模板,长沙快速建站模板,wordpress 主题 36kr,东莞手机微信网站一、概念
1.回归就是用一条曲线对数据点进行拟合#xff0c;该曲线称为最佳拟合曲线#xff0c;这个拟合过程称为回归。 2.一个自变量 叫 一元线性回归#xff0c;大于一个自变量 叫 多元线性回归。 #xff08;1#xff09;多元回归#xff1a;两个x#xff0c;一个…一、概念
1.回归就是用一条曲线对数据点进行拟合该曲线称为最佳拟合曲线这个拟合过程称为回归。 2.一个自变量 叫 一元线性回归大于一个自变量 叫 多元线性回归。 1多元回归两个x一个y 3.这里讲一下线性模型在二维上就是那根线叫线性模型他可以用作分类也可以用作回归 4. 公式 1准确的说是求 右边的欧米伽和b用最小二乘法 或者 梯度下降法 求解。 2优化目标让 【预测值与真实值之间的欧式距离下一章之和】 最小。 预测值就是通过我们用方法推测出的一个点。 真实值就是实际存在的原来样本的一个点或者说是预测出来本应该是这个点。 5.广义线性模型 你可以把y替换成lny原理就跟高中数学里面学的两边同时取e最后式子其实是没变化的这里原理懂了秒懂不懂得应该也不考无所谓。 6.对率回归 是分类学习算法。其衍生出来的逻辑回归虽然名字中有“回归”但其主要用途是解决分类问题特别是二分类问题。 7.梯度下降法简单来说就是一点点求要求的那条直线。 8.人为设置的而非用来学习的参数所以叫做超参数。 9.最大熵模型 现实中不加约束的事物都会朝着“熵增”不确定混乱的方向发展 当随机变量呈均匀分布时熵值最大。 最大熵模型就是认为在满足所有约束条件下熵最大最好即该情况下数据随机分布此时最随机最混乱。 OK上面的都不是重点重点来了 混淆矩阵 1.基础值缩写 1TNTrue negative真阴率:真0 2FNFalse nagative假阴率假0即被预测错误的1 3TPTrue positive真阳率真1 4FPFalse positive假阳率假1即被预测错误的0 2.准确率表示预测正确的结果占总样本的百分比。 3.精确率查准率表示在被预测为正的样本中实际为正的样本的概率。意思就是在预测为正样本的结果中有多少把握可以预测正确即不要求对的数量只要求对的精度/正确率。 4.召回率查全率表示在实际为正的样本中被预测为正样本的概率。即是不是所有的1全被找出来了即要求预测对的数量但是精度就不保证了。 5.PR曲线以精确率P为纵坐标以召回率R为横坐标做出的曲线竖P横R。 1置信度P,R这样一个点就是置信度 2置信度阈值就是设置一个y轴P的值然后上面的是正例下面的是负例上正下负就是画一条横着的线。 3图形 6.ROC曲线横轴是假阳率FPR 纵轴是真阳率TPR 1假阳率 2真阳率就是召回率R 3图形 4x越往右则表示猜错的正例越来越多y越往上则表示猜对的正例越来越多1,1表示此时预测样本全为正例。 二、习题
单选题 7. 逻辑回归模型解决 B问题 A、回归 B、分类 C、聚类 D、推理 多选题 7. 混淆矩阵大多数评价指标的基础以下哪些数据它主要包括的信息ABCD A、TN B、TP C、FP D、FN 判断题 6. 逻辑回归是一种广义线性回归通过回归对数几率的方式将线性回归应用于分类任务。T 7. 信息论中熵可以度量随机变量的不确定性。现实世界中不加约束的事物都会朝着“熵增”的方向发展也就是向不确定性增加的方向发展。 T 8. 准确率可以判断总的正确率,在样本不平衡的情况下,也能作为很好的指标来衡量结果。F