企业网站设计多少钱,西安工装装修公司排名,全屋设计的软件,本人承接网站建设通俗易懂的分类算法之K近邻详解
用最通俗的语言和例子#xff0c;来彻底理解 K近邻#xff08;K-Nearest Neighbors#xff0c;简称 KNN#xff09; 这个分类算法。不用担心复杂的数学公式#xff0c;我会用生活中的例子来解释#xff0c;保证你一听就懂#xff01; 1.…通俗易懂的分类算法之K近邻详解
用最通俗的语言和例子来彻底理解 K近邻K-Nearest Neighbors简称 KNN 这个分类算法。不用担心复杂的数学公式我会用生活中的例子来解释保证你一听就懂 1. K近邻是什么
K近邻是一种非常简单直观的分类算法。它的核心思想是物以类聚人以群分。也就是说一个数据点的类别取决于它周围最近的 K 个邻居的类别。
举个例子
你想判断一个人是喜欢看电影还是喜欢看书KNN 会看看他身边的朋友都喜欢什么然后根据朋友们的喜好来判断他的喜好。它的名字“K近邻”就是因为它的分类依据是“最近的 K 个邻居”。 2. K近邻的核心思想
K近邻的核心思想是找到离目标点最近的 K 个点然后根据这 K 个点的类别投票决定目标点的类别。
K 值K 是一个超参数表示要考虑多少个邻居。 比如 K3就表示看最近的 3 个邻居。 距离KNN 通常用欧氏距离来计算两个点之间的距离。 欧氏距离就是两点之间的直线距离。 3. K近邻的工作步骤
K近邻的分类过程可以分为以下几步
步骤 1计算距离
对于一个新的数据点计算它和训练集中每个点的距离。
步骤 2找到最近的 K 个邻居
选择距离最近的 K 个点。
步骤 3投票决定类别
对这 K 个点的类别进行投票票数最多的类别就是新数据点的类别。 4. 举个例子
假设我们有以下数据
电影评分游戏评分类别51喜欢电影42喜欢电影15喜欢游戏24喜欢游戏
现在有一个新数据点电影评分3游戏评分3我们想判断他是喜欢电影还是喜欢游戏。
步骤 1计算距离
计算新数据点和每个训练数据点的距离假设用欧氏距离 距离 (5,1)√[(5-3)² (1-3)²] √(4 4) √8 ≈ 2.83距离 (4,2)√[(4-3)² (2-3)²] √(1 1) √2 ≈ 1.41距离 (1,5)√[(1-3)² (5-3)²] √(4 4) √8 ≈ 2.83距离 (2,4)√[(2-3)² (4-3)²] √(1 1) √2 ≈ 1.41
步骤 2找到最近的 K 个邻居
假设 K3选择距离最近的 3 个点 (4,2)距离 1.41类别喜欢电影(2,4)距离 1.41类别喜欢游戏(5,1)距离 2.83类别喜欢电影
步骤 3投票决定类别
喜欢电影2 票喜欢游戏1 票最终结果喜欢电影 5. 如何选择 K 值
K 值的选择对 KNN 的结果影响很大
K 值太小容易受到噪声点的影响导致过拟合。K 值太大可能会忽略数据的局部特征导致欠拟合。
通常通过交叉验证来选择最优的 K 值。 6. 优点和缺点
优点
简单直观容易实现。不需要训练过程直接利用数据即可。适合多分类问题。
缺点
计算量大尤其是数据量大的时候。对数据的规模和分布敏感。需要选择合适的 K 值。 7. 应用场景
推荐系统比如根据用户喜好推荐电影图像分类比如识别手写数字医疗诊断比如判断疾病类型文本分类比如判断新闻类别 希望这个通俗的解释能让你彻底理解 K近邻如果还有疑问欢迎随时问我