17 | 几何角度看分类:支持向量机
该思维导图由 AI 生成,仅供参考
- 深入了解
- 翻译
- 解释
- 总结
支持向量机(SVM)是一种基于几何意义的非概率线性二分类器,其核心思想是找到最优的超平面作为决策边界。与逻辑回归不同,SVM不关心数据的概率,而是专注于寻找最佳的判别式来进行分类。通过直观的几何视角,文章解释了SVM如何选择最优决策边界,以及如何处理线性不可分的数据。文章还介绍了SVM的核技巧,以及如何处理异常点和软间隔。总的来说,SVM通过几何角度的理解,以及对间隔和分类错误率的折中,实现了在线性可分和线性不可分数据上的优良效果。 文章还介绍了SVM的核技巧,以及如何处理异常点和软间隔。支持向量机的另一个核心概念是对偶性(duality),通过对偶问题来找到最优解。此外,文章还提到了支持向量机在多分类问题上的应用,以及如何在Python中实现支持向量机。 总的来说,本文通过几何视角深入解析了支持向量机的原理和应用,为读者提供了全面的了解和实践指导。
《机器学习 40 讲》,新⼈⾸单¥59
全部留言(6)
- 最新
- 精选
- 鱼大多分类问题是不是要拆解成多个二分类问题,再综合?
作者回复: 是的。拆解有两种方式:一是一类与其他类(one-versus-all),哪个类输出结果最好就归到哪个类;二是一类与另一类(one-versus-one),这时要解决的二分类问题就比较多了,实例被分到哪个类的次数最多,就被归属到哪个类中。 想要直接解决多分类也可以,具体做法是把它表示成二次型的优化问题。
2018-07-133 - 林彦“让这两条平行线以它们各自经过的异类点为不动点进行旋转,同时保证平行关系和分类特性不变。在旋转的过程中,两个不动点之间的欧式距离是不变的,但两条线的斜率一直在改变,因此它们之间的距离也会不断变化。当其中一条直线经过第二个数据点时,两条直线之间的距离就会达到最大值。“这里面的旋转方向有2种,只有其中一种会令直线之间的距离达到最大值,有什么形象且可推理的方式能判定哪种方向会令距离达到最大值吗?
作者回复: 这种方式本质上还是要找最近的异类点,所以第二个数据点,也就是支持向量在哪边,旋转方式就在哪边。两边转可以各自计算出一个距离,但管用的是两者中大的那个。
2018-07-152 - 林彦之前看论文把支持向量机应用于多分类问题是一层层做二分类。
作者回复: 是的。拆解成二分类有两种方式:一是一类与其他类(one-versus-all),哪个类输出结果最好就归到哪个类;二是一类与另一类(one-versus-one),这时要解决的二分类问题就比较多了,实例被分到哪个类的次数最多,就被归属到哪个类中。 想要直接解决多分类也可以,具体做法是把它表示成二次型的优化问题。
2018-07-14 - ifelse学习打卡2023-06-03归属地:浙江
- 建强查了一下相关资料,用SVM解决多分类问题主要有以下4种方法: 1. 一对多: 训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类,这样k个类别的样本就构造出了k个SVM。 分类时将未知样本分类为具有最大分类函数值的那类。 优点:处理优化问题规模较小,实现简单,分类效率高。 缺点:可能会出现无法分类的现象,即一个未知样本无法预测其归属哪一类。 2.一对一: 在任意两个样本之间设计一个SVM,有K个类别的样本,就需要设计K(K-1)/2个分类器,对一个未知样本进行分类时,取得票最多的类别作为其类别。 优点:实现简单,不会出现无法分类的现象。 缺点:当类别数增加时,分类器数量会成倍增加,增加了计算的复杂度,降低了分类的效率。 3.有向无环图: 这种方法类似于一对一,但类别数增加时,但分类器数量不会成倍增加,也不会出现无法分类现象。其基本思想是,先是用第1个类别和其他类别构造分类器进行预测,如果预测结果是其他类别; 则用第2类别和其他类别分类器进行预测,如果预测还是其他,则依次类推,继续用第3类别,第4类别和其他类别分类器进行预测。 优点:分类效率高,没有分类重叠和不可分类现象。 缺点:如果在某个节点上发生分类错误,则会把分类错误延续到该节点的后续结点上。 4.层次支持向量机: 采用决策树的基本思想,从根节点开始,采用某种方法将该结点所包含的类别划分为两个子类,然后再对两个子类进一步划分,如此循环,直到子类中只包含一个类别为止。2021-04-11
- 杨家荣极客时间 21天打卡行动 55/21 <<机器学习40讲/17>> 几何角度看分类:支持向量机 今日所学 1,机器学习的算法关注的不仅是训练误差,更是泛化误差。 2,正中间的超平面实际上就是几何意义上最优的决策边界; 3,落在两条平行线上的几个异类点就是支持向量(support vector)。 4,间隔(margin)是支持向量机的核心概念之一,它是对支持向量到分离超平面的距离度量,可以进一步表示分类的正确性和可信程度; 5,间隔还可以分成几何间隔(geometric margin)和函数间隔(functional margin), 6,。支持向量机的基本思想就是找出能够正确划分数据集并且具有最大几何间隔的分离超平面(maximum-margin hyperplane)。 7,最终的决策边界仅与少数的支持向量有关,并不会受到大量普通数据的影响。 重点: 支持向量机是基于线性判别式几何意义的分类算法; 支持向量机通过间隔最大化来定义最优的决策边界; 支持向量机通过对偶问题来求解最优的决策边界; 支持向量机的目标是让结构风险最小化2020-02-11