成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

14 | 支持向量机:怎么预测股票市场的涨与跌?

你好,我是海丰。
不知道你有没有听过一个小故事,一个学渣和一个学霸考了同一张试卷,学渣考了 98 分,是因为他只能考 98 分,学霸考 100 分,是因为卷子只有 100 分。用这个故事中的学霸来形容我们今天要讲的这个算法一点也不过分,这个算法可以说是机器学习分类算法的天花板了。
它就是用来解决分类问题的支持向量机(Support Vector Machine,SVM)算法,简称 SVM 算法。在深度学习模型“横行天下”的今天, SVM 因为相比于深度神经网络更为轻量级,也有极好的性能,所以在工业界,它一般会作为模型效果的基准线。
这节课,我们就来聊一聊 SVM 的原理、应用和优缺点。

如何理解 SVM 算法?

我们先来做一道题:假如,桌子上放了两种颜色的球,你要用一根木棍把它们分开,你会怎么做呢?
如上图所示,我用了两种方式把它们分开了。这两种分类方式看起来差别不大,因为它们应用在这些数据集上的效果都一样,都可以完美分开两种颜色的球。
好, 现在我们加大难度,在这个基础上加上两个红色的样本点。如下图中的两个红色球,它们一个距离图中左下方的橙色球更近,另一个距离右上方的蓝色球更近。
如果我们还是用刚才的分类算法,这一回的效果就完全不同了。为什么这么说呢?在第 11 讲我们学过, KNN 算法通常是用距离公式(如欧式距离)去衡量两个样本之间的相似度,距离越近表示它们越相似。根据这个原理,我们就能得到一个结论:靠近橙色球的样本大概率属于橙色球,靠近蓝色球的样本大概率属于蓝色球。这样一来,做对这道题的就只有右边的分类算法。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

支持向量机(SVM)算法是一种强大的机器学习分类算法,适用于解决股票市场涨跌预测等问题。SVM通过寻找距离两类样本间隔最大的一条线来进行线性可分的数据分类,对于线性不可分的数据,则通过核函数将样本映射到高维空间进行处理。在预测股票市场涨跌时,SVM通过少量支持向量进行决策,具有高效率。文章详细介绍了SVM算法的原理、应用场景以及如何处理线性不可分的数据,以及在预测股票市场涨跌时的具体应用过程。SVM算法因其轻量级和优秀性能,在工业界作为模型效果的基准线。文章深入浅出地介绍了SVM算法的原理和应用,适合读者快速了解其概况。SVM算法的优点在于适用于线性和非线性问题,能够求得全局最优解,适用于小样本量的数据分类。然而,SVM训练资源开销较大,无法直接解决多分类问题。总体而言,SVM算法在分类问题中具有广泛应用,并且在深度学习模型出现之前一直是分类算法的天花板。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(11)

  • 最新
  • 精选
  • 橙gě狸
    有2个小疑问, 1、核函数和激活函数本质作用是否是相同的?区别是否仅仅是服务的算法不同? 2、如果算力不断增长,是否svm就会成为一种极其通用的分类算法?

    作者回复: 1、个人感觉没有太大关系,SVM中的核函数是为了做数据映射,是在处理阶段。深度学习中的激活函数是计算单元模型的输出函数,是计算阶段。 2、如果没有选择的情况下,其实可以,但是这么想啊,算法同学有时候引入 boosting 或 bagging 的方式,其实只为了提升 AUC 的一个点。

    2021-01-14
    2
    7
  • Rosa rugosa
    LR(逻辑回归)适合推荐项目如CTR预估,商品排序等;SVM适合小样本数据量的多分类,如文本分析中的情感分析,短文本分类。以及对预测值要求比较精确的项目,如金融领域。(上一个答案把LR当成线性回归了,写错了)
    2021-03-12
    1
    2
  • Yesss!
    LR的优点 算法简单、运算效率高、可解释性强(svn的算法比较复杂) LR的缺点 不具备求解一个非线性分布的问题(这是svn算法所具备的)、精确度低 SVN的优点 1、具备非线性和线性的解决方式。对于文本问题分析、情感问题分析尤为卓越(LR只能解决线性问题) SVN的缺点 1、需要的资源开销较大、对于样本数量比较多的情景下,要考虑消耗的资源和内存。
    2021-01-28
    2
  • Geek_d54869
    线性问题,样本比较大,特征较少的情况下用LR; 特征较多,样本数量几千条,又是非线性问题就用SVM;
    2023-05-24归属地:北京
    1
  • 潘平
    老师,“首当其冲的优点”用的不对,首当其冲指的是不好的事情发生
    2023-08-17归属地:上海
  • weiwei
    LR还是适合特征和目标有线性关系;SVM可以处理非线性
    2022-01-01
  • 俯瞰风景.
    LR的优点:运算效率高;可解释强;不受极端值影响 相比来说SVM的缺点:运算效率低,开销大;可解释性不强;受极端值影响。 SVM的优点:即可以处理线性可分,又可以处理线性不可分; 相比来说LR的缺点:对于非线性可分数据预测不理想。
    2021-08-27
  • Shirley
    SVM相较于LR所需样本量更小,能应对非线性的情况。LR相较于SVM所需运算资源更小,逻辑解释性更强。
    2021-07-01
  • hcm🙈
    非常棒,讲的很清晰~ 算法之美~
    2021-04-29
  • Rosa rugosa
    LR适合用来预测达成目标的参数值,如预测身高,房价,库存等;SVM适合应在小样本数量的分类,如文本分析中的情感分析和短文本分类。
    2021-03-12
收起评论
显示
设置
留言
11
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部