重学线性代数
朱维刚
前阿里云资深技术专家,毕埃慕(BIM)首席战略官、副总裁
立即订阅
2056 人已学习
课程目录
已更新 9 讲 / 共 19 讲
0/2登录后,你可以任选2讲全文学习。
开篇词 (1讲)
开篇词 | 从今天起,学会线性代数
免费
基础篇 (8讲)
01 | 导读:如何在机器学习中运用线性代数工具?
02 | 基本概念:线性代数研究的到底是什么问题?
03 | 矩阵:为什么说矩阵是线性方程组的另一种表达?
04 | 解线性方程组:为什么用矩阵求解的效率这么高?
05 | 线性空间:如何通过向量的结构化空间在机器学习中做降维处理?
06 | 线性无关:如何理解向量在N维空间的几何意义?
07 | 基和秩:为什么说它表达了向量空间中“有用”的向量个数?
08 | 线性映射:如何从坐标系角度理解两个向量空间之间的函数?
重学线性代数
15
15
1.0x
00:00/00:00
登录|注册

01 | 导读:如何在机器学习中运用线性代数工具?

朱维刚 2020-07-27
你好,我是朱维刚。欢迎你跟我一起重学线性代数!
在开篇词中,我和你大致讲过我自己的经历,从 2006 年开始到现在 14 年的时间里,我都专注于机器学习领域。对于线性代数在机器学习中的应用,我非常了解。而这也是线性代数最主要的应用场景之一。因此,今天第一节课,我想先和你聊一聊,如何在机器学习中运用线性代数工具,在我们开始自下而上的学习之前,先从上层来看一看。
我们都知道,“数据”是机器学习的前提,机器学习的第一步就是要进行数据的收集、预处理和特征提取;而模型就是通过数据来学习的算法;学习则是一个循环过程,一个自动在数据中寻找模式,并不停调优模型参数的过程。那我们就从机器学习的三个核心概念:数据、模型和学习说起。
你看,不论是模型,还是学习,都涉及数据,而数据加上模型和学习,就是数学的一般过程了,也就是:观察、实验、推理和抽象。所以,我认为学好数学,不仅有利于理解复杂的机器学习系统,还能调优算法参数,甚至能帮助你创建新的机器学习解决方案。

从机器学习到线性代数

那机器学习和线性代数之间到底有着怎样的关系呢?我想,用一个实际的机器学习算法的例子来解释,你可能更容易搞清楚。接下来,我使用 KNN(K-Nearest Neighbor,K 最近邻分类算法)来让你简单了解一下机器学习,以及它和线性代数之间的关系。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《重学线性代数》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥9.9
立即订阅
登录 后留言

精选留言(5)

  • 一点也不豁然开朗,因为通篇都在讲分类器,没有讲线性代数
    2020-07-31
    10
  • ququwowo
    最近刚开始学拿Stan/pymc3做贝叶斯机器学习,很多情况下需将模型re-parameterize (主要搞成non-centered),方便MCMC采后验. 几乎总用到cholesky factorization,希望老师后面能讲到。

    作者回复: 你好,ququwowo,对于pymc3我不熟悉,可以尝试一下变分推理,有机会也可以另外做个专题来探讨大规模概率编程。

    2020-07-28
    4
  • 瀚海星尘
    这么理解,KNN真的好简单啊,没想到这么简单。。豁然开朗~

    作者回复: 其实很多机器学习模型算法,如果通过数学角度来解释都是非常简单的,而且大部分都能适用应用场景,即使是深度学习也只是加了很多层而已。

    2020-08-02
    2
  • 思致精研_益达
    import pandas as pd
    from sklearn import datasets
    iris = datasets.load_iris()
    species = [iris.target_names[x] for x in iris.target]
    iris.target里面的“target”作用是什么。我发现iris里面的列名并没有target,所以这块感到有点困惑

    作者回复: 你好,思致精研_益达
    target是分类目标,属于ndarray类型,通过它我们可以拿到鸢尾花的种类并赋值给species。
    具体可以查sklearn的官方手册哦,地址是:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html

    2020-08-07
    1
  • DZ
    有点疑惑:
    ```
    plot_shapes(iris_test, 'Petal_Width', 'Sepal_Length', markers, colors)
    plot_shapes(iris_test, 'Sepal_Width', 'Sepal_Length', markers, colors)
    ```
    为啥不是:
    ```
    plot_shapes(iris_test, 'Petal_Width', 'Petal_Length', markers, colors)
    plot_shapes(iris_test, 'Sepal_Width', 'Sepal_Length', markers, colors)
    ```

    作者回复: 你好,DZ,很好的问题。
    这里没有特别的原因,鸢尾花的四个特征:花萼的长、宽和花瓣的长、宽,其实你可以尝试随意挑选放在plot_shapes里来看图的效果。

    2020-08-04
    1
    1
收起评论
5
返回
顶部