左耳听风
陈皓
网名“左耳朵耗子”,资深技术专家,骨灰级程序员
立即订阅
40357 人已学习
课程目录
已完结 108 讲
0/6登录后,你可以任选6讲全文学习。
开篇词 | 洞悉技术的本质,享受科技的乐趣
免费
01 | 程序员如何用技术变现(上)
02 | 程序员如何用技术变现(下)
03 | Equifax信息泄露始末
04 | 从Equifax信息泄露看数据安全
05 | 何为技术领导力?
06 | 如何才能拥有技术领导力?
07 | 推荐阅读:每个程序员都该知道的知识
08 | Go语言,Docker和新技术
09 | 答疑解惑:渴望、热情和选择
10 | 如何成为一个大家愿意追随的Leader?
11 | 程序中的错误处理:错误返回码和异常捕捉
12 | 程序中的错误处理:异步编程以及我的最佳实践
13 | 魔数 0x5f3759df
14 | 推荐阅读:机器学习101
15 | 时间管理:同扭曲时间的事儿抗争
16 | 时间管理:如何利用好自己的时间?
17 | 故障处理最佳实践:应对故障
18 | 故障处理最佳实践:故障改进
19 | 答疑解惑:我们应该能够识别的表象和本质
20 | Git协同工作流,你该怎么选?
21 | 分布式系统架构的冰与火
22 | 从亚马逊的实践,谈分布式系统的难点
23 | 分布式系统的技术栈
24 | 分布式系统关键技术:全栈监控
25 | 分布式系统关键技术:服务调度
26 | 分布式系统关键技术:流量与数据调度
27 | 洞悉PaaS平台的本质
28 | 推荐阅读:分布式系统架构经典资料
29 | 推荐阅读:分布式数据调度相关论文
30 | 编程范式游记(1)- 起源
31 | 编程范式游记(2)- 泛型编程
32 | 编程范式游记(3) - 类型系统和泛型的本质
33 | 编程范式游记(4)- 函数式编程
34 | 编程范式游记(5)- 修饰器模式
35 | 编程范式游记(6)- 面向对象编程
36 | 编程范式游记(7)- 基于原型的编程范式
37 | 编程范式游记(8)- Go 语言的委托模式
38 | 编程范式游记(9)- 编程的本质
39 | 编程范式游记(10)- 逻辑编程范式
40 | 编程范式游记(11)- 程序世界里的编程范式
41 | 弹力设计篇之“认识故障和弹力设计”
42 | 弹力设计篇之“隔离设计”
43 | 弹力设计篇之“异步通讯设计”
44 | 弹力设计篇之“幂等性设计”
45 | 弹力设计篇之“服务的状态”
46 | 弹力设计篇之“补偿事务”
47 | 弹力设计篇之“重试设计”
48 | 弹力设计篇之“熔断设计”
49 | 弹力设计篇之“限流设计”
50 | 弹力设计篇之“降级设计”
51 | 弹力设计篇之“弹力设计总结”
52 | 管理设计篇之“分布式锁”
53 | 管理设计篇之“配置中心”
54 | 管理设计篇之“边车模式”
55 | 管理设计篇之“服务网格”
56 | 管理设计篇之“网关模式”
57 | 管理设计篇之“部署升级策略”
58 | 性能设计篇之“缓存”
59 | 性能设计篇之“异步处理”
60 | 性能设计篇之“数据库扩展”
61 | 性能设计篇之“秒杀”
62 | 性能设计篇之“边缘计算”
63 | 区块链技术的本质
64 | 区块链技术细节:哈希算法
65 | 区块链技术细节:加密和挖矿
66 | 区块链技术细节:去中心化的共识机制
67 | 区块链技术细节:智能合约
68 | 区块链技术 - 传统金融和虚拟货币
69 | 程序员练级攻略:开篇词
70 | 程序员练级攻略:零基础启蒙
71 | 程序员练级攻略:正式入门
72 | 程序员练级攻略:程序员修养
73 | 程序员练级攻略:编程语言
74 | 程序员练级攻略:理论学科
75 | 程序员练级攻略:系统知识
76 | 程序员练级攻略:软件设计
77 | 程序员练级攻略:Linux系统、内存和网络
78 | 程序员练级攻略:异步I/O模型和Lock-Free编程
79 | 程序员练级攻略:Java底层知识
80 | 程序员练级攻略:数据库
81 | 程序员练级攻略:分布式架构入门
82 | 程序员练级攻略:分布式架构经典图书和论文
83 | 程序员练级攻略:分布式架构工程设计
84 | 程序员练级攻略:微服务
85 | 程序员练级攻略:容器化和自动化运维
86 | 程序员练级攻略:机器学习和人工智能
87 | 程序员练级攻略:前端基础和底层原理
88 | 程序员练级攻略:前端性能优化和框架
89 | 程序员练级攻略:UI/UX设计
90 | 程序员练级攻略:技术资源集散地
91 | 程序员面试攻略:面试前的准备
92 | 程序员面试攻略:面试中的技巧
93 | 程序员面试攻略:面试风格
94 | 程序员面试攻略:实力才是王中王
95 | 高效学习:端正学习态度
96 | 高效学习:源头、原理和知识地图
97 | 高效学习:深度,归纳和坚持实践
98 | 高效学习:如何学习和阅读代码
99 | 高效学习:面对枯燥和量大的知识
左耳听风
登录|注册

14 | 推荐阅读:机器学习101

陈皓,杨爽 2017-11-16
自从 2012 年在亚马逊第一次接触机器学习(一个关于预测商品需求的 Demand Forecasting 的项目)以来,我一直在用一些零星的时间学习机器学习相关的东西。所以,说实话,在机器学习方面,我也只是一个新手,也在入门阶段。
在前面文章的评论中,有网友希望我写一篇有关大数据和机器学习的文章,老实说,有点为难我了。所以,我只能结合自己的学习过程写一篇入门级的文章,希望能看到高手的指教和指正。
首先,简单介绍一下机器学习的一些原理。机器学习主要来说有两种方法,监督式学习(Supervised Learning)和非监督式学习(Unsupervised Learning)。

监督式学习

所谓监督式学习,也就是说,我们需要提供一组学习样本,包括相关的特征数据以及相应的标签。程序可以通过这组样本来学习相关的规律或是模式,然后通过得到的规律或模式来判断没有被打过标签的数据是什么样的数据。
举个例子,假设需要识别一些手写的数字,那么我们就需要找到尽可能多的手写体数字的图像样本,然后人工或是通过某种算法来明确地标注什么是这些手写体的图片,谁是 1,谁是 2,谁是 3……这组数据就叫样本数据,又叫训练数据(training data)。
通过机器学习的算法,我们可以找到每个数字在不同手写体下的特征,进而找到规律和模式。然后通过得到的规律或模式来识别那些没有被打过标签的手写数据,以此完成识别手写体数字的目标。
一种比较常见的监督式学习,就是从历史数据中获得数据的走向趋势,来预测未来的走向。比如,我们使用历史上的股票走势数据来预测接下来的股价涨跌,或者通过历史上的一些垃圾邮件的样本来识别新的垃圾邮件。
在监督式学习下,需要有样本数据或是历史数据来进行学习,这种方式会有一些问题。比如
如果一个事物没有历史数据,那么就不好做了。变通的解决方式是通过一个和其类似事物的历史数据。我以前做过的需求预测,就属于这种情况。对于新上市的商品来说,完全没有历史数据,比如,iPhone X,那么就需要从其类似的商品上找历史数据,如 iPhone 7 或是别的智能手机。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《左耳听风》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(25)

  • 零一
    希望耗子哥谈谈 Java 单元测试,API 接口测试方面的一些最佳实践
    2017-11-17
    25
  • 李牧之
    推荐一部《集体智慧编程》,作为第一本书。虽然比较老,算是入门经典,只会简单python即可。
    2017-11-17
    12
  • 李志博
    楼上问单元测试的朋友,如果你测的是dao 层,那就要走集成测试,本来也不需要mock,如果你测service那么一定要mock
    2017-11-16
    7
  • 机器学习基本就是在已知的样本数据中寻找数据的规律,在未知的数据中找数据的关系。
    2018-07-06
    4
  • 推荐fastai
    2018-09-25
    3
  • 二师哥
    机器学习离我比较远,先Mark下,等以后有时间精力了,再回头细细琢磨!
    2018-06-21
    2
  • 左耳朵
    @ 阿亮,谢谢,我有关注,但是只在表面😢
    2017-11-21
    2
  • 刘营
    每次听都振奋人心,都更加坚定信念。
    2019-10-17
    1
  • 一窗暖阳
    毕业太多年, 数学全部还给老师了。 请问有没有推荐的数学资源可以让我恶补一下? 谢谢
    2018-11-02
    1
  • 机器学习中的基本方法论是这样的。

    要找到数据中的规律,你需要找到数据中的特征点。

    把特征点抽象成数学中的向量,也就是所谓的坐标轴。一个复杂的学习可能会有成十上百的坐标轴。

    抽象成数学向量后,就可以通过某种数学公式来表达这类数据(就像 y=ax+b 是直线的公式),这就是数据建模。

    这个数据公式就是我们找出来的规律。通过这个规律,我们才可能关联类似的数据。

    当然,也有更为简单粗暴的玩法。

    把数据中的特征点抽象成数学中的向量。

    每个向量一个权重。

    写个算法来找各个向量的权重是什么。

    2018-07-06
    1
  • Cy23
    感觉自己掉队的越来越远,呼吸都困难了
    2019-08-29
  • Isaac Zhou
    讲的很泛泛 感觉书单比干活多 另外建议还是找个懂点专业的人读吧 这英语听着真有特色😤
    2019-07-22
  • prader
    感谢,耗神提供介绍个资源
    2019-07-09
  • edisonhuang
    机器学习分为了带标签的监督学习和无标签的非监督学习。
    机器学习最重要的意义还是在于自动化。传统软件开发实现了一定程度的自动化,但是自动化的模式是程序员事先设定好的,是对已知知识的表达。而机器学习的方法则是数据驱动的,工程师本身也不能说明带有什么规则就可以判别一张图是黄图,但是经过足够多的数据训练后,机器却可以自动识别黄图了。
    机器学习中涉及几个步骤,一是数据的量化表示,信号与系统就是这里面的基础。二是建立数据模型,目前深度神经网络模型占了主要部分。三是模型部署与落地,这里更多涉及工程相关的知识,编码基础就很重要了。
    2019-05-28
  • 西北偏北
    机器学习分为有监督学习和无监督学习。

    前者通过对自己数据找出特征,去基于此去识别未知数据。

    后者是基于算法,自动去数据中挖掘人为分析不能获取的联系。
    2019-05-06
  • 李强
    数学之美 不知道算不算机器学习相关联的?
    2019-04-02
  • 星光
    如何理解图像的性别检测?是指程序通过分析人脸判断出是男性或女性吗?
    2019-01-19
  • The one | LifeHacker
    每一期都是干货,好好吸收,明年开春打算去面试一把,😄
    2018-12-20
  • Geek_fb3db2
    101在国外就是入门意思
    2018-11-13
  • 细雨
    耗哥,你推荐的《机器学习》资料实在是太多了,看完的话,起码至少得一年。

    请问有没有一些非常经典的资料,通俗易懂,能够快速入门的?
    2018-11-13
收起评论
25
返回
顶部