从0开始学大数据
李智慧
同程艺龙交通首席架构师,前Intel大数据架构师,《大型网站技术架构》作者
立即订阅
14222 人已学习
课程目录
已完结 46 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 为什么说每个软件工程师都应该懂大数据技术?
免费
预习模块 (3讲)
预习 01 | 大数据技术发展史:大数据的前世今生
预习 02 | 大数据应用发展史:从搜索引擎到人工智能
预习 03 | 大数据应用领域:数据驱动一切
模块一 Hadoop大数据原理与架构 (7讲)
04 | 移动计算比移动数据更划算
05 | 从RAID看垂直伸缩到水平伸缩的演化
06 | 新技术层出不穷,HDFS依然是存储的王者
07 | 为什么说MapReduce既是编程模型又是计算框架?
08 | MapReduce如何让数据完成一次旅行?
09 | 为什么我们管Yarn叫作资源调度框架?
10 | 模块答疑:我们能从Hadoop学到什么?
模块二 大数据生态体系主要产品原理与架构 (7讲)
11 | Hive是如何让MapReduce实现SQL操作的?
12 | 我们并没有觉得MapReduce速度慢,直到Spark出现
13 | 同样的本质,为何Spark可以更高效?
14 | BigTable的开源实现:HBase
15 | 流式计算的代表:Storm、Flink、Spark Streaming
16 | ZooKeeper是如何保证数据一致性的?
17 | 模块答疑:这么多技术,到底都能用在什么场景里?
模块三 大数据开发实践 (8讲)
18 | 如何自己开发一个大数据SQL引擎?
19 | Spark的性能优化案例分析(上)
20 | Spark的性能优化案例分析(下)
21 | 从阿里内部产品看海量数据处理系统的设计(上):Doris的立项
22 | 从阿里内部产品看海量数据处理系统的设计(下):架构与创新
23 | 大数据基准测试可以带来什么好处?
24 | 从大数据性能测试工具Dew看如何快速开发大数据系统
25 | 模块答疑:我能从大厂的大数据开发实践中学到什么?
模块四 大数据平台与系统集成 (6讲)
26 | 互联网产品 + 大数据产品 = 大数据平台
27 | 大数据从哪里来?
28 | 知名大厂如何搭建大数据平台?
29 | 盘点可供中小企业参考的商业大数据平台
30 | 当大数据遇上物联网
31 | 模块答疑:为什么大数据平台至关重要?
模块五 大数据分析与运营 (5讲)
32 | 互联网运营数据指标与可视化监控
33 | 一个电商网站订单下降的数据分析案例
34 | A/B测试与灰度发布必知必会
35 | 如何利用大数据成为“增长黑客”?
36 | 模块答疑:为什么说数据驱动运营?
模块六 大数据算法 (6讲)
37 | 如何对数据进行分类和预测?
38 | 如何发掘数据之间的关系?
39 | 如何预测用户的喜好?
40 | 机器学习的数学原理是什么?
41 | 从感知机到神经网络算法
42 | 模块答疑:软件工程师如何进入人工智能领域?
智慧写给你的寄语 (1讲)
所有的不确定都是机会——智慧写给你的新年寄语
结束语 (2讲)
结束语 | 未来的你,有无限可能
第2季回归丨大数据之后,让我们回归后端
从0开始学大数据
登录|注册

29 | 盘点可供中小企业参考的商业大数据平台

李智慧 2019-01-03
专栏前面我讲了,稍具规模的互联网企业都会搭建自己的大数据平台。但是有同学会问,对于更多的中小企业和初创公司而言,自己搭建大数据平台的成本是不是有点高。确实,拿一个开源的软件搭建自己的大数据平台,对于中小企业来说,无论是人才储备还是服务器成本,似乎都有点难以承受。所幸,还有商业大数据平台可供选择。
今天我就来和你盘点一下可供中小企业参考的商业大数据平台

大数据解决方案提供商

Hadoop 作为一个开源产品,关注的是大数据技术实现和产品功能。但是要把 Hadoop 这样的技术产品在企业真正应用起来,还有很多事情要做:企业目前的技术体系如何与 Hadoop 集成起来,具体的解决方案如何实现?如何去做 Hadoop 的部署、优化、维护,遇到技术问题该怎么办?企业需要的功能 Hadoop 不支持怎么办?
Cloudera 是最早开展商业大数据服务的公司,面向企业提供商业解决方案,也就是支持企业解决我上面所说的问题。Cloudera 提供技术咨询服务,为企业向大数据转型提供技术支持。同时 Cloudera 也开发了自己的商业产品,最主要的就是 CDH。
CDH 是一个大数据集成平台,将主流大数据产品都集成到这个平台中,企业可以使用 CDH 一站式部署整个大数据技术栈。从架构分层角度,CDH 可以分为 4 层:系统集成,大数据存储,统一服务,过程、分析与计算。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《从0开始学大数据》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(15)

  • 观弈道人
    行文流畅。现在想转型做大数据技术,似乎没啥意义,了解点普及型大数据知识吧。
    2019-01-03
    1
    10
  • My dream
    我想搭建基于sql查询的自己的大数据平台,要些什么条件啊,我不想用什么阿里腾讯的,他们都收费,而且好贵
    2019-01-04
    7
  • 星辰
    1. 我们公司就是属于借贷公司,看到后台有神策埋点数据的采取,也知道有神策数据这个公司,但是不确定这个数据是不是上送到神策的大数据平台去了,可以和我们总监确认;

    2.看了今天的专栏,有提到风控模型,还需要确认一件事就是:我们的风控模型也是在大数据平台吗?

    作者回复: 风控一般有规则引擎和机器学习模型两种,后者通常用大数据平台训练。

    2019-01-05
    5
  • 修行者
    我知道的是华为的 FusionInsight 的大数据解决方案:
    前期主要针对的是电信行业,电信运营商提供的大数据解决方案,
    现在逐步扩展到平安城市,与政府(公安)合作提供智慧城市相关服务;
    也有金融方面的应用。
    2019-01-03
    5
  • sunlight001
    如果是企业内网使用大数据的话,还是需要自建的,感觉没有成熟的方案呢
    2019-01-03
    3
  • 纯洁的憎恶
    很实用,有利于定位和挑选合作伙伴。

    作者回复: 👍🏻

    2019-01-03
    2
  • smalldemon
    公司用的ambari
    2019-01-03
    2
  • 朝晖
    Talend这样通过各种组件图形化操作完成数据的清洗、计算
    偏向于有开发经验的人使用
    老师 对这样的软件怎么看呢
    2019-01-03
    2
  • Sam.张朝
    一篇文章的内容感觉有点少,特别是最近这几篇,偏重于行业境况。
    2019-01-04
    1
    1
  • 阿拉丁
    用过wcms,其中保存视频/图片等非结构化数据,大数据平台能支持吗?
    2019-01-03
    1
  • 林三杠
    最适合中小企业的大数据方案就是使用第三方服务,稳定、快速上线,成本最低,最好同时储备人才,企业大了可以自建
    2019-07-06
  • 张国宇
    老师您好,请问大数据开放平台中的风控应用场景中,金融机构客户会上传客户信息到平台,平台侧如何保证数据安全隔离,并且让客户相信这一点。另外平台侧保留金融机构的客户数据是否需要征得金融机构的同意?
    2019-04-03
  • 小老鼠
    医院有许多传统的手写病案,有没有什么工具可把这些传统数据传成电子数据。
    2019-01-22
  • 木白
    最近面了一个公司,说是要基于Hadoop做类似阿里云数加平台这样能够开箱即用的大数据产品,主要是面向to B的客户。如您所说,在目前大数据基础设施和开源工具都比较成熟的情况下,您觉得目前做这个东西的前景怎么样?如果只是在既有工具的上层进行一些封装,提供一些工具的话,对技术的提升大吗?

    作者回复: 要看公司产品定位和技术深度,总得方向不错的。

    2019-01-09
  • 星辰
    嗯,那我就去研究一下我们用的规则是啥。
    2019-01-05
收起评论
15
返回
顶部