089 | Powerset:HBase的老东家
徐飞
该思维导图由 AI 生成,仅供参考
谷歌的“三驾马车”,即谷歌文件系统、MapReduce、BigTable,被誉为计算机科学进入大数据时代的标志。
作为开源大数据的标杆:Hadoop,它的开发者道格·卡丁(Doug Cutting),最初在实现自己的爬虫 Nutch 的时候,只实现了 Hadoop 文件系统和 Hadoop MapReduce,并未实现 BigTable。所以在很长一段时间里,BigTable 在 Hadoop 的生态圈里是缺失的。
对于这种缺失,我们也可以理解为:无论是在爬虫还是当时 Hadoop 的几大生态圈里,大家对 BigTable 的需求并没有另外“两驾马车”那样强烈。
真正在 Hadoop 的生态圈里实现 BigTable 的开源版的,是一家叫做 Powerset 的公司推出的 HBase 项目。HBase 代码量大,架构复杂,但是很多代码都写得非常优雅。与 Hadoop 文件系统和 Hadoop MapReduce 的快、糙、猛相比,HBase 的出现无疑让人眼前一亮。
曾经的 Powerset 也是十分著名的创业公司,它创业的领域是下一代搜索引擎:自然语言搜索引擎。在今天,它却没有了当初的名气,为什么这么说呢,接下来我就会说到。
那么,这个曾经开发了 HBase 的创业公司,现在又是怎样的情况呢?今天我们就一起来了解一下。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
Powerset是一家曾经备受瞩目的创业公司,致力于开发基于自然语言的搜索引擎。该公司在2008年推出了基于维基百科的搜索引擎,但其技术并未能超越谷歌。微软随后以1亿美元收购了Powerset,但并未将其视为重要资产。然而,Powerset在开发语义搜索系统时,需要类似于谷歌BigTable的系统,但当时开源的Hadoop生态圈中却没有这样的系统,因此Powerset自行开发了HBase。尽管Powerset的技术并未取得预期的成功,但其贡献在于为Hadoop生态圈和大数据开源领域带来了HBase这一优质的开源产品。因此,尽管Powerset的发展历程并不完美,但其对技术领域的贡献依然是巨大的。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《技术与商业案例解读》,新⼈⾸单¥68
《技术与商业案例解读》,新⼈⾸单¥68
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 白杨powerset hbase2019-05-12
收起评论