在数据科学领域,Python比R更好的4个理由
极客时间编辑部
讲述:丁婵大小:4.51M时长:03:17
在数据科学领域里,到底是该选 Python 呢,还是选 R 更好?诚然,对于数据科学家来说,R 和 Python 都很重要。但是对于一个新人数据科学家来说,又该如何取舍呢?毕竟同时学习 Python 和 R 也有些不切实际。Facebook 数据科学家汤姆·沃特曼(Tom Waterman)作为过来人,他是先学了 R,后来才学的 Python。在他看来,在数据科学领域,Python 比 R 更合适,尤其是对于刚刚起步的人来说。对此,他列出了四大理由,具体如下。
理由一:无论如何,你可能得学习 Python
大多数公司要求他们的数据科学家所做的并不仅仅是预测建模(即机器学习)。至少,你可能需要维护为模型提供数据的数据管道,而这些数据管道很可能就是用 Python 构建的。
目前,管道的行业标准是基于 Python 的 Airflow。据我估计,Facebook 的数据科学家 100% 都会在每周使用 Python,而积极使用 R 的人可能只有 10% 左右。因此,对你来说,如果选择 Python 的话,可能会更有效率。
理由二:Python 更容易学习
Python 以易学而闻名。在学过 Python 和 R 之后(虽然我对 Python 方面更深入),我认为,Python 的声誉是当之无愧的。
当你开始使用统计建模之外的语言特性时,Python 易学所带来的好处尤为明显。这些特性包括将项目打包用于分发、开发命令行界面、使用像 SQLAlchemy 这样的对象关系映射(Object-relational mapping,ORM)为数据结构建模等等。如果你掌握了 Python,你就会更容易精通这些特性,你的职业生涯也将因此受益。
理由三:Python 的社区更庞大
Python 是世界上最流行的编程语言之一,在 Stack Overflow、Kaggle 甚至 Medium 等网站都有庞大的社区。因此,当你遇到无法解决的问题时,你更有可能在社区找到解决方案。
理由四:使用 Python 部署模型更容易
在你的职业生涯中,你可能会遇到这样的情况:你希望能够将模型实时提供给任何一个最终用户。这时你需要构建一个基于 REST 的 Web 应用程序,使用 Python 的话,这件事就会变得很容易。
实际上,Python 拥有一些世界上最流行的 Web 应用程序框架,即 Django 和 Flask。你公司的内部部署工具更有可能支持这些框架,而且相对来说不太可能会支持 R。
这些框架的流行也意味着它们得到了平台即服务提供商(如 Heroku、Amazon Lightsail 等)的良好支持。有了这些框架,你能够在线发布你的个人项目,而所需的工作量仅相当于在 R 中部署相同项目所需工作量的一小部分。
当然,所有的决策都是需要权衡取舍的,在选择 Python 时也需要考虑它的缺点,学习 R 对你来说也有可能更有意义,这需要根据自己的情况而定。
以上就是今天的内容,希望能给你带来参考价值。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(3)
- 最新
- 精选
- 杏林之虎哎!一起学习R的人,后面都去Python了。1
- 泡泡跑吧搞生物信息的人绕不开R的各种包
- 佳佳的爸一句话,生态圈。哪种语言的生态圈更大更好更健康 哪种语言的生命力和受欢迎程度就越高。
收起评论