六个小技能帮助你更好地成为数据科学家
极客时间编辑部
讲述:初明明大小:2.88M时长:03:08
近日,数据科学培训平台 Kaggle Learn 的负责人丹·贝克尔(Dan Becker)以航海理论与实践的差距,形象地比喻了入门数据科学的理论与实践对比,并给出了一些关于数据科学实操技能的方法,以下为丹的观点。
在大学的大部分时间里,我都在积极地学习困难但有用的课程。但是,到了最后一个学年,我感觉累了,我想休息一下,所以我选了一门“有趣”的工程系课程,叫做“航海物理学”。
我们研究了什么样的动力会让帆船的速度快过风,以及船的形状如何影响其自身的稳定性。但当我们真正驾驶船的时候,得出一个结论:航海物理知识很有趣,但很明显,真正开始航海时,它们并不一定管用。
那么,这和数据科学有什么关系呢?
就像我在没有实际航海经验的情况下学会了航海物理学,大多数数据科学课程非常详细地介绍了一些算法,但却忽略了成功的数据科学项目所需要的技能。
企业数据科学仍然是一个新的领域。很多学者都还没有为真正的企业解决过真正的问题,因此,教学者以一种与数据和业务环境相分离的方式教授教科书中的算法。从智力方面看,这是一种乐趣,但是,如果学生们认为学好这些课程就等于做好了成为数据科学家的准备,那他们就错了。
那么如何将你的学习精力放在重要的实操技能上呢?以下是一些值得一看的指南:
使用标准的开源库。数据科学通常会依赖具有良好的文档和设计且经过良好测试的 API 库。自己去实现这些东西会带来不必要的复杂性和 Bug,还会让你分心。
花更多的时间研究数据模式,并将其转换成所需的格式。大多数项目涉及大量的数据操作和相对较少的模型调优。正在招聘数据科学家的朋友告诉我,很多求职者都能描述算法,但绝大多数人缺乏 pandas 相关的技能,无法在实际工作中高效地完成任务。
了解技术的应用背景。在描述技术实用性时,如果你还是满嘴技术术语,说明你可能还没准备好应用它。
学会如何解释模型输出。例如,你需要了解如何度量模型的准确性,以此来判断是否可以信任模型。
在你感兴趣的领域内构建项目,它可以与电影、时事、体育、食物或任何其他事情有关,这将教会你如何以一种非常实用方式来构建有关外部世界的无定形问题。这是数据科学家最重要的技能之一,分享你的工作成果,学会如何解释和讨论结果,这可能是最为重要的技能。
跳过教科书和课程提及的算法理论,会更容易地成为一名数据科学家吗?当然不是。
以上就是今天的内容,希望对你有所帮助。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 庞小胖举个栗子?
收起评论