在初创公司做数据工程师,学到的9件事
极客时间编辑部
讲述:丁婵大小:2.11M时长:04:36
近日,一位此前毫无数据工程经验的数据科学家安德烈·锡耶克(André Sionek),分享了他加入初创公司做数据工程师的经验。作为该初创公司的第一位数据工程师,他带领团队其他几人在六个月内创建了一个完整的机器学习模型,还创建了一个推荐模型以及 2TB 的数据湖。为公司打好了数据基础。有付出就有回报,锡耶克也分享了他这半年总结出的经验。以下为锡耶克分享内容。
1. 如果目标明确,学习就不是问题
对于有数据科学背景的人来说,数据工程并不复杂。作为数据科学家,我们会感觉到没有可用的数据或工具来完成工作是多么的痛苦。但我们可以学习,Airflow、AWS、Spark、Git、Python,凡是你能想到的东西,只要你知道目标是什么,就能在短时间内学会它们。漫无目的的学习很难有成效。
2. 了解公司
知道要做什么和动手去做是两码事。这与公司的文化有关。在面试的时候我就知道,我加入了一个可以让我拥有自主权的公司,可以用我认为正确的方式去解决问题。你可以在面试中问他们数据对公司来说有多重要。只是用于提供支持吗?还是公司发展战略的一部分?他们对你是真诚的吗?如果数据并不是公司发展战略的一部分,那么你很可能没办法花很多时间去计划和做正确的事情。
3. 数据就是产品
将 API、模型和仪表盘作为独立的产品,这为数据团队提供了极大的灵活性。但它们必须符合某些标准,这样才能将它们打通。将数据作为一种产品,并形成文化,保护团队免受日常业务问题的困扰,这些业务问题可以交给分析师来处理。此外,我们的领导也可以让我们免受外界的干扰,使我们能够集中精力学习,把事情做好。
4. 寻求帮助
有时候你需要独自完成一些工作,但有时候向那些有经验的人寻求帮助会为你节省很多时间。如果团队里有经验丰富的人,可以问问他们之前在其他公司是怎么做的。即使他们不知道该怎么做,至少也会知道什么行得通,什么行不通。寻求帮助肯定会把你引向正确的方向。
5. 把时间花在刀刃上
有些事情可以通过第三方工具轻松搞定,先尝试使用最简单的解决方案,当简单的解决方案不能满足需求时,再开始学习其他工具。如果从一开始就使用复杂的解决方案可能会浪费你的时间,要专注于用最简单的解决方案尽可能快地提供业务价值。
6. 构建不需要花太多时间维护的东西
花大半天时间去修复一个有问题的东西,这是最糟糕不过的事情了。如果经常出问题,那么要么是你做事的方式错了,要么是没有用对工具,或者两者兼而有之。从一开始就做对事情可能会花掉你更多的时间,但在未来会为你节省时间。
7. 诚实
如果有什么东西是你不懂的,请说出来,但也要证明你可以或者愿意去学。这样你就可以用工作时间学习新东西。
8. 分享你的知识
向其他团队成员分享他们不知道的东西,这样有助于你专注学习,也有助于减少不同工种之前的工作摩擦。如果数据工程师、数据科学家和机器学习工程师之间有了默契,工作就会变得更加顺畅。结对编程是一个很好的实践,可以借机分享你的知识,并获得实时反馈。花点时间分享你的知识,看看你能为别人提供些什么。
9. 花点时间小憩
在完成一个大项目后,比如部署了一个新的 ETL 管道,就可以花点时间做一些次要的任务,比如写文档或修复遗留 Bug。欲速则不达,马不停蹄地开始另一项大项目可能会让你走得更慢。
以上就是今天的内容,希望对你有所帮助。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 西 流我也在一个初创团队,leader的管理理念和本文阐述的很相同哦。感觉自己很幸运。
收起评论