给有抱负的数据科学家的六条建议
极客时间编辑部
讲述:丁婵大小:2.92M时长:03:12
现在数据科学家的需求量很大,对于一个想转行开始数据科学生涯的毕业生或数据分析人员来说,要在这个领域做一些事来展现自己的技能是很有挑战的。最近,Zynga 首席科学家本·韦伯(Ben Weber)发表文章 ,分享了数据科学家这个职业需要的几点关键经验。
1. 亲身尝试云计算
现在许多公司都在找有云计算经验的数据科学家,未来你也可能在日常工作中用上一个云平台,你可以积累在平台亲身实践的经验,尝试这些平台的不同功能,去看看你是否能够用一些工具去训练及部署模型。
2. 创建一个新的数据集
在很多实际项目中,你需要做数据整理,从而将原始数据集转换成一个更有利分析建模的数据集。通常,数据整理需要收集额外的数据集去做数据转换。因此,我会建议你进一步深入实践,去构建一个新的数据集。这个过程会可能包含从网站爬取数据,从数据统计网站(如 steamspy)采样数据,又或者要整合不同数据源从而创造一个新的数据集。
3. 将各种信息关联起来
数据科学家需要尽量去展现这种能力:就是能将不同的组件或者系统连接起来从而完成一项任务。在数据科学家这个角色中,也许没有一个清晰的路径来使模型产品化,所以你可能需要构造一些独特的东西让系统跑起来。建议去尝试将不同的系统或组件整合进数据科学工作流中。
4. 提供一个服务
作为数据科学家,你将经常需要提供服务来让公司的其他团队使用。如果你能够开发出这个服务,这意味着其他团队将能更快地使用到你的数据产品。建议尝试使用一些工具(比如 Flask 或者 Gunicorn)去配置 web 端点(endpoint),然后用 Dash 在 Python 中创建交互式的 web 应用。在 Docker 中尝试配置这当中的一些服务也会对你颇有帮助。
5. 做过酷炫的可视化
虽然伟大的工作自然会脱颖而出,但在你解释一个分析或模型如何重要之前,仍有必要获得众人的关注。建议学习各种可视化工具来创建一个引人入胜的数据可视化。可视化同时还能改进一系列的工作。
6. 写白皮书
能够通过白皮书来解释项目。白皮书是为了让更多的读者一目了然地理解你的研究,并且使其他数据科学家也可以在你的基础上继续研究。博客或其他形式的输出都可以很好地增加写作经验,建议你尝试去面向大众写一些数据科学的文章,这样当你要表达你的想法时,你会知道如何针对不同人群阐释不同程度的细节。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论