日前，InfoQ 编译了数据科学家奥列克西·哈科维娜（Oleksii Kharkovyna）的一篇文章，他结合自己以及身边朋友们的经历，大致勾勒出今后十年影响数据科学未来的关键因素，包括更多的数据科学策略、更多界定明确的角色、更多的软技能需求等 7 大因素。以下为重点内容。
一、更多的数据科学策略数据科学是通过定量的方式解决问题的一门学科。在过去，由于缺少数据或数据处理能力不足，我们只能依赖直觉或共识解决问题。现在，数据科学家在搭建一些系统，这些系统可以输出语音、预测、给出期望并输出真正的结果。
未来，会有更多的人关注数据，从数据中获得真知灼见，数据科学团队也将成为大部分组织机构中不可或缺的一个部门。
二、更多界定明确的角色目前，数据科学家是一个宽泛的头衔，外界对这个领域中人的角色存在很多困惑。我们一般把数据科学领域的角色分成 4 类，它们角色职能不同但会有重叠。
数据架构师——开发数据架构，以有效地捕获、整合、组织、中心化和维护数据。
数据分析师——处理和解释数据，为公司提供有执行意义的预测。
数据科学家——一旦数据体量和产生速率达到一定水平，需要复杂技术时，他们会对数据进行分析。
数据工程师——开发、测试和维护数据架构，保证随时使用和分析数据。
未来，外界会对这些角色更熟悉，也会更明确不同角色之间的区别，人们也会对这些角色有更切实际的期待。
三、更多的软技能需求随着时间推移，更多数据科学家会熟练运用 Python 或 R 语言这些硬技能，但软技能也不能忽视，因为市场更青睐那些懂得营销，业务能力又过关的人。毋庸置疑，能将软硬技能结合的人会永远吃香。
四、数据会更多，处理数据的人工智能也会更多现在，我们每天产生的数据量是 2.5 艾字节，也就是 2.5 个 10 的 18 次方字节那么多，这个速度只会越来越快。到 2025 年，预计全球每天将产生 463 艾字节数据。
仅靠数据科学家无法管理和处理这么庞大的数据，因此，人工智能很可能会参与进来。自动化数据分析工具和机器学习会“聪明”到取代数据科学家做例行工作，比如探索性数据分析、数据清理、统计建模和构建机器学习模型。
五、更少的代码据特斯拉 AI 总监卡帕西（A. Karpathy）说，不久的将来，我们可以不用写代码了，我们只需要找到数据，并输入到机器学习系统即可。在这种场景下，软件工程师的角色会成为“数据监管者”。而程序员也不需要复杂的软件仓库，不用写复杂的程序，只需从事搜集、清理、操作、标记、分析数据以及对神经网络产生的数据进行可视化的工作。
机器学习正在引领一种新的计算范式，在这种范式中训练机器才是关键技能。随着机器学习技术的普及，很多编程工作会逐渐消失。最终，制造产品的大部分步骤将是屏幕上的拖拽、刷卡、指向和点击操作。从业者会从中解放出来，在解决问题时更有策略性和创造性。
那么，像 R 语言、Python 和 Spark 这样的工具会变得无用武之地吗？大多数数据科学家不再需要通过写程序的方式做统计分析或训练机器学习模型了吗？答案没这么简单。但不管怎样，你需要理解和熟悉这些处理过程，要知道机器学习只是辅助一些日常事务。
六、尽可能多地使用 API10 年后，大部分软件的制作方式会可见地接入到终端，最大程度地利用一切所需的服务生成解决方案。数据科学家能快速构建测试模型，一次建立和测试多种算法，最后和整个团队可视化验证结果。
七、自我学习在未来，传统的学术环境将逐渐失去意义，因为人们在毕业后，学到的技能已经过时了，这时就需要我们不断为自己赋能。因此在十年后能够生存的学校是那些拥抱在线学习、快速更新课程授予方式的学校。未来的学习会基于你能构建什么而定义，而不是缺乏现实世界应用的基础原理。
以上就是今天的内容，你是否认同哈科维娜的这 7 个预测呢？
原文链接：How Data Science Will Evolve Over the Next Decade?

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

该免费文章来自《极客视点》，如需阅读全部文章，
请先领取课程

免费领取

登录后留言

全部留言(1)

最新
精选

Aoinatsume
终身学习



收起评论

大纲



一、更多的数据科学策略

二、更多界定明确的角色

三、更多的软技能需求

四、数据会更多，处理数据的人工智能也会更多

五、更少的代码

六、尽可能多地使用 API

七、自我学习



显示
设置



留言





沉浸
阅读





手机端



快捷键



回顶部