140 | 人工智能领域知识体系更新周期只有5～6年，数据科学家如何培养？

洪亮劼



该思维导图由 AI 生成，仅供参考

在上一期的分享里，我们聊了数据科学家团队管理的一个重要步骤，那就是如何来衡量数据科学家或者人工智能工程师在团队中的业绩，我们重点讲了如何看待数据科学家团队的价值和数据科学家评定的一些误区。
今天，我们来聊另一个数据科学家团队的高级话题，那就是数据科学家的培养的问题。
为什么要培养数据科学家为什么要培养数据科学家？这个问题看上似乎是显而易见的，但实际上，如果不了解数据科学家或者人工智能团队的一个重要性质，你很可能无法很好地运营这样一个团队。究竟是什么性质这么重要呢？那就是数据科学家或者人工智能工程师有强烈的持续学习和不断更新自我的需要，这是数据科学家培养的一个非常重要的理念。
那么，数据科学家为什么需要不断学习？简单来说，是因为数据科学家所需要的技能和知识处在一个快速变化的环境中。如果数据科学家不能对这些快速变化的技能和知识加以学习，就很可能被迅速淘汰。
我们这里所说的技能有知识性的技能也有实际的工具性质的技能。
从知识性的来看，机器学习和人工智能技术每隔一段时间就会有一些重要的发展，了解和掌握这些更新的技术需要一定的门槛。因此，持续学习是为了能够迈过这些门槛。从过去的经验来看，每一次这样的重要发展所带来的新门槛都不可避免地让一些工程师和数据科学家落伍。
比如，在过去不到 20 年的时间里，机器学习就经历了“支持向量机”（Support Vector Machine）、“概率图模型”（Probabilistic Graphical Model）以及“深度学习”（Deep Learning）这三股大的思潮。也就是平均 5～6 年，数据科学家和人工智能工程师就需要面对一些完全不同的建模思想和工具。更不要说，在这些大的思潮之下，每年出现的新模型也是层数不穷。这还没有提及应用的领域，比如推荐系统、搜索、广告系统、计算机视觉、自然语言处理等等。如果不能在这些领域知识的快速变化中取得主动，很可能就无法胜任未来的工作。
在实际工具技能层面则更是日新月异。比如近日如火如荼的深度学习框架 TensorFlow 仅有 3 年多的历史，五六年前还根本就不存在。而如今借助机器学习迅速崛起的编程语言 Python 在五六年前也没有近日的火爆。而在支持向量机年代非常受欢迎的 LibSVM 和 SVMLight 工具，可能今天已经很少听到。知识框架的变化相比，工具技能层面的变化更加琐碎，更加细节，这也为人工智能科学家提出了更高的挑战。
那么，在知识结构和工具技能都快速变化的情况下，团队的负责人就需要针对这样的特点进行有远见的管理安排。
第一，需要为学习这些技能和知识提供时间。任何数据科学家现有的知识体系都不能保证永不过时。事实上，就像我们刚才提到的，现在每 5～6 年就有一个比较大的知识体系更新，这个更新速度在未来还有可能会更快。那么，花费了非常大的代价招聘来的整个团队就有可能面临着短时间内过时的危机，所以，要能够利用平时的时间，把持续学习的内容安排进团队的日常运作中，可以有效降低团队遭遇知识鸿沟（Gap）的风险。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

人工智能领域的知识体系更新周期短，数据科学家需要持续学习和更新自身技能。本文探讨了数据科学家培养的重要性，以及如何制定全方位的培养计划。首先，数据科学家需要不断学习新技术和知识，因为机器学习和人工智能领域的技术变化迅速，每5～6年就会出现重要的技术发展，而工具技能更是日新月异。团队负责人需要为学习提供时间，并战略性地挖掘未来可能进入主流视野的技术。其次，针对年轻成员，学习和培养成为必要环节，使其能够融入工业级人工智能解决方案的研究和部署中。此外，全方位的培养计划应包括团队协作能力、跨团队的组织、协调和沟通能力，以及数据科学家上台演讲的能力。总之，数据科学家的培养计划应该是技术层面和全方位能力的结合，以确保团队能够为公司带来数据驱动的持续决策能力。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(3)

最新
精选

gurudk
我想数据科学家主要需要具备两个能力，一个是扎实的技术基础，一个就是商业价值的感知能力
2018-02-14

2
林彦
一个软件工程和数据科学都能给公司创造价值的团队，如果团队有一定的自主安排时间。我觉得留下10%~20%的时间定期做一些分享(一定要上台讲)；做一些特定话题的小组讨论，小组中每个人可以发言，指定不同的组长，限制单个人的最长发言时间。根据参与人员的评价，专业人员的评价作为考核和未来沟通改进的标准之一。现实中怎么掌握这个节奏，投入多少资源依赖于公司的现状。在国内产品，运营的节奏有时很快。我的感受是不少中小公司在大数据运维和搭建环节人员资源都紧张。产品想清楚最核心的关键需求是什么，与开发团队紧密协作找到当下性价比高，效率可控又不会为将来埋太多坑的解决办法，在这个前提下，数据科学和算法团队有更大的空间随着公司一起成长，创造更大价值。
2018-02-12

1
型火🔥
2023 chatGPT. 大模型，langchain
2023-08-31归属地：北京



收起评论