
找不到完美数据科学家?你还可以组建一支数据科学梦之
提供洞察和分析的公司都在尽力为自己组建完美的数据科学团队,这通常有两条路可以走。
大部分公司都在挣扎中选择了第一条路:寻找这些工资非常贵又很少见的独角兽人才,即同时具备这多种技能的独立个体。
完美的数据科学家完美地掌握了数学、统计学、编程以及沟通技术。这些人不光具备完成复杂工作的专业技术能力,还能够向非技术人员解释这些技术工作可能会带来的影响。
除了这些数据科学家会很昂贵的事实之外,这些天才科学家一周7天,每天24小时连轴工作也是不太可能的。
当然这不是唯一的一条路。
人类史上最早的科学家之一亚里士多德曾经说过:“整体大于它的各部分之和”,这给了我们一些启发。与其寻找这些很受欢迎的同时具备三方面技能的人,还不如挑选分别具备其中一项技能的人来组成一个团队。毕竟,没有一个人能够永远解决组织不断增长的对数据科学研究的需求。它需要一个数学家来负责深入钻研,还需要一个具备交叉学科知识的人来进行横向整合,最终组成一个完美的团队。
◆◆◆ 数据科学团队的活力
任何一个数据科学团队的终极目标就是要成为一个解决问题的机器,一个能在不断变化的环境中不断搅动出价值的团队。越来越丰富的数据给曾经无法回答的业务问题提供了可能,这就给客户对洞察复杂性的期待提升到了一个新的高度。但随着这一套连锁反应而来的却是没有成熟方法论和解决方案的问题。随着输入越来越多样化,所需要的匹配的技能同样需要变得多样化。“酷呆瓜”团队的三个特点没有一个是可以缺失的,因此这个团队的集体智慧才真正是当今数据世界的驱动力。
显然,完美数据科学家团队中的任意两块都无法独立于第三块运作。而且,挖掘并保持数据科学家团队的内部平衡才能带来最大程度的准确性和相关性。
数学家/统计学家
这些受过训练的学者在理解了相关理论以及结果所需要的条件后,基于这些输入构建起先进的模型。
程序员
这位亲自操刀的架构师负责清洗、管理以及修整数据,以及建造模拟器或其他高科技工具来使数据变得更加方便易用。
沟通者/内容专家
将技术翻译为业务的专家利用自己的全局观,基于过去的知识帮助寻找技术与用户需求的连接点。
这些技能的互相支持才使得团队变得完整,并具备完美的数据交付能力:
数学家/统计学家的工作严重依赖于程序员。“垃圾进入垃圾出去”的概念在这里非常适用,也就是说如果程序员没有清晰地获取数据、管理数据,那么科学家很难构建出有用的模型。此外,数学家和程序员又依赖于沟通者的知识。即便数据是完美的,也符合统计学结论,如果其无法直接涉及到要解决的商业问题,那么这些就是没有意义的。此外,内部不平衡的团队将会面临一些无法充实准备的困难,也无法交付出完美的作品。
◆◆◆ 是购买还是自建?
今天的世界充满了大量、高速的数据,企业都面临着一个选择。传统那些写代码来编辑调查问卷、收集数据的程序员都被整合在了具备洞察的组织中。然而,他们中的很多人都没有接受过数学或统计学的正统培训。同样地,那些面向客户并具有数值定量头脑的商务人才在团队构建中也应当有一席之地。培训现有数学或统计学人才是可行的,但漫长的过程需要极强的耐心。如果组织认可且相信他们已有的人才并且选择这条路来组建团队,这也就指向了需要填补的空白从而打造完美团队。
组织机构很久之前就知道数据的价值了,但如果没有人的参与,无论数据量有多大,细节有多深,到2019年实现数据科学300亿美金的估值都是很难的。一个互相平衡的团队对各类数据作出的解读、过滤以及修正都会加速这种成长并提升数据科学的重要性。
许多人觉得Hilary的“酷呆瓜”概念只适用于个人。但实际上,我们必须认识到团队的集体“酷”也是充满潜力的。
当组织在组建和招聘数据科学团队时,或许团队宗旨可以简单的称为“如果你能找到呆瓜,那就留住他们。但如果缺少聚集了各类独角兽人才的团队,那就创造一个。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25评估模型预测为正时的准确性 在机器学习与数据科学领域,模型预测的准确性是衡量其性能优劣的核心指标。尤其是当模型预测结 ...
2025-06-25CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-06-24金融行业的大数据变革:五大应用案例深度解析 在数字化浪潮中,金融行业正经历着深刻的变革,大数据技术的广泛应用 ...
2025-06-24Power Query 中实现移动加权平均的详细指南 在数据分析和处理中,移动加权平均是一种非常有用的计算方法,它能够根据不同数据 ...
2025-06-24数据驱动营销革命:解析数据分析在网络营销中的核心作用 在数字经济蓬勃发展的当下,网络营销已成为企业触达消费者 ...
2025-06-23随机森林模型与 OPLS-DA 的优缺点深度剖析 在数据分析与机器学习领域,随机森林模型与 OPLS-DA(正交偏最小二乘法判 ...
2025-06-23CDA 一级:开启数据分析师职业大门的钥匙 在数字化浪潮席卷全球的今天,数据已成为企业发展和决策的核心驱动力,数据分析师 ...
2025-06-23透视表内计算两个字段乘积的实用指南 在数据处理与分析的过程中,透视表凭借其强大的数据汇总和整理能力,成为了众多数据工 ...
2025-06-20CDA 一级考试备考时长全解析,助你高效备考 CDA(Certified Data Analyst)一级认证考试,作为数据分析师领域的重要资格认证, ...
2025-06-20