
少了分析技能,大数据毫无用处_数据分析师
贵公司员工是否拥有必要的技能,能从大数据中获益?汤玛斯·戴文波特(Tom Davenport)和帕蒂尔(DJ Patil)在其谈数据科学家崛起的一篇文章指出,大数据时代来临,意味着分析大量杂乱无章、非结构性的数据,将日益成为每个人工作的一部分。公司会经常要求经理人和商业分析师利用数据执行实验、解读数据,以及发挥创意,打造以数据为基础的产品与服务。要在这个世界出人头地,许多人需要额外的技能。
有些必须绞尽脑汁处理大数据的公司,已察觉到需要拥有相关技能的员工。Avanade的一份新调查报告显示,超过60%的受访者表示,它们的员工需要培养新技能,将大数据化为洞见和商业价值。设在丹麦,生产天窗、太阳能板和其他屋顶产品的国际制造商威卢克斯集团(VELUX Group)全球商业智慧(Global Business Intelligence)主管安德斯·莱恩哈特(Anders Reinhardt)相信,“在标准的训练方式中,我们只学习跟商业使用者解释如何存取数据和报告,现在这样已不再够用。大数据对使用者的要求远高于从前”。许多产业的高级管理者正在制定计划,准备提升员工的技能。他们告诉我,员工需要:
有意愿并准备好要做实验:经理人和商业分析师必须在他们负责的业务上,运用科学实验原则。他们必须懂得如何建构聪明的假说。他们也需要了解实验测试和设计的原则,包括母群选择和抽样,以评估数据分析的效度。由于金融服务、零售和制药业中,随机测试与实验日益普及,拥有科学实验设计背景的人才特别受到重视。
Google的招聘人员明白,实验和测试是该公司的文化和业务流程中不可分割的部分,所以他们会问应聘者“校车能够塞进多少颗高尔夫球?”或者“曼哈顿有多少个下水道盖?”之类的问题。问这些问题的目的,不在于找到正确的答案,而是用以考验应征者在实验设计、逻辑和计量分析方面的技能。
擅长于数学推理:今天贵公司有多少经理人真的“懂数字”,擅长于解读和运用数字数据?这种技能将越来越重要。威卢克斯的莱恩哈特解释说:“企业使用者不必是统计学家,但他们需要了解如何适当地使用统计方法。我们希望企业使用者了解如何解读数据、衡量指标,以及统计模型的结果。”
有些公司出于需要,在聘用员工的时候,已经确定他们十分擅长于数学推理。第一资本(Capital One)银行的招募作业强调雇用分析和数字处理能力强的员工,并把他们分派到业务的各个层面。包括资深高级主管在内的应聘者,都必须通过严格的面试流程,包括测试他们的数学推理、逻辑和问题解决能力。
能够看到大(数据)画面:你可以称之为“数据处理能力”,指擅长于寻找、操弄、管理和解读数据。而所谓的数据,不只包括数字,也涵盖文字和图片。数据处理能力必须从它们平常的资讯科技职能,广为向外扩展,并且成为每一个业务职能和活动不可或缺的层面。
宝洁公司(Procter & Gamble)的CEO鲍伯·麦唐纳(Bob McDonald)相信“数据建模、模拟和其他的数位工具,正在改造我们的创新方式”。这样的发展,改变了他的员工需要的技能。为了因应这个挑战,宝洁“为组织中的每个晋升层级,量身打造作为基准的数位技能量表”。威鲁卢克斯将针对商业使用者开办数据处理能力训练课程列为优先要务。经理人需要知道有什么数据可用,并且运用数据视觉化技术以处理和解读数据。“或许最重要的是,我们需要协助他们构思新种类的数据,可以如何带来新的洞见,”莱恩哈特指出。
明天的领导者需要确定他们的员工拥有这些技能,并在文化、支援和责任方面建立起配套措施。除此之外,当组织不再只有少数的信息科技专家和统计学博士,而是雇有许多员工埋首分析杂乱无章、复杂、大量的非结构性数据时,他们必须从容自在地负起领导之责。
另一个挑战是:员工有可能下载和混搭数据,而引起数据安全、可靠和准确方面的担忧。但我所进行的研究发现,员工对他们在工作上使用的技术、数据和运用程序,已经负起更多的责任。员工必须了解如何保护敏感性很高的企业数据。领导者则需要学习“信任,但查证”员工所做的分析、在出现分析失效时与员工一道寻找问题所在。
要确保大数据能够产生大价值,企业不但应采用新技术,还要再训练技能,以养成重视数据的心态和分析文化。领导这场革命的公司已经有一批专注于实验、懂数字和数据的员工。你准备好加入它们的行列了吗?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10