京公网安备 11010802034615号
经营许可证编号:京B2-20210330
先有想象力,才能活用大数据_数据分析师
大数据来了,每个人都有机会从中淘金,当然,你的工作内容也将出现大地震!
“巨量数据对个人的影响,可能最令人意想不到。在某些特定领域……,原本的专业知识就变得不足挂齿了。”《大数据》作者维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)在书中强调。
要在这个新领域成为赢家,比的不是统计能力,“唯有具备想象力,才能找到大数据真正的创新价值。”维克托·迈尔-舍恩伯格表示。
台湾中研院信息科学研究所副研究员陈升玮解释,这一波大数据趋势有两大重点:“数据重用”与“异类数据结合”。也就是说,把看似不相干的数据,放在一起分析、运用的能力,将越来越重要。
而看似无关的数据结合,靠的就是想象力。不过,想象力到底该如何培养?
“想象力没办法坐在那边想就出来,它是需要练习的。”Google台湾董事总经理简立峰接受《商业周刊》专访时解释。
以下是简立峰独家分享,Google聪明人是怎样从生活、工作中锻炼想象力的摘要。
别光“下指令”,用Data做决策 抛去旧框架,用搜集数据讨论问题
谈到大数据时代,企业主管到一般员工最需要具备的能力是什么,我认为,还是相信data(数据),凡事用data做决策:“show me the data!”决策是基于数据,不是人为个人喜好,是数据告诉我该怎么做。
企业主管必须先相信数据,接着建立数据,才可能有“大数据”。老板要打从心里认同“data driven decision making(数据导向决策)”的重要性,当有一天数据推翻老板看法时,他必须接受,抛去过去的框架、成见,鼓励员工搜集数据来讨论问题,而不是凭自己的意见下指令。
别总是“听说”,用Data找答案 在不疑处充满怀疑,想尽办法求证
提到想象力(为何重要),因为大数据主要是用在创新,开创新的商业模式。
如果你想练习想象力,首先,它就是“think out of box(跳出框架思考)”,无处不怀疑,人家不怀疑的地方,你充满怀疑就对了,而且,懂得怀疑的人,会愿意相信数据,因为他要说服自己不容易,所以得找出数据证明。
我跟我家小孩最喜欢玩的东西,就是看到一件事情,马上去求证它,例如,(有网络消息说)火星上看到一个巨人影像,我们就开始求证是真的还是假的,想尽办法开始搜寻。你可以用图找原始图,找出全世界有多少网站有这张影像,最后,我发现,我要找的链接是NASA网站,(结果)上面就写这是一张假的照片……。这种事情如果养成习惯,你才能有怀疑的能力。
别老“坐着想”,用Data找观点 多讨论,在不同意见中找出最好的
想象力没办法坐在那边想就出来,你还要有分析力,能够把一件事情拆成一百个角度去看,你就有机会刺激想象力,但如果你只有十个角度,你就很难有机会有想象力,想象力是要训练的。
几周前,我们有一个跨部门产品经理的会议,他们都是很有创意的年轻人,大家对土耳其市场搜寻流量突然增加那么多,感到很好奇,现场大概有20个人,马上抛出一百个观点,例如,最近的GDP是否成长?上网的渗透率是否成长?是不是有4G在建设……?接下来大家会很快地debate(辩论),把不合理的因素拿掉,筛出来之后,找出一、两个最有机会的,看要怎么去求证,这就是一个组织展现很强的分析能力。
要如何训练分析力,就是增加大家讨论的机会,美式公司开会表达意见的机会多,意见一旦多,你就要学习从不同意见中找出最好的,如果一个组织是上与下的关系,每次都只有一个人说话,这就培养不成了,越是扁平组织架构,越容易促进大家讨论。
最后,大数据很重要的是求证,Google里面很多数据分析师并不是天马行空地想,相反的,他们都是很严谨的人。
但别把大数据讲成统计学和数学,它只是你会不会懂得观察,生活上很多东西就是大数据的判断,我用搜索引擎也跟统计无关,我觉得用“科学家”这个词就把人吓坏了。大数据真正的用意,就是你重视data,找方法把data转换成价值就可以了,至于“大”(指所谓巨量数据),全世界需要处理大量数据的企业没几个,留给专家处理就好。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06