
非互联网从业者:大数据给我工作与思维带来的变革
第一次听到Big Data/大数据还是在欧洲念商学院的时候,有一门课叫做《管理咨询》。教授看了2012年10月的《哈佛商业评论》,兴致勃勃的对我们说,小组期末作业(当时我们的是一个市场预测项目)所有的分析都必须基于更多的数据。用他的话说:“只有你无情的虐数据,它才会乖乖的告诉你,你想了解的信息”。同时他也提到,利用部分信息的不可获得性来进行信息倒卖的生意,在以后会越来难做。
这些天读了维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的《大数据时代》有一些感触。我现在的工作虽然不在咨询公司,但也涉及对企业行业的判断与预期,因此从管理/商业的角度来说说这一趋势对我的工作与思维带来的影响:
1、数据的意义:
举最贴近我的例子,我研究生是学“项目管理”的,这门学科中有一个技术或者说方法叫做 Earned Value(EV)/挣值,通过项目经理制定收集和发亏信息的范围、方式和频率,由项目中具体操作人员进行数据采集、粗加工和反馈。基于这些被初步加工过的数据,项目经理可以了解到诸如项目是否超支、是否延期等信息。除了与利益相关人交流外,这些信息本身是没有作用的,它们的作用于价值是体现在“应该触发/不触发相应的行动进行干预和调整”上,也就是用这些数据进行预测从而实现干预以获得理想的结果。
从企业管理的角度看,虽然不同的利益相关人(比如股东、管理者、监管部门、公司员工)对企业有不同的期待与要求,审计对他们的作用是相似的:财务数据是否真实可靠?能否利用这些数据进行决策? 市场数据、人力数据、科研数据等也是类似——我们关注数据的真实性最终还是希望能用这些数据进行预测与决策,而不是数据本身。
我们关注企业领导者对其企业战略、组织架构和流程的描述最终是需要相应的数据进行支持,从而判断这个企业能否构筑一条“路”通向其所期待的终点。因此战略决策、投资决策和管理改进的决策都将基于这些预测。
2、我们对数据的态度:
作为一个非财务学生/工作者,在我接触这类学科时,了解到会计/财务使用的数据应满足:相关性、可靠性、可比性和可理解性。考虑到财务数据的特殊性,其他数据还应考虑透明性(并非所有数据都是一手的)和准确性(并非所有数据都有明确的获取和储存标准与流程)。
用作者的话说,对数据的衡量标准为:正确性、准确性、严格度和纯洁性。
在目前的趋势下,数据透明性有较大的提高(由于互联网的作用,很多信息变得可以获得了)那么我们对数据其他方面的容忍度也会下降或者说也不得不下降。这体现在我们被暴露在更多的数据下,会发现很多以前所没有关注和思考过的问题,而处理和解决这些问题方法也许也是我们之前所没有的。比如我们为了在A和B两个方面进行论证而收集数据,而为了A方面而收集的数据又揭示了B方面可能存在的问题。这部分数据相对B方面而言是不准确或者说不严格的(从数据来源与采集方式等角度来看),但其意义又是不容忽视的。
因此创新精神(如何发现新问题、展开新思考和采用新办法)以及相应的知识管理(如果再次遇到,我们应当如何处理),又显得尤为重要了。这也是我对舍恩伯格提到的三个趋势的理解:
3、在这一趋势下,我们能做什么?
回国后参加过一家在地产咨询界赫赫有名的咨询公司的面试,最后决定我放弃这个offer的原因只是那个经理人的一句话。当时我问他,他们公司拥有怎样的数据库,他们在项目中会用怎样的方法对数据本身进行加工。他给到我的回答是:在大环境下,很多信息是非公开的,因此不需要拥有很多的信息或对信息进行加工,它们本身就是可以卖钱的。而我的理解是作者认为大数据价值链将有三类角色,即掌握海量数据的公司、提供数据分析能力的技术公司以及提供思维的公司和个人。目前看来应该是掌握数据的公司,因为现阶段很多数据还是不可得的或者不能有效收集的,因此这类公司可以授权相关的公司来分析数据。而技术分析公司虽有可转移的的技术,可却很难再进行海量数据的收集。
而从我的角度来看,最重要的是第三类公司,因为前两者只是资源的储备者,而第三类公司才是资源与价值的转化者。在信息透明度仍在提高的进程中,我们更加关注的应当是如何利用好已有数据进行认知、预测、判断与决策。
引用作者的话,“正在发生的未来”,“更好地方法和答案还在不久的将来”。以上是我一些粗浅的见解。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15