京公网安备 11010802034615号
经营许可证编号:京B2-20210330
非互联网从业者:大数据给我工作与思维带来的变革
第一次听到Big Data/大数据还是在欧洲念商学院的时候,有一门课叫做《管理咨询》。教授看了2012年10月的《哈佛商业评论》,兴致勃勃的对我们说,小组期末作业(当时我们的是一个市场预测项目)所有的分析都必须基于更多的数据。用他的话说:“只有你无情的虐数据,它才会乖乖的告诉你,你想了解的信息”。同时他也提到,利用部分信息的不可获得性来进行信息倒卖的生意,在以后会越来难做。
这些天读了维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的《大数据时代》有一些感触。我现在的工作虽然不在咨询公司,但也涉及对企业行业的判断与预期,因此从管理/商业的角度来说说这一趋势对我的工作与思维带来的影响:
1、数据的意义:
举最贴近我的例子,我研究生是学“项目管理”的,这门学科中有一个技术或者说方法叫做 Earned Value(EV)/挣值,通过项目经理制定收集和发亏信息的范围、方式和频率,由项目中具体操作人员进行数据采集、粗加工和反馈。基于这些被初步加工过的数据,项目经理可以了解到诸如项目是否超支、是否延期等信息。除了与利益相关人交流外,这些信息本身是没有作用的,它们的作用于价值是体现在“应该触发/不触发相应的行动进行干预和调整”上,也就是用这些数据进行预测从而实现干预以获得理想的结果。
从企业管理的角度看,虽然不同的利益相关人(比如股东、管理者、监管部门、公司员工)对企业有不同的期待与要求,审计对他们的作用是相似的:财务数据是否真实可靠?能否利用这些数据进行决策? 市场数据、人力数据、科研数据等也是类似——我们关注数据的真实性最终还是希望能用这些数据进行预测与决策,而不是数据本身。
我们关注企业领导者对其企业战略、组织架构和流程的描述最终是需要相应的数据进行支持,从而判断这个企业能否构筑一条“路”通向其所期待的终点。因此战略决策、投资决策和管理改进的决策都将基于这些预测。
2、我们对数据的态度:
作为一个非财务学生/工作者,在我接触这类学科时,了解到会计/财务使用的数据应满足:相关性、可靠性、可比性和可理解性。考虑到财务数据的特殊性,其他数据还应考虑透明性(并非所有数据都是一手的)和准确性(并非所有数据都有明确的获取和储存标准与流程)。
用作者的话说,对数据的衡量标准为:正确性、准确性、严格度和纯洁性。
在目前的趋势下,数据透明性有较大的提高(由于互联网的作用,很多信息变得可以获得了)那么我们对数据其他方面的容忍度也会下降或者说也不得不下降。这体现在我们被暴露在更多的数据下,会发现很多以前所没有关注和思考过的问题,而处理和解决这些问题方法也许也是我们之前所没有的。比如我们为了在A和B两个方面进行论证而收集数据,而为了A方面而收集的数据又揭示了B方面可能存在的问题。这部分数据相对B方面而言是不准确或者说不严格的(从数据来源与采集方式等角度来看),但其意义又是不容忽视的。
因此创新精神(如何发现新问题、展开新思考和采用新办法)以及相应的知识管理(如果再次遇到,我们应当如何处理),又显得尤为重要了。这也是我对舍恩伯格提到的三个趋势的理解:
3、在这一趋势下,我们能做什么?
回国后参加过一家在地产咨询界赫赫有名的咨询公司的面试,最后决定我放弃这个offer的原因只是那个经理人的一句话。当时我问他,他们公司拥有怎样的数据库,他们在项目中会用怎样的方法对数据本身进行加工。他给到我的回答是:在大环境下,很多信息是非公开的,因此不需要拥有很多的信息或对信息进行加工,它们本身就是可以卖钱的。而我的理解是作者认为大数据价值链将有三类角色,即掌握海量数据的公司、提供数据分析能力的技术公司以及提供思维的公司和个人。目前看来应该是掌握数据的公司,因为现阶段很多数据还是不可得的或者不能有效收集的,因此这类公司可以授权相关的公司来分析数据。而技术分析公司虽有可转移的的技术,可却很难再进行海量数据的收集。
而从我的角度来看,最重要的是第三类公司,因为前两者只是资源的储备者,而第三类公司才是资源与价值的转化者。在信息透明度仍在提高的进程中,我们更加关注的应当是如何利用好已有数据进行认知、预测、判断与决策。
引用作者的话,“正在发生的未来”,“更好地方法和答案还在不久的将来”。以上是我一些粗浅的见解。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30