
大数据在现实世界中 可能是一只无形的杀手
大数据被很多人吹捧成了大企业的救星:有人说它能预言未来,照亮我们的道路,给古老的商业模式带来新的生机。但是在现实世界中,数据是会杀人的。它能杀死项目,杀死金钱,甚至杀死时间。25年前,数据的增长速度大约只有每天100GB,而现在,数据的增长速率差不多已达到50,000GB每秒。随着数据量的海量增长,企业也越来越难以凭借自身的能力进行数据分析,从而加大而不是减小了企业战略决策的难度。
时间是我们最宝贵的资源,而数据偷走了我们大量宝贵的时间。我们的感观早已被各种各样的数据淹没。每天我们都会收到数不清的电子邮件、手机短信和提醒消息,每一条信息都会让人分心,降低我们的工作效率。它们将我们抽离了原本该做的事情,迫使我们将注意力放在也许重要、也许不重要的事情上。同理,企业的业务数据也同样多得令人窒息,牵扯了我们的大量精力,已经成了影响企业高效决策的拦路虎。
不妨想象一下,如果有一天,你只会收到对你来说真正重要的信息,而且这些信息还能在正确的时间、在正确的地点找到你,世界将是什么样子。那么你每天至少能多做多少事情?我们将大量的时间耗费在被动消化这些海量信息上,真正用来主动谋划企业发展的时间少之又少。这样既令人心力交瘁,又削弱了企业效能。
更重要的是,数据会令企业丧失精准度。光靠捕捉更多信息并不会自动使企业产生更多价值。有人可能会想,我们收集的数据越多,就越能从中获得好的见解。这种自欺欺人的心态是很危险的。只有当数据能带来准确而重要的见解时,它才是好的数据。关注大数据观察网(微信公众号:shuju_net)了解更多精彩资讯
另外,只有与你息息相关的信息才是有用的信息。好的信息必须具备时效性和真实性。然而不幸的是,当企业想从大数据中提取有用的见解时,却经常会起到反效果。举个真实的例子,美国有一个叫麦克·西伊的人是办公用品超市OfficeMax的常客,他的女儿不幸和男友死于一场车祸。OfficeMax不知怎么得知了这个消息,在发给麦克·西伊的自动促销邮件中竟然出现了这样的抬头:“麦克·西伊(女儿死于车祸)。”这并非大数据有意作孽,而是它的相关性(和适宜性)的问题。一个企业要想只收集其确实需要的数据几乎是不可能的,很多时候你收集到的是那些原本不该看到的东西。对于一家公司来说,你收集到的数据很可能是误导性甚至是毁灭性的。大数据虽然能将很多不相关的点连接起来,呈现一幅完整的图画,但是要确保数据的相关性、及时性和真实性,你首先还要正确理解它的背景。
现在,全球每天的数据总量都能达到250万的三次方字节,要想通过大数据获得全面的见解是很难的。你要么会陷入无力分析的境地(因此无法获得见解),要么就更糟糕,你可能会在有限的甚至是被错误解读的数据基础上获得错误的见解。如果没有正确地理解数据的背景,将不啻于椽木求鱼。一些看似有希望改变游戏规则的见解,在实际中却很有可能导致你从游戏中出局。
数据也会扼制你的灵活性。传统的数据分析方法,是将交易系统中的所有数据存放到一个数据仓库里(也有的叫数据湖或数据池),然后运行几套业务智能系统,叫几个或十几个分析师分析上一周的时间,然后把数据导到Excel里,或者做一个PPT。周而复始,得到的见解始终是滞后的。这种数据处理方法其实是一种浪费。由于要处理的数据很多,你得需要很长的时间才能获得有用的或是有可操作性的见解。你需要找到一种透过能繁杂的数据,得到为你的公司量身定制的信息的方法。
当我开车进城的时候,我想知道路上的交通堵不堵,需要多久才能达到目的地。如果有人给我的建议跟我同事上次开车走这条路时一样准确,那我就会不那么依赖GPS应用了。Waze就是这个领域的一款非常强大的应用,因为它截取了所有司机的一个巨大的时间断面的信息。这种全球数据的集中化使得所有用户都能获得与背景环境相关的见解。大数据也需要采取类似的做法。企业现在应该停止在自己公司的范围内积攒业务数据了,而是应该真正利用云计算的规模经济效益,不仅仅做到基础设施与应用的共享,更重要的是做到数据的共享。
如果你想将大量数据变成有价值的见解,你就应该利用一个集中化的全球性平台,因为这样一个平台可以借助大量内部和外部资源消化海量信息。企业将数据收集、管理和分析工作外包出去,就可以使这种通用平台专心研究数据科学,而你只需要集中精力,将它为你量身打造的见解应用在提高企业核心能力、强化企业竞争优势上。
20年前的一场“无软件”运动将世界从线下带到了云端。而今天,我们也需要掀起一场“数据有罪”运动。现在已经到了从收集数据转向让这些数据切实发挥作用的时候了。这将的话,在别人还在空谈“大数据”或疲于内部业务智能项目的时候,我们就能够解放精力进行创新。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09