
高层管理者对于大数据的6个误解
大数据已经成为一个如此普遍的流行词,但有人认为其几乎是毫无意义的。一名IT行业专家表示,其曾从事信息技术工作超过十年,并记得当时订购新的驱动器和存储设备来处理文件和电子邮件,那时读取上千兆字节的信息,当时以为这样大量的数据就是大数据。
经过七年职业生涯的变迁,这个IT专家就职于亚马逊公司,并在他们的数据仓库中运行SQL查询。该数据库的范围之广,让其甚至花费一个星期的时间汇总数据,而无需再采用Excel表格。他以为明白了什么是大数据,但事实证明,并没有任何线索。
大数据如此普遍已经成为一个流行词,但它几乎是毫无意义的。在一次聚会上,这位专家听到有人说,“每家公司都是一家大数据公司。”并让他解释时,他说,如今每家公司都在购买和销售大数据。这位专家认为虽然所有的公司都可以使用大数据或基于大数据的应用程序,但并不是所有的公司都立足于他们的商业模式。他认为在其职业生涯被这种误解迷惑过,因此,他分享了一些自己的误解。
以下是IT高层管理者对于大数据六个最大的误解和错觉:
1.所有的数据是大数据。
调查机构Gartner公司称,大数据必须是大容量,高速度或多样化的各种数据。这意味着,如果你的数据只是处理容纳一个Excel文件,那么你不是在处理大数据。如果你只处理测量千兆字节的数据集,并采用个人电脑能处理,那么你不是在处理大数据。也许你正在处理数千兆字节电子邮件,而你不知道如何处理它,但这并不意味着它是大数据。
2.大数据解决每一个问题。
一些高管认为大数据可以解决一切问题。他们中的许多人都掌握大数据分析来解决问题,而不是使用常识。有一次行业专家和IT高管们试图找出为什么其网站访问人数和销售在四月的一个星期期间急剧下跌,前一年同一周没有经历过同样的下降。他们要求进行分析,在分析之后,直到有人说,“嗯,我们每年都看到网站数据在复活节减少,而去年复活节是在三月。”大数据和分析没有帮助我们弄清这一点,但通过社会常识和日历却可以弄明白。
3.大数据是没有意义的。
关于大数据的“一切”错误观念的另一面是:大数据并不重要。这个观点可以更容易理解,因为大数据的定义表明,它很难处理和理解。如果你不能从大数据中洞察见解或用它来为你的系统提供益处,那确实是毫无意义的。而有着这样观点的IT管理人员虽然了解大数据,却从未从中学到了什么。
为了让大数据变得有意义,你需要能够处理和使用它,其大数据的公司能够更方便实施。这些公司通过收集,清洗起来,组织数据,并通过数据科学家或其他系统可处理,并输出其方式。一旦数据科学家从数据是分析出信息,或者公司的系统使用的数据来执行类似的供应链业务运营,那么公司高管将开始看到大数据的价值。
4.大数据是很容易的。
不幸的是,这是一个常见的误解。让我们看看在世界上的每一个产品的有关信息和定价(免责声明:这是我的公司做的),例如。对于一个单一的产品来说,例如一双鞋,人们需要收集以下数据:
•品牌
•类别
•样式
•颜色
•鞋跟的高度
•材料
•尺寸
•宽度
•出售它的商店
•在这些商店的价格
•随着时间的推移,这些商店的价格
•每次看价格时,其库存如何
这是数学:查询数据库表明,11家不同的零售商在销售同一款,同一颜色的这双鞋。让我们假设正在收集一年中,每个商店销售这款鞋每周的价格和库存数据。这意味着我们有这双鞋的572条记录。如果我们想要追踪春定价和库存信息,其中包括所有16个女鞋的尺寸,这个数字将是9152条。这只是针对一双鞋收集的数据,而在商店鞋柜里的每一双都会创造更多的数据点。
增加的复杂性,在高需求的时间和促销时间收集的价格数据往往比每周一次收集还要多。每日价格和库存信息将意味着一双鞋子有着4015个数据点。亚马逊网站将添加描述这些产品的信息和每个尺寸,以及其对应的不同的价格。因此一双鞋的数据迅速膨胀。想象一下,在这个时代,多达数十亿的产品信息,将其放到你的电子表格中。因此,传统的收集和分析系统将面临大数据的规模的严峻挑战。
5.不完美的大数据是无用的。
这个错误让人疯狂的,因为完美的尺度基本上是不可能的。例如,IT部门试图实现让10亿个具有520个数据点的产品保持一个让人梦寐以求的“五个九”的完美标准(99.999%)。那么在此数据集中,仍然会有5200万个不正确的数据点。
大数据很少达到这种完美的原因很多。许多大的数据来源是远远不够完善。亚马逊公司作为抓取大数据来源之一的网站,很可能在产品名称产生拼写错误。大数据也需要建立和组织其机器学习和算法;在产品数据的世界里,这些可以很容易地根据标题或名称错误将产品进行分类。
缺陷并不表明无用,但。一个有能力的数据分析师可以去除异常,并从大数据中拔出重要的见解,即使有很多缺陷。开发人员可以添加过滤器,减少进入你的系统的错误,,并制定庞大的数据集,这将提高数据质量随着时间的推移训练算法。其中大数据的一个最大好处是,可以弥补偶尔缺陷,让你获得更好的见解。
6.只有大公司需要大数据。
小型营销企业需要网站的流量和关键字搜索的数字。小型购物公司需要尽可能多地链接联盟计划的大型零售商的产品,按需交付服务,并需要可靠的位置数据。这只是那些需要大数据的小型公司的一小部分。
大型公司可能会产生更多的自己的大数据,但几乎每家公司都在现代经济使用上构建了大数据或应用程序。这意味着所有的企业可以获得访问见解和信息,并获得这些庞大的数据集提供的好处,而无需建立和管理创建和分析大数据所需的基础设施。
如今,无论企业规模如何,都不可回避地采用大数据业务。希望了解这些,可以消除误解和错觉。毕竟,我们生活在大数据世界中。如果管理人员更好地理解复杂性,陷阱和大数据的能力,他们会更好地运行业务,做出更好的决策。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25