京公网安备 11010802034615号
经营许可证编号:京B2-20210330
告知5件大数据能不能做的事
引言
“大数据让我们变得更智能,而不是更聪明。”– Tim Leberecht
“大数据”一词早在20世纪40年代就出现了。全世界的公司都在竭尽全力地探索它的潜力。全球的科技巨头们都在大幅增加大数据技术的支出。这种趋势在主要行业的竞争者间还在加剧。
结果,根据调查公司IDC的预测, 大数据技术及服务直到2019年将以每年23%的速度增长.2019年在大数据上的支出将达到486亿美元。
这就是为啥大数据正在被全世界人们接受的原因。
公司从大数据身上看到了一线生机,让他们可以利用任何大小的数据。智能手机、GPS、传感器等在收集数据方面都发挥着作用。每一比特的数据都被收集起来然后处理成对我们(客户)有价值的信息。
在大数据不断给人们带来效益的时候,人们没有看到它 “不能” 做的事情, 也让我感到惊讶。但是我很快意识到,大数据不断的补充我们的商业直觉却绝不会成为替代品。
在本文中,我将过去7天的调查呈现给各位。我强烈的好奇心驱使我这样做。大数据对一个公司成功是至关重要的事实让我无法理解。大数据分析能胜任很多事情,但也有很多事情无能为力。
注意:我的想法并无完全,只是给各位提供一个思路。随便将你的想法留言在评论区中吧。
“大”数据的”小”练习
这个练习将为我们的将来做好准备。我们必须清楚要发生的事情还在后头。如果你在阅读这里,我请你考虑这样一个问题,你只需要写出(我已经共享了答案):
比如,如果我使用与大数据相关的平台得出这样一个逻辑结论,X是不可能的。我将排除与X有关的所有业务问题,能明白吗?
以下就是我的一个清单。如果你不同意下列中的观点,那么请证明一下吧!我会很乐意即使修改我的清单。让我们用一些商业直觉和分析的注解来开始解释我的一些思想。
80:20法则
这个法则说的是
“花80%的时间从过去的数据创建故事,20%的时间花在用现在的商业把这些故事串联起来”
说明:我相信没有跟商业直觉联系起来的分析见解都是没有用的。同意么?而且, 随着时间的流逝,以数据为驱动的部分在成指数级增长。 公司正在被数据的洪流所淹没。但这真的有用吗?不!
公司必须意识到,正确的将成功的商业分析与需要的商业视觉的比例是80:20。
如果我们建立一个故事用80%的时间分析过去的信息以求得对未来的预期,我们需要投入20%的时间思考这些信息对我们的业务有没有帮助。我们必须想到一些可以改变我们的将来和满足更广泛的业务目标的方法。这需要很强的商业理解力和良好的业务规则的知识。
这条法则中20%的成分是无可替代的。因此,人类的介入是为了解决这20%的问题,机器是不能满足的。即使是人工智能也不行。因为,人类的创造力是在无拘束的思考中诞生的。我相信创造力是机器无法带给我们的。我的清单正是受到了这个法则的启发。
5件大数据可以做到的事情
1.诊断分析 :我们每天都在做这个事情。机器更擅长做这个。当一个事件发生的时候,我们发现对寻找起因感兴趣。比如,设想在沙漠A挂起了沙暴,我们有沙漠A地区的各种参数:温度,气压,骆驼,道路,汽车等等。如果我们能将这些参数跟该地区的沙暴联系起来,如果我们知道一些因果关系,我们可能就会避免沙暴。想象下大数据的威力。
2.预测分析 :我们经常做这个事情。预测分析是根植在我们的DNA里的。比如,我们在全球有一个酒店连锁。现在我们需要找出那些酒店是没有达到销售目标的。如果我们知道的话我们就可以将努力集中在他们身上。这成为了预测分析的经典问题。
3.在未知元素间寻找关联 :我喜欢这部分分析。比方说销售雇员的数量跟销售额真的没有关系吗。你可能会减少一些雇员来看看是否真的对销售额没有损失。
4.规范的分析 :这是分析学的未来。比如说我们尝试着预测一个在大众目标的恐怖袭击然后安全的将人们转移的策略。做出这个预测,你需要做出在那个时候那个地点的游客人数,可能会被爆炸所影响到的地区等各种预测。
5.监控发生的事件 :行业中的大部分人都在做监控事件的工作。比如,你需要检测一个活动的反馈找到强烈和不强烈的部分。这些分析成为运营一个企业的关键
5件大数据不可以做到的事情
1.预测一个确定的未来 :使用机器学习的工具我们可以达到90%的精度。但是我们无法达到100%的准确。如果我们可以做到的话,我可以确切的告诉你谁才是目标以及每一次100%的响应率。但可惜的是这绝不会发生。
2.归咎于新的数据源 :在任何分析上,归责耗费了大部分时间。我相信这就是你的创造力和商业理解的来源。可能的是,你无法摆脱在你的分析中最无聊的部分。
3.找到一个商业问题的创新的解决方案 :创造力是人类永远的专利。没有机器可以找到问题的创新的解决方法。这是因为即使是人工智能也是由人们去编码的产物,创造力是不会从算法自己学习而来的。
4.找到定义不是很明确的问题的解决方法 :分析学最大的挑战就是从业务问题中形成一个分析问题模型。如果你能做得很好,你正在成为一个分析明星。这种角色是机器无法取代你的。比如,你的业务问题是管理损耗。除非你定义了响应者,时间窗口等,没有预测算法可以帮你。
5.数据管理/简化新数据源的数据 :随着数据量的增长,数据的管理正在成为一个难题。我们正在处理各种不同结构化的数据。比如,图表数据可能更适合网络分析但是对活动数据是没用的。这部分信息也是机器无法分析的。
最后
我相信这篇文章将发挥它的潜力如果你尝试了文章中的练习的话。试着从一个更全面的视角中思考,你会发现机器无法做到的事情。比如,我的初始点80:20法则指出机器将无法带来创造力。这个启发点帮我思考在分析的过程中那些部分是需要创造力的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21