京公网安备 11010802034615号
经营许可证编号:京B2-20210330
使用大数据,就像在沙子里淘金
在过去几年,我们这个世界上的数据的增长速度,相当于之前5年、10年的50倍。
大数据为什么在这个点上爆发?主要原因是,摩尔定律使得存储的数据量空前扩张。与此同时,类似RFID那样的传感器技术也得到了质的提升。于是,就出现了这样的例子——
当某著名服饰品牌把RFID的芯片放在衣服上,如果你觉得一件衣服挺好看,拿到试衣间试,试完了却没买,芯片依然能记录下你试穿了多长时间。由此,他们就会去研究,到底是什么问题,让你没有选择他们的产品。至于你试都不试,他们则认为这很可能是店铺陈列摆放的问题。基于由上述这些数据收集而产生的质量管理和服务改进,这家店的销售额在过去10年里涨了5倍,非常可观。
另外一个例子,如今也非常有名了。美国第二大连锁百货TARGET将大数据运用于营销。某天有一位父亲特别生气,到店里来投诉。他说我的女儿只有14岁,可是你们给她推送母婴广告。结果过了一个星期,经理打电话回访这个父亲,这位父亲表达了歉意:上次是我态度不好,我的女儿是怀孕了。事实就是这样:如果你总是在淘宝上买生活用品,你们家什么时候需要买手纸了,马云可能比你的家人知道得还早。
随着上面的例子越来越多,有人开始认为,我们现在正处在人类历史上的又一个节点:机器的智能有可能在我们这个时代超过人的智能。
这种推理是怎么来的呢?
持上述观点的人认为:由于计算机的速度会不断增加,而人的能力发展基本上是平行的,所以未来某个时间点上,机器智能极有可能超过人的智能。这时,如果我们善于利用大数据的特征,可以达成两件事。其一,可以换一种思维方式来看待世界。其二,可以制造更先进的机器智能。
换言之,大数据就像在一堆沙子里面淘金。当你利用到相较于今日一万倍的数据时,量变到质变的跃升就很可能产生。从这个意义上来讲,未来所有的公司,都可能是要使用大数据的公司。
真正的受益者不会超过2%
未来世界的机器是不会控制人的,但制造智能机器的人,能通过机器控制其他人。比方说,经常去京东、淘宝买东西,实际上就是被他们控制; 天天用微信,某种程度上就被腾讯控制。
在大数据时代,很多商业模式也会变。比如,过去有一个“吉利模式”,买一个刀架送一个刀片。然后吉利靠消费者后期的耗材消费挣钱。可如今,一个冰箱品牌做了这么一件事。它内置于冰箱的芯片可以获知你家有多少牛奶、多少鸡蛋。当这些东西没了,它就会通知给你送来。换言之,这个冰箱除了冷冻功能,还被赋予了“货架”功能。
未来世界里的大数据思维,将细到每一个人、每一个商品、每一笔交易,逐渐影响我们的生活,改变整个生态链。与此同时,技术的发展也不可能人为地停止下来。
但很遗憾的是,在任何一次重大的技术革命中,一开始受益的都是2%的人。正如蒸汽机的发明,第一波受益的,是发明家、工厂主,这是18世纪晚期的事。但连英国维多利亚女王迎来她特别荣耀的时代,都是19世纪中期的事了。美国工业革命,受益的是爱迪生。如今特斯拉也挣了很多钱,受益的是支持他们的GP摩根以及各种关联制造商。老百姓什么时候开始受益呢?是不是过两年,其余98%的人就能受益了呢?不是,可能要经过两代人,半个世纪后,才能有98%的人受益。
美国IT革命,从摩尔定律的发明到今年正好是51年,很多人还没有受益。美国和中国很幸运,踏准了信息革命的节奏。但在我们的周围,南美洲、整个阿拉伯地区、东欧地区,甚至南欧,对IT革命的贡献几乎为零。我希望大家能看到站在你们后面的这98%的人。你们要关注这些,更要坚守住这2%的位置。
学习是一辈子的事
前一阵谷歌的AlphaGo非常火,于是有人问,AlphaGo的学习速度太惊人了,和以前的学习方法相比,未来年轻人的学习,是否只剩下思维模式上的突破?
后来我一个同事,他的孩子在学下棋,他就说那我们去把AlphaGo这个程序打开,看看它到底怎么下的,让孩子学学。结果打开一看,发现根本没法模仿,里面就是一个很简单的数学模型,然后一堆乱七八糟的数字。所以,机器产生智能和人产生智慧完全是两回事。但我想讲两点——
第一,机器最擅长的工作还是重复性。AlphaGo 差不多有50个左右的版本,有时候一天就下好几千盘棋。但人类最重要的一个能力是创造力。在我们祖先活下来的地方,比如走出非洲那会儿,除了生存,还有乐器、创造性和想象力。
第二,比学习方法、思维模式更重要的,其实是终身学习。学习是一辈子的事,这点最重要。我原来周围有一些人比我的学业能力要强一些,但他们一旦拿到博士,就把书本一扔,从此不再学习,慢慢他们的知识就老化了。而我虽然不是一个有很好学习方法的人,却是一个能够不断学习的人。
正如你和你的父辈要掌握的技能早已不同,如今,说任何一个专业如何好、如何坏都失之简单。现在来讲,已经很难有专业比人的寿命要短,因此,你要做好在不远的未来换专业的准备。也许你的专业会过时,但你利用最先进的技术,比如计算机,来学习和提升自己这件事,永远不会过时。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27