京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘,正从从线上生活伸向线下
天气一热,冷饮会不会立马涨价?
英国消费者很快就能知道答案。近日有报道称,英国三大连锁超市将在部分门店推出动态价格。这意味着,价格将在一天之中随着需求的变化而涨落。午餐时间买午餐就像高峰时段叫网约车一样。
这可能听起来相当极端,但更加剧烈的变化即将到来。大概在那篇报道发表的前一周,亚马逊宣布以137亿美元收购全食超市。亚马逊毕生致力于消灭实体零售商,但如今却在三个国家拥有460多家实体店。
收购全食超市(亚马逊有史以来最大的收购交易)令一些观察人士百思不得其解。但亚马逊的眼光往往领先竞争对手十年。该公司的成功正是源于反常的大动作。亚马逊在1994年看到了在线零售的潜力,在2006年意识到了云计算的潜力。收购全食超市表明,亚马逊又预见到一个利润丰厚的新领域。
亚马逊不是放弃在线零售,转投实体零售,而是打算合二为一。这将使我们的日常生活数字化,让生活用品价格的大幅上涨显得更加自然。这将把硅谷基于监测的商业模式扩大到实体领域,通过监测我们做的每件事来赚钱。
硅谷是一个开采行业。它开采的不是石油或铜矿,而是数据。企业通过尽可能地观察消费者的在线活动来收集数据。这种活动可能是使用社交媒体,进行网络搜索,甚至是鼠标在屏幕特定区域停留了多长时间。单独来看,个人的这些在线痕迹可能没有什么意义,但如果和千千万万的其他人相比较,企业就能发现隐藏的模式,确定你是哪种人,你可能购买哪些东西。
这些模式蕴含巨大商机。硅谷利用它们来推销产品或者发布广告。但发现这些模式的算法需要源源不断的数据。数据确实非常丰富,但并非无穷无尽。
一百年前,你在得克萨斯州随便挖个洞,就可能发现石油。现在,化石燃料公司不得不在离海岸很远的地方修建钻井平台。科技行业面临着类似的命运。到处都是发财机会的日子结束了:最容易挖掘的数据大多已经被人收入囊中。Facebook和谷歌总共占到美国在线广告收入的76%。
西雅图的一家Amazon Go“智能”商店。该公司收购全食超市的交易表明,亚马逊希望将在线监测和实体业务合二为一
想要获得更多的利润,硅谷必须挖掘更多的数据。一个方法是让人们在网上花费更多的时间:开发新的APP,使它们尽可能地让消费者上瘾。另一个方法是让更多的人上网。这就是Facebook推出FreeBasics计划的动机。该计划在全球欠发达地区提供免费上网服务(只能访问某些站点),希望从世界各地的穷人身上收集数据。
但这两个方法会遗漏大量数据。毕竟,我们的上网时间只有那么多。笔记本电脑、平板电脑、智能手机和可穿戴设备参与了我们的很多日常活动,但不是全部。在硅谷眼中,不能完全了解用户就意味着收入损失。任何没有被监测的活动都代表了一个错失的机遇。
亚马逊将向科技行业表明如何监测更多的活动:把企业监测深深地嵌入实体环境,就像深深地嵌入虚拟环境一样。硅谷已经通过监视我们在线上的一举一动,赚得盆满钵满。不久,它将通过监视我们在线下的一举一动,赚取更多收入。
这一点如何运作不难想见,因为相关技术已经存在。去年底,亚马逊在西雅图开设了一家“智能”杂货店。你不必在收银台排队结账,只需要拿起商品走出店门。传感器会探测你选取了什么商品,在你离开时从你的账户上扣费。
亚马逊着力强调这对消费者的好处:没人喜欢排队结账,或者在收银台前翻钱包。这项技术也使亚马逊可以追踪消费者的每个举动。
想象一下,如果超市像Facebook或者谷歌那样密切观察你,结果会怎样。它不仅会知道你买了什么东西,还会知道你在哪件商品前停留了多久,以及你穿过商店的路线。这些数据很宝贵,揭示了你的个性和偏好,亚马逊将借此向你销售更多的物品,不管是线上还是线下。
超市不是实现这些想法的唯一场所。监测能把任何实体场所变成数据矿场。数据最丰富的场所就是你的家,那里包含了关于你的最多信息。
这就是亚马逊积极推广智能音箱Echo的原因。Echo类似Siri的语音助手Alexa能播报天气,朗读新闻,制定待办事项清单,以及完成其他很多任务。它还是非常好的倾听者。它会忠实地记录你的互动情况,然后传输给亚马逊以供分析。实际上,它不仅记录了你的互动情况,可能还记录了所有的事情。
把一款收听设备放在你的家里,这对亚马逊来说是对你加深了解的好方法。另一个方法是对你的家进行空中监测。7月底,亚马逊获得了一项无人机专利,其无人机可以在送货时探测人们的家。亚马逊专利文件中的一个例子是屋顶维修:无人机把包裹放在你家门前时,注意到你家的屋顶坏了,这一发现可能导致亚马逊向你推荐维修服务。亚马逊还在测试其送货无人机,如果投入使用,那么可以肯定地说,它们将孜孜不倦地从你家外面收集数据,就像Echo从你家里面收集数据一样。
硅谷是一个开采行业。它开采的不是石油或铜矿,而是数据。想要获得更多的利润,硅谷必须挖掘更多的数据
在更加深入人们日常生活的过程中,亚马逊可能会遇到一些阻力。人们也许不希望超市监视他们,或者让自己的家变成为算法提供数据的地方。但在资本的要求下,行为规范会迅速调整,我们绝对不能低估了这一点。
二十年前,如果有一家公司读取你的邮件,观察你的社交互动,追踪你的地理位置,这会被很多人乃至大多数人视为侵犯个人隐私。但现在,人们已经对这些事情习以为常,甚至无动于衷。值得指出的是,在今后二十年内,随着硅谷更深入我们的生活以挖掘数据,进一步的妥协将成为常态。
技术拥护者会说,消费者一直都有权选择不接受:如果你反对某公司的做法,你可以不使用该公司的服务。但在垄断资本主义时代,消费者选择是个伪命题。谷歌、Facebook和亚马逊这样的公司掌控了数字世界,根本避无可避。
政治是唯一的解决途径。作为消费者,我们几乎无能为力,但作为公民,我们可以要求以更民主的形式管控我们的数据。数据是公共利益。我们把数据集中起来,使它具有意义,因为只有通过收集和分析大量数据,才能发现有用的模式。
没有哪个正常人会允许矿业公司单方面决定如何开采和提炼资源,在哪里修建矿场。但不知怎么地,我们却允许科技公司单方面行事,几乎没有受到公众监督。地球属于我们所有人,从地下挖掘铜矿的公司应该受到监督,其行为应该符合所有人的利益。从我们集体生活中挖掘数据的公司也应该如此。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27