京公网安备 11010802034615号
经营许可证编号:京B2-20210330
传统企业该如何在大数据时代找到自己的锚点_数据分析师
对很多人而言,大数据只是一个流行词。在觉得数据距离自己业务很远的同时,传统企业又心生恐惧不知未来会怎样:哪种生意可以用上数据?数据可以解决哪些具体业务问题?
在香港,有家日料店。这家店在很短时间内风靡全港,开了多个连锁店。很多市民都知道这家日料店的海鲜非常新鲜实惠,价格只有别家的七折。 我也曾经询问过这位大厨朋友,是什么能做到这么好的生意?
大厨神秘兮兮地问我“你有没有看到每个餐桌上的摄像头?那就是我们的秘密武器。”
原来,这家海鲜店每天都会通过摄像头,查看食客点餐、到餐的顺序,以及剩菜的种类分量。通过这样的盘点,这家餐厅的老板可以准确把握消费者的喜好,从而对北海道的海鲜预购量也相对精准。也正因为此,这家餐厅的货源流转迅速,成本也随之降低。
这是个有趣的案例。一家没有ERP系统的传统餐厅,通过摄像头实现了对采购的信息化管理:收集用户信息,分析进而用于第二天的采购决策,循环反复,以此降低生意成本。
对很多人而言,大数据只是一个流行词。在觉得数据距离自己业务很远的同时,传统企业又心生恐惧不知未来会怎样:哪种生意可以用上数据?数据可以解决哪些具体业务问题?
谁需要大数据?
美国一家有着百年历史的传统零售店,这家百货店六年前就开始大量收集竞争对手的价格数据。最近,他们除了做好了动态的定价引擎,还着手研究产品与人群匹配的自动化系统。在电商领域,我们可以将用户的认知分为三种:浏览者,购买者和消费者。传统百货店既不知道走进商店的人们都逛了哪些店(浏览数据),也不知道消费者在每个品牌店都买了什么商品(购买数据),用了什么银行卡买单,更不要说消费者购物完成后,他们的使用体验数据。
生产企业最痛的点,是我知道谁帮我卖,但不知道谁在买。对零售业这个问题变为:我知道谁在买,但不知道客人如何做决定的,更不知道他们用得如何,出了什么问题也不知道。这是因为旧有的模式,数据无法跟踪到门店之外,造成了生产和使用是脱节的。
但在大数据时代,生产企业可以利用社会化数据甚至传感器跟踪到用户的使用方式。产品出了什么问题,生产企业甚至能在用户感知之前,就了解到问题所在,并提供解决方案。
如果传统百货公司可以拥有这些数据呢?他们可以知道自己会员喜欢什么品牌,偏好什么样的付费方式,也可以向生产厂商下单,预购符合会员兴趣的商品。
数据可以帮助零售业对人群的需求与商品的供应快速有效率匹配起来,最大的价值就在这里。
当获取数据变得越来越容易的时候,企业就会发现,不用数据做决策就会失去很多机会。未来的每个企业都会成为数据企业,每个产品都会成为数据产品。因为里面的优化点都依赖于数据创新,数据会成为企业发展的驱动力。
资源有限怎么做大数据?
中小企业在数据化中最大的问题是资源有限,没有太多的资源可供试错,试错空间也很小。因此,中小企业应该收集关键信息,而不是收集所有数据。
你可以选择比较小的场景进行数据收集、分析。这个场景要满足以下条件:
1) 有没有所需数据?
2) 数据准不准确?
3) 数据的实时性如何?
4) 数据与算法的匹配
5) 如何从错误中学习, 数据回流能否起持续优化作用
最后的一个,是这些回流的数据能够改善我们之前的认知。就之前日本料理餐馆的案例而言,消费者的选择就是他们最关键的决策依据,所以可以优先收集这类数据。
而大数据,则是基于企业数据化基础之上的数据整合、算法创新和产品化。比如,谷歌地图之所以能告诉你前面的路堵车,其实是有赖于每个使用谷歌地图的位置分享的实时整合。所以我认为政府的推动,可以让小企业减少得到数据的门槛、增加业界的数据功用,这样就更有利于让小企业也享受到大数据的科技。从产业链来看,小公司联盟,把数据统一,用数据来解决一些业内彼此都不能解决的问题。
中小企业不容易像大公司一样有庞大的数据团队。因此,中小企业在运用数据的时候,一定要有更稳妥的办法,注重使用数据效益,可以尝试从小专案着手,再逐步拓展。
另一个值得注意的是,经营的本质还是取决于创始人的方向与管理,大家不能本末倒置,一味期待透过数据就能解决企业所有的挑战。
数据为什么是割裂的?
最近我遇到一位制造电脑硬件的厂商。他说,内部生产都可以数据化,但发现与销售需求严重割裂,“这些数据似乎内外接不上。”
为什么会出现这样的状况?
我常用的一个比喻是,开餐馆定菜单的往往是餐厅老板,但是每天买菜的是最底层的采购员。所以很少有餐厅能常出名菜,因为厨师没法定菜单,也不能用到适合的好原料。
数据的创新是无时无刻的,算法的创新周期稍长,而产品的创新往往是“十年磨一剑”。也因此,在企业拥有决定权的人,往往是拥有产品决策权的人。如果仅仅站在单一角度去看,很难找到数据和业务的结合点。
根据我的观察,目前非常缺乏一种数据管理人才:他要对业务要有足够的理解,明白数据能为业务起什么作用,了解技术更新与价值产生的关系,懂得从数据收集到加工,到新数据与历史的整合,再到使用数据的便利性等等。其中,对业务和商业的理解,绝对是成为数据主管所需要的基本条件,但若是想达到杰出的程度,肯定要懂得如何在人材匮乏的大数据行业中,吸引和保留住人才的眼光和能力了。
对于业务人员,也可以问问自己:现在拥有的数据能帮我解决问题吗?假定所有数据可以获取,我需要什么数据来解决问题?要怎么做才能更更容易获取需要的数据呢?
举例来说,我过去看到路上的交通状况时曾经想过,大城市里的计程车服务会不会有可能改善?我那时想着,如果计程车上有个灯能显示过去客户对他的评价,那么司机为了保持住好评价,应该会提供更好的服务水准。这就是数据可能解决的一个简单例子。下一步才是如何设计一个容易的方法,让顾客去评价。而现在的叫车软件就是一个很好的实现案例。这是训练数据敏感度的好方法,也是过去十年我个人一直在用的方法——透过周遭事物训练数据敏感度,让数字“说话”。
最难点:在于你对自身的理解
大数据应用讲求跨界和创新,更准确地说,大数据的价值来自可以从多角度来看同一件事,全景观察可以减少误差及创造新的机会。但并不是要求大家能够认知到全部外面的世界,而是能让其他人的数据为你所用。
大数据实践中最困难的地方在于你对自身的理解,再加上,隔行如隔山,外部整合回来的数据可能很有价值但同时也有很多噪音,大家并不完全清楚数据的来源和定义。
如何去看清楚自己呢?根据过去的经验,我认为首先是从小处着手。
传统企业在初期不要贸然就开始一个非常大的大数据项目。数据化比较适合从小而具体,容易评估效果作为起点的专案开始,以此锻炼自己收集、加工、使用数据来做决策,以及衡量这个数据价值的能力,即以小知大。从小的场景开始,用数据在商业场景中不断优化。
Axciom公司的首席数据官程杰曾经提出过“数据的三层境界”:
数据1.0 自身业务产生什么数据,我们用什么数据做分析优化;
数据2.0 将现有数据与自己的历史或上下游数据交叉,由此优化数据;
数据3.0 就是购买外部数据或者将自己的数据分享出去,数据是互溶共通的,在交融中,产生新的产品体验。
这三层境界,都需要企业有不同的技术和架构去实现数据的提炼、加工和产品化、整合。这其实是一个不断用数据来描述和还原企业业务的过程。
最近,阿里数据团队成功地提升了快的打车的打车成功率。我们就叠加了数据的一次使用和二次使用。
我们将实时数据与历史数据整合。原来APP在发送打车需求的时候,是以打车人的地理位置为原点,每过几分钟扩散到附近300米,600米的出租车。这个消息的推送是以地理位置为推送逻辑的。但是假如附近的司机其实并不想去目的地,接单的成功率就会降低。因此,我们把司机“优先目的地”这个数据加入推送系统中,就重新优化了数据,让更愿意接单的司机“可视度”更高了。也因此提高了整体的接单成功率。当然前面所说只是优化的其中一个点子。
在我看来,所有的数据产品都是与决策相关的。也因此,数据优化的应该溯源于人或者机器中分析决策的每个环节,不断更新你的锚点。
打破一个决策,首先要知道人们如何决策,以及有了新数据又如何改变决策。这两者间的区别是什么?会带来什么价值?大决策往往是由一连串的小决策组成的。比如快的打车APP提高效率的关键点,在于如何让司机的数据与用户的数据关联,同时如何不断交叉比对历史数据,找到最高效的匹配。这其中最关键的是如何衡量数据回流的效用,在动态中,找到新的锚点。
如今传统企业已经到了必将需要融入互联网之中的时刻,这个时候实时数据就是你的新数据资料。当中的能力最为关键的是对实时数据的还原、提炼,并为企业所用。这就是一个“数据”持续优化决策的过程——看清楚“你自己”的动态过程。
通用电气CEO杰夫•伊梅尔特曾说:如果昨晚你睡觉时,GE还是一家工业公司,那么今天醒来就会变成一家软件和数据分析公司。
作为传统工业的代表,通用电气都想通了,和人家说,我已经拥有千万级的数据点,传统企业还有什么可犹豫的?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20